火山で黒く焼けた古代ローマの巻物を、AI はどうやって読んだのか？

ヴェスヴィオ火山の噴火で残された炭化パピルス巻物の解読が、AI によってまた一歩進みました。

CNN や The Guardian などの報道によると、研究者たちは高解像度 X 線スキャン、コンピュータビジョン、機械学習を使い、火山の熱で焼け、物理的には開けないヘルクラネウムのパピルス巻物から、さらに多くの文字を読み取りました。この巻物は PHerc 1667 と呼ばれ、古代ローマのヘルクラネウム遺跡から出土した約 2000 年前のものです。

この話がおもしろいのは、「AI が古代文字を読んだ」という点だけではありません。巻物を開かず、表面を削らず、文物を壊さずに、スキャンデータとアルゴリズムだけで丸まった文書をデジタル空間で広げるという、新しい文献修復の道筋を示しているからです。

炭化した PHerc 1667 の巻物、CT 断面、仮想展開された文字までの処理過程

画像出典：Vesuvius Challenge。この図を見ると、研究者が扱っているのは平らな紙ではなく、炭化し、圧縮され、幾層にも巻き込まれた古代パピルスであることがよくわかります。

このパピルス巻物はなぜ特別なのか

西暦 79 年、ヴェスヴィオ火山が噴火し、ポンペイやヘルクラネウムなどの古代都市は火山灰、噴出物、高温の衝撃に埋もれました。ヘルクラネウムには後に Villa of the Papyri、つまり「パピルス荘」と呼ばれる有名な別荘があり、そこから大量の古代巻物が見つかっています。

問題は、これらのパピルスが高温で炭化していることです。見た目は黒い木炭のようで、非常にもろくなっています。過去に無理に広げようとすると、巻物そのものが裂け、文字も失われる危険がありました。

長いあいだ、この巻物群は歴史に封印されたハードディスクのような存在でした。中身は重要かもしれないのに、安全に読むことがほとんどできなかったのです。

AI は何をしたのか

今回の方法は、大きく三つの段階で理解できます。

第一に、研究者は高解像度 X 線で巻物をスキャンし、内部の三次元構造を取得します。パピルスは物理的には開かれていませんが、スキャンによって層と層の空間的な関係が見えるようになります。

第二に、アルゴリズムが「仮想展開」を試みます。巻かれ、押しつぶされ、変形したパピルスの層を、デジタル空間の中でできるだけ平面に近い形へ展開する作業です。

第三に、機械学習モデルがインクの痕跡を識別します。ヘルクラネウムのパピルスでは、インクと炭化した紙草のコントラストが非常に低く、人間の目では判別が困難です。AI モデルは、微細なテクスチャ、密度、形状の変化から、どこに文字がある可能性が高いかを推定します。

これは、鮮明な画像から文字を読む従来型の OCR とは違います。三次元の炭化物の中から、ほとんど見えないインクの痕跡を探し出し、それを読めるテキストとして並べ直す作業に近いものです。

今回は何が読めたのか

報道によれば、研究者たちは PHerc 1667 から約 20 欄のテキストを識別しました。内容はストア派哲学に関係しており、倫理、理性、生き方、古代哲学の議論に関わる可能性があります。

仮想展開された PHerc 1667 の可読テキスト領域

画像出典：Vesuvius Challenge。これは仮想展開された筆写面です。右側ほど文字が密集しており、単語単位ではなく連続したテキストを得ることの重要性がよくわかります。

この成果がすぐに古典学を書き換えるとは限りませんが、現実的な意味は大きいです。

第一に、この方法が「いくつかの単語を読む」段階から「連続した段落を読む」段階へ進みつつあることを示しています。連続したテキストが増えれば、研究者は作者、主題、文体、思想的背景を判断しやすくなります。

第二に、まだ開かれていない他のパピルス巻物にも技術的な道筋を示しています。ヘルクラネウムのパピルスには、まだ読まれていない内容が大量に残っています。この方法がさらに改善されれば、今後より多くの古代テキストが現れるかもしれません。

第三に、学術研究における AI の役割をはっきりさせています。AI は古典学者を置き換えるものではありません。これまで読めなかった資料を、研究できる対象へ変えるための道具です。実際の読解、校訂、年代判定、思想分析には、歴史家、古典学者、パピルス学の専門家が必要です。

Vesuvius Challenge の役割

この進展は Vesuvius Challenge と深く関係しています。このプロジェクトは、ヘルクラネウムのパピルス巻物のスキャンデータを世界中の研究者に公開し、機械学習、コンピュータビジョン、古典学のチームが「開けない巻物をどう読むか」という問題に取り組めるようにしています。

その設計は、現代の AI 研究にとても向いています。問題が明確で、データが実物に基づき、評価目標もはっきりしており、しかも学際性が高いからです。参加者は画像処理だけでなく、パピルスの構造を理解し、古代文字の専門家とも協力する必要があります。

さらに重要なのは、かつては閉じた文物解読の難題だったものを、オープンな競技と共同研究の問題に変えたことです。近年、ヘルクラネウムのパピルス巻物が AI ニュースにたびたび登場する理由もここにあります。

なぜ巻物を直接開かないのか

一般の読者がまず疑問に思うのは、「文字が入っているなら、なぜそのまま開かないのか」という点でしょう。

理由は単純です。もろすぎるからです。

これらの巻物は、火山噴火、高温による炭化、約 2000 年の保存を経て、物理的な構造が非常に不安定になっています。歴史的には一部の巻物を機械的に開こうとした試みもありましたが、大きな損傷を伴いました。現在の研究者は、スキャンとアルゴリズムによる非破壊的な方法を重視しています。

ここに AI とイメージング技術の価値があります。それらは単に「速い」だけではなく、過去には危険すぎてできなかった研究を可能にします。

AI にとって何を意味するのか

この種のプロジェクトは、AI の重要な応用先がチャット画面だけではなく、科学の道具立ての中にもあることを教えてくれます。

ここでの AI は単独で答えを生成しているわけではありません。次のような一連の流れに組み込まれています。

文物保存が制約を与える。
X 線イメージングがデータを提供する。
コンピュータビジョンが三次元構造を処理する。
機械学習モデルがインクの痕跡を識別する。
古典学者がテキストを解釈する。

価値は、単独のモデルが「賢い」ことではなく、協働の中から生まれます。この形は、医用画像、材料科学、天文学、考古学、アーカイブ修復でもますます一般的になるはずです。

慎重さも必要

ただし、この進展を「AI が古代ローマの図書館を完全に読んだ」と誇張するべきではありません。

現時点で読めているのはまだ一部のテキストであり、モデルの判断には専門家による検証が必要です。古代パピルスには文字の欠落、行や列のずれ、不鮮明なインク、文脈の不足があり、最終的な解釈に影響します。文字が読めても、その後に校訂、翻訳、学術的議論が続きます。

より落ち着いた言い方をすれば、AI はこれまでほとんど読めなかった資料を開く手助けをしている、ということです。それは終点ではなく、新しい研究の出発点です。

私の見方

この話で最も惹かれるのは、「AI の話題」を日常ツールから人類の知識そのものへ引き戻しているところです。

これらの巻物がさらに読まれていけば、失われた哲学書、古代の書簡、文学断片、あるいは引用でしか知られていなかった作品が見つかるかもしれません。たとえ一度に数欄しか読めなくても、火山に封じ込められた古代の図書館を少しずつ現在へつなぎ直していることになります。

AI にとっても、これは「また新しいチャットボット」より長期的な意味があります。アルゴリズムが本当に価値を持つのは、人間が触れられず、見えず、読めなかったものを、研究を続けられる材料へ変える場面なのだと示しているからです。