2024年7月26日、熊本大学とTOPPAN株式会社から「くずし字AI-OCRを活用した古文書の大規模調査のための独自手法を開発」というプレスリリースが出されました。寄託を受けている「細川家文書」のうち、専門家でも解読が困難な難易度の高いくずし字で書かれた約5万枚の未解読の古文書(藩政記録)をAI-OCR を用いて短期間で解読し、約950 万文字のテキストデータを生成することに成功したという内容でした。これらの中には、いままでよく知られていなかった17世紀後期の気象災害の記録などもあり、今後の防災に活用するための研究を進めていくということです。
AIが切り開く科学の未来
また、『ナショナル ジオグラフィック日本版 2024年11月号』では、“AIが切り開く科学の未来”という特集の中で、「どのようにAIは古文書を開かずに読み解くのか?」という記事が掲載され、開ければぼろぼろに崩れてしまうため、解読不応とされていた古代ローマの巻物の内容を読み取る新しい技術が開発されたという記事が掲載されました。概要ですが、対象は西暦79年に古代ローマのベスビオ火山の噴火で埋もれた多数のパピルスの巻物で、炭化しており、手で開くとぼろぼろになってしまい中身は永久に失われてしまうものを解読できたという内容した。コンピューター断層撮影(CT)を使って丸まった巻物をスキャンすることで、巻物をバーチャル上で平面化したり、高度なAIによりページ上のインクを探知したりすることが可能になったことで、解読することができるようになったとのことです。解読したテキストから著者はエピクロス派の哲学者ピロデモスではないかと推測されているとのことです。
AI技術の利点と課題
簡略化していうと、上記の事例は、AIを活用することによって、前者はこれまで未解読だった資料、専門家しか解読することができなかった資料を短時間で解読、データ化し検索等ができるようにした、後者は、これまで物理的に存在していても内容を把握することができなかった”モノ"について、その内容を把握・理解することができるようにしたということができそうです。いずれもこれまで知りえなかった情報ですし、データ化することによって新しい発見があるかもしれないため、ワクワクしますね。
AI技術の課題と未来への期待
新しい技術であるAIは生成AIの信頼性、著作権をどのように扱うか、水や消費電力などのエネルギー・環境への負荷など多くの課題があることもわかっています。新しい技術についは、何でも同じでありますが、使う側が長所と短所を把握して、適切な範囲で利用すること、技術の暴走を防ぐことが必要だと思います。AIの可能性は計り知れないため、開発や運用のガイドラインや監視、検証、必要に応じて制御できる仕組みなどが必要ではないかと感じています。(K.T)
これまで掲載したコラム
年代をクリックすると過去の掲載分が一覧で表示されます。
▼
|
▼
|
▼
|
▼
|
▼
|
>> 戻る