アーカイブ専門家、手書き文書解読に大規模言語モデルを活用
Archivists Turn to LLMs to Decipher Handwriting at Scale
記事のポイント
📰ニュース
アーカイブ専門家が、手書き文書の解読に大規模言語モデル(LLM)を導入し、その有効性を実証しました。
🔍注目ポイント
LLMは、多様な手書き文字を高速かつ高精度に解読し、従来の専門ソフトウェアを上回る性能を示しました。
🔮これからどうなる
これまでアクセス困難だった歴史的文書が検索可能になり、研究者や一般の人々が新たな知見を得る機会が拡大します。
歴史学者が第一次世界大戦の年金記録1000万ページをデジタル化する際、手書き文字の多様性に直面しました。
GPT-4の登場後、LLMを試したところ、従来の専門ソフトウェアよりも優れた結果が得られました。
18世紀から19世紀の英語文書50点を用いた体系的なテストで、LLMは既存の専門ソフトウェアTranskribusを精度、速度、コストで凌駕しました。
GPT-4の登場後、LLMを試したところ、従来の専門ソフトウェアよりも優れた結果が得られました。
18世紀から19世紀の英語文書50点を用いた体系的なテストで、LLMは既存の専門ソフトウェアTranskribusを精度、速度、コストで凌駕しました。
概要
When I sat down with bell hooks’ personal journals at an archive at Berea College in Kentucky, I expected an intimate peek into her private thoughts, her voice before the editing. What I got instead was frustration. Her handwriting was dense cursive, all loops that looked identical to my eye, and t…
手書き文書のデジタル化と検索は、歴史研究や家系調査に革命をもたらしそうです。個人的な日記や古い手紙も、AIで簡単に読めるようになるかもしれませんね。