大英図書館が新サービス、British Newspaper Archive を公開しました。読んで字のごとく、新聞データの巨大デジタルアーカイブです。どれくらい巨大かというと、ページ数で言えば300万ページというボリュー ム。OCR されているため、検索もできます。1800年以降に発行された多くの新聞をデータ化したことで、ただ研究者がマイクロフィルムを探さずに古いニュースを読 めるというだけでなく、出生欄や死亡欄から先祖を発見したり、広告などから当時の文化を知るといった使いかたも考えられるところ。もちろんこれほどのイン フラが整えば、頻出語の変遷など、統計的な分析も期待されます。
続きを読む »