毎年11月に横浜で開催される図書館総合展。2020年は、11月1日から30日までの長期間でのオンライン開催となりました。主催者側も初めての経験で、申し込みの仕方も多様、参加者側も戸惑うことの多かった総合展でしたが、これも経験と、幾つか参加しました。今回は、その中の、<2020年から2050年へ、「図書館」(仮称)をリ・デザインする!>と、Library of the Year2020大賞に輝いた<みんなで翻刻>についてお伝えします。
30年後の2050年は、図書館法が制定されてから100年を迎えます。これまでの図書館の歴史を振り返り、2020年にCOVID-19の感染拡大により大きな影響があった図書館が、30年後にどうなっているか。これからの時代の情報・知識のあり方を再設計しようと、Web会議から始まった「図書館」(仮称)リ・デザイン会議(注1)主催のイベントは、13:30から18:30に及ぶ長丁場で、4つのセッションに分けて開催されました。途中退出しているので聴けた範囲だけですが、紹介します。
「図書館」(仮称)は今までどのように機能してきたのかと、(公開用)『図書館』(仮称)年表の説明から始まりました。
年表は取捨選択して作られるから主観が入ります。皆さんの感想には、「アバウトな事項は年表にしづらい」、「改定があったとき何が起きたかなどを書いたほうがよい」などが寄せられました。そして、公文書館や博物館が除外された図書館の年表になっているという指摘もありました。
私たちが歴史を振り返るときも同じことが言えますが、2050年に作った年表が今作ったものと同じではありません。年表は、変化に合わせて内容が変わっているはずです。この年表は、いろいろな人がいろいろな視点で年表を手軽に作れることに意味があり、多くの方が関わって、あらゆる事象を取り込んで、作成し共有したいとのことでした。
次に、2050年の未来年表が登場しました。もちろん私はこの世にいません。2050年には、どんな世界が訪れるのか?「考えたことがdisplayされる」なんて個人の自由とは裏腹の怖い予想には、ちょっと背筋がぞくっとしました。本が受注生産方式になり、司書の職業はなくなっているかもしれません。むしろ司書の要らない世界が理想の世界との話も出ました。もし司書の仕事が残るのであれば、カタロガーに加え、資料情報へのアクセスと対人関係が図書館の機能ではとの議論もあり、学校図書館の司書は、「生徒の知りたいことを引き出すこと、すぐにはAIに代わらない」と自信に満ちた意見も出ました。
途中、セッション2に、「リ・デザインのためのワークショップ」があったのですが、miro(注2)を使ってのワークで、技術についていけずに断念しました。でも、今後はこんなツールが当たり前に使われていく時代になるのですね。
ファクトフルネスって何?と、ここでまずつまずきました。データや事実にもとづき世界を読み解く習慣をいうのだそうです。健康寿命や、子どもや教育に関するデータなどが表示され、データの提供についての分析や解釈の話も出ました。複数のデータを提供するときは、データよりもまず説明部分や凡例の読み込みが重要になるとのことでした。
電気やガスが民営化され、図書館のレファレンスで比較データの要請を耳にすることがあります。水道料金が全国一律ではない比較データが表示され、水道事業の民営化について市民から基本データを比較したいという質問が来たときに提供できれば便利です。レファレンスの延長として「知る」という欲求そのものが中断されかねない中、COVID-19の感染拡大により図書館の状況を随時調査したsaveMLAKの取り組みは、データを作り続けるということの一つのヒントになったとのことでした。
司書の男女別の統計も見せられ、81.6%が女性という司書のジェンダーバランスが示されました。個人情報保護法の影響で、すっかり影が薄くなった電話帳が、50年後にどれだけ活用できるか?との質問に、「没年調査につかえる」という意外な返答がありました。統計は、世の中の流れを把握するのにも使えるのですね。
IFLA(国際図書館連盟)の統計に日本の数字があまりでていないことも問題視されました。IFLAはデータについては慎重な扱いで、順位は出ていません。今後は、SDGs(国連の持続可能な開発のための国際目標)の取り組みについても情報共有が必要になりそうです。
活発な意見が交わされる中、未来から逆算して考えると、目指すべき具体的な「図書館」(仮称)の姿が浮かび上がってくるのでは?という意見が出ました。気になるのは、やはりAI。AIの登場で司書の仕事はなくなるのか?ルーティン業務はAIにとって代わるかもしれないけど、選書やレファレンスのように人間の閃きが解決の大きなポイントとなる業務は司書に軍配? いやいや、選書でも、様々な事情と条件を考慮しながら、AIが候補に選んだものの中から人間が最終決定するなど、AIとの共存の意見も出ました。生きのびるために何ができるかという焦点の話にはならなかったように思います。
長時間に及ぶイベントでしたが、結局モヤモヤ感は避けられず、それでも、こういう時間を共有することに意味があるのかと思いました。私に一番強烈に響いた言葉は、「30年後の戦争のない未来」でした。戦争のない未来を残すために、私たちができることを探していかなければなりません。
気になった方は、「図書館」(仮称)リ・デザイン会議のホームページを参照ください。
翻刻ってご存知ですか?実は、私は知りませんでした。昔の本を原本どおりに活字に組むなどして新たに出版することだそうです。くずし字の「翻刻」とは、古典籍や古文書などに記されたくずし字を読み、現代の文字に変換する作業を指します。
歴史資料の翻刻は、これまで日本史学や国文学分野で訓練を積んだ専門家が、古典籍や古文書の手書き文字を判読(解読)し、現代の文字に置き換えた原稿を作成し、活字を組んで印刷・出版していました。しかし、現代に伝わる歴史資料の数は膨大であり、少数の専門家の手でその全てをカバーすることはできません。<みんなで翻刻(注3)>は、多くの人々が協力して翻刻に参加することで、歴史資料の解読を一挙に推し進めようというプロジェクトです。2017年に歴史地震の研究グループである京都大学古地震研究会によって、地震史料の翻刻プロジェクトとして始まり、今は、一般の人を含めた5000人の人々により600万文字もの史料が翻刻されています。その後、国立歴史民俗博物館、東京大学地震研究所、京都大学古地震研究会を中心に開発が続けられ、2019年7月にリニューアルしました。その活動がLibrary of the Year2020大賞に輝いたというわけです。
古文書を解読するには、「くずし字」の解読能力が必要ですが、<みんなで翻刻>のサイトでは、一文字単位でくずし字の自動認識が可能な2種類のAIによる自動くずし字認識プログラムを搭載しています。PDF化されたテキストに実際にアイコンを当てると、くずし字にたいして候補文字が表示されます。文脈から、「ちょっと違うかな?」と思ったら、もう一つのソフトで確認することも可能です。正確性は高く、パターン認識ってこんなに進んでいるのかと、もうびっくりでした。誰かが編集開始すると,そのコマはロックされて他の人は編集できないようになっています。翻刻対象データは、IIIF(トリプルアイエフ)対応が前提だそうです。IIIF(International Image Interoperability Framework)とは、デジタル画像へのアクセスを標準化し、相互運用性を実現するための国際的なフレームワークなのだそうで、国立国会図書館デジタルコレクションも対応しています。画像のスペックや解像度の縛りはなく、携帯電話の写真でも十分対応できるし、pdfからjpegに変換して編集も可能だそうです。
いきなり翻刻は難しいという方には、くずし字をゲーム感覚で学んでいく、くずし字学習支援アプリ「KuLA」(注4)とも連携しています。KuLAは、2016年に大阪大学を中心に開発された、くずし字解読の学習アプリケーションです。歴史や古文書に関心のある人々を中心に、これまでに12万回以上ダウンロードされ、テスト機能を利用して、学習進捗を確認しながらゲーム感覚で「くずし字」の解読を学べます。変体仮名が読めるようになるなんて、格好いいですよね。
<みんなで翻刻>の入力は、縦書き・ルビ・踊り字など、特殊な日本語表記に対応した、Webブラウザ上で動作するエディター。翻刻の全ての作業は、ブラウザ上で実施できます。
翻刻はしたけれど自信がないときは、添削希望をクリックすると添削してくれる機能もあります。古文書をひとりで解読するのは骨の折れる作業です。ちょっと読める人があらかた翻訳すれば、あとで達人が誤刻箇所や判読不能箇所を修正してくれるのは、ウィキペディアにも似ています。難しい文字や文章に出会ったら、コミュニティ機能を利用して、他の参加者に助けを求めることもできます。初心者から上級者まで至れり尽くせりです。
<みんなで翻訳>のサインインは、Google、Facebook、Twitterのいずれかでおこないます。(というけれど、これが結構戸惑うのです。まずはチャレンジしてみてください)
福井県立文書館・福井県立図書館が運営する「デジタルアーカイブ福井」の史料の翻刻は、福井県立図書館のツイッターがきっかけだったそうです。市民が参加でき、学習アプリとAIの支援もあるということでハードルがぐっと低くなり、プロジェクトの発足に至りました。コレクションの中からくずし字学習に役立つ資料を順次提供していくとのことでした。SNSが図書館の情報発信に一役買う時代なのだなあと思いました。他の利用例では、翻刻文を利用した電子出版もあるそうです。現在公開中の翻刻プロジェクトには、東寺百合文書を含む「みんなで翻刻登録資料(注5)」があります。
歴史資料をデジタル化したけれど、誰からも利用されていない、そんな地方の歴史資料がふっと脳裏をよぎりました。翻刻作業の主要なモチベーションは、「楽しさ」と「教育」。教育や学習をベースに、アーカイブ資料を市民がウィキペディアのように自由に修正ができ、古文書を読める人と図書館で古文書講座コラボなんて面白そうです。初心者向けには学習アプリとAIの支援として、たとえば、「くずし字を読んでみませんか?」のようなワークショップ的な翻刻イベントもいいですね。
本格的におこなう場合は、まずスプレッドシートを作成してプロジェクトを登録します。このときのストーリー作りがプロジェクトの要になるとか。その後、各コレクションに分けて、資料に当たっていくことになります。まだデジタル化していない資料についても相談に乗ってくれるそうです。
<翻刻>で作られた資料は、ウィキペディアと同じクリエイティブコモンズライセンスCC BY-SAのため、誰でも二次使用が可能です。
COVID-19に振り回された2020年は、デジタルアーカイブを将来につなげるターニングポイントになるかもしれません。