人文社会系研究

図書の電子化に期待すること―【連載】図書館情報学最先端

2017.07.12

図書の電子化に期待すること―【連載】図書館情報学最先端

トランプ大統領と科学コミュニティの対応

小山先生

2017年4月27日、米国トランプ大統領が就任から100日を迎えた。この間の彼の言動、行動は、さまざまな話題を集めているが、その影響は学術界にも大きく及んでいる。その一つが3月16日に発表された2018年度予算教書である。

この予算教書によれば、米国衛生研究所(NIH)や米国エネルギー省(DOE)、アメリカ航空宇宙局(NASA)など、米国の科学研究を推進する機関の予算が大幅に削減されたり、プロジェクト等が廃止されたりすることが提案されている。このなかには、前回のコラムでも触れた全米芸術基金(NEA)や全米人文科学基金(NEH)に加え、博物館・図書館サービス機構(IMLS)の廃止も含まれる。図書館が提供する情報の源であった科学研究だけでなく、図書館活動そのものにも大きな影を落としている。これに対して、アメリカ図書館協会は予算教書が公表された3月16日当日に、IMLSの廃止は「非生産的で短絡的」であるとの声明を発表している1)

また、4月22日にはMarch For Scienceと呼ばれるデモが世界各地で行われた。科学研究に対するトランプ大統領の姿勢を問うべく、世界中の科学者が声を上げたのである。March For Scienceのウェブサイトによれば、この活動は科学を公共の利益(common good)とすべく、政策立案における科学の役割の強化、科学に関するアウトリーチ活動やコミュニケーションの改善、科学教育や科学リテラシーの促進、そして多様で包括的な科学コミュニティの育成の四つの目標を掲げている2)。単なるトランプ政権に対する抗議活動に終わらず、科学者や科学界が抱える現代的なテーマの実践を目指している点が注目される。国内でも、科学者の軍事技術研究に対する姿勢が問われている昨今、March For Scienceのような動きにも目を留めたい。

人文学公開図書プログラム(Humanities Open Book Program)

さて、NEHの廃止は、図書館およびその他関係者にとって影響力の大きいニュースであると前回のコラムで指摘し、その事例として「人文学公開図書プログラム(Humanities Open Book Program)」を挙げた。これは、絶版となった人文学分野の学術図書を電子化し、無料でインターネットで公開することで、教員や研究者、学生、一般の人々の利用に供することを目的とした補助金プログラムである3)。2015年12月に発表された第一回目の採択結果では、コーネル大学をはじめ、10機関からの申請が採択された4)。これにより、人文学関係の学術図書500タイトル以上が電子化されることになる。また、2017年4月に公表された第二回採択結果によれば、ハワイ大学など8機関による420タイトル前後の電子化計画が認められた5)

このプログラムでは、図書の電子化にあたって求められる技術要件として、EPUB3.0.1あるいはそれ以降の形式とすることが挙げられている。テキストが検索でき、かつフォントサイズが変更できるなど、どのようなデバイスであっても対応できるフォーマットが求められたのである。

テキストを電子化するということ

ここで、筆者は一つの疑問を抱いた。EPUBを用いて、どのような電子書籍を目指すのかと。周知のとおり、EPUBは国際電子出版フォーラム(IPDF)が策定する電子書籍ファイルフォーマットの一つで、多くの電子書籍で用いられる国際的な規格である。一方、このプログラムが電子化の対象としている図書は、学術図書である。このような図書を電子化するにあたって、単に電子書籍専用端末やタブレットPC、スマートフォンなど、多様なデバイスで読めればそれでよいのであろうか。そこから多様な「読み」を、さらに言えば「発見」を導くのであれば、より精緻に構造化されたテキストを創造する、野心的な電子化を目指すことも考えられるのではないだろうか。

クリスティン・L・ボーグマン(Christine L. Borgman)の著書Big Data, Little Data, No Dataによれば、人文学では、1980年代半ばからテキストの構造化への取り組みが始まっているという6)。TEI(Text Encoding Initiative)と呼ばれるその活動は、人文学の研究対象である資料の電子化にあたって、いわゆるプレーンテキストではなく、テキストを構造化し、文字列に意味を与えたり、注釈を加えたりすることで、より的確な検索やより多角的な学術探究の実現を目指している7)

たとえば、フランスの首都としてのパリ(Paris)とギリシャ神話に登場するパリス(Paris)は、同じ文字列であるが、二つは異なる意味を有する。そこで前者には地名というタグを、後者には人名というタグを与えることで、二つを区別できる8)。的確な検索を追求するには、テキストの電子化だけでなく、構造化されたテキストが必要であることの証左の一つといえる。

電子化されるテキストが構造化され、よりリッチになれば、他の電子情報資源と繋がる可能性が広がる。いわゆるリンクトデータ(Linked Data)である。図書という、これまでタイトルごとに閉じられた世界にあった個々の情報が、有意義な目印を付けられることによって、別の世界に存在していた同一の情報と繋がり、あらたな「発見」や「読み」を生み出すことができる。EPUBにはそれを実現できるしくみが備わっている。電子化という手段の効果を最大限に生かす意味でも、重要な論点の一つである9)

図書の電子化のその先へ

さて、国内に目を転じても、図書の電子化を促す環境が進展してきている。たとえば2017年2月、文化庁は電子書籍など著作物の全文検索に関して、権利制限を設ける方向で著作権法の改訂をすすめる方針を固めた10)。また、著作権者不明の著作物、いわゆるオーファンワークスの利用に関する裁定制度の運用が改善されたり(2014年8月)11)、権利者捜索の要件も緩和されたりした(2016年2月)12)。加えて、日本文藝家協会をはじめとする著作権権利関係9団体によるオーファンワークス実証事業(文化庁委託事業)も行われている13)。環境整備はもちろんのこと、図書電子化にかかる政策や制度の充実、さらに柔軟な利用を視野に入れた技術開発とその適用にも期待したい。

今回のコラムで取り上げたNEHの人文学公開図書プログラムは、NEH創設50周年を記念して設けられたイニシアティブ「公共の利益:公共広場における人文学(The Common Good: The Humanities in the Public Square)」の一つであった14)。また、March for Scienceで掲げられたテーマも公共の利益(common good)である。学問分野を問わず、科学の目指すべき方向をあらためて再確認できた思いである。

(中央大学 文学部 教授 小山憲司)

注・引用文献

1) “President’s budget proposal to eliminate federal library funding ‘counterproductive and short-sighted’.” American Library Association. 2017-03-16. http://www.ala.org/news/press-releases/2017/03/president-s-budget-proposal-eliminate-federal-library-funding, (accessed 2017-05-05).

2) “March For Science,” March For Science. https://satellites.marchforscience.com, (accessed 2017-05-05).

3) “Humanities Open Book: Unlocking Great Books.” National Endowment of the Humanities. 2015-01-15. https://www.neh.gov/news/press-release/2015-01-15/humanities-open-book, (accessed 2017-05-05).

4) “The National Endowment for the Humanities and The Andrew W. Mellon Foundation Announce New Grants to Bring Back Essential Out-of-Print Books.” National Endowment of the Humanities. 2015-12-17. https://www.neh.gov/news/press-release/2015-12-17, (accessed 2017-05-05).

5) “National Endowment for the Humanities and The Andrew W. Mellon Foundation Announce Grants to Make Books Available to Public Audiences.” National Endowment of the Humanities. 2017-04-05. https://www.neh.gov/news/press-release/2017-04-05, (accessed 2017-05-05).

6) Borgman, Christine L. Big Data, Little Data, No Data: Scholarship in the Networked World. Cambridge, Mass.: MIT Press, 2015, p. 169-170. (佐藤義則, 小山憲司訳. (2017年8月刊行予定) 『ビッグデータ・リトルデータ・ノーデータ―研究データと知識インフラ』勁草書房.)

7) TEIをはじめ、デジタル人文学の状況については次の文献を参照。永崎研宣. 大学図書館とデジタル人文学. 大学図書館研究. 2016, no. 104, p. 1-10. ; 永崎研宣. デジタル文化資料の国際化に向けて : IIIFとTEI. 情報の科学と技術. 2017, vol. 67, no. 2, p. 61-66.

8) Borgman, op. cit., p. 170.

9) ただし、テキストの構造化には人的、金銭的、時間的コストがかかる。そこで、個々の図書のプレーンテキストなどをまとめてビッグデータとして扱い、それを人工知能によって解析するという手法も考えられるかもしれない。

10) 赤田康和, 藤井裕介. 書籍を電子化→全文検索サービス、著作権者の許諾不要に 文化庁、法改正へ. 朝日新聞. 2017年2月11日(朝刊), 3面.

11) “権利者不明等の場合の裁定制度の見直しについて.” 文化庁. http://www.bunka.go.jp/seisaku/chosakuken/seidokaisetsu/chosakukensha_fumei/pdf/minaoshi.pdf, (accessed 2017-05-05).

12) “著作権不明等の場合の裁定制度が使いやすくなりました.” 文化庁. http://www.bunka.go.jp/seisaku/chosakuken/seidokaisetsu/chosakukensha_fumei/pdf/kanwa.pdf, (accessed 2017-05-05).

13) “著作権者不明等の場合の裁定制度の利用円滑化に向けた実証事業.” オーファンワークス実証事業実行委員会. https://jrrc.or.jp/orphanworks/, (accessed 2017-05-05).

14) “The Common Good: The Humanities in the Public Square.” National Endowment of the Humanities. https://www.neh.gov/commongood, (accessed 2017-05-05).

※2017年5月寄稿