2010-02-22

日本語の本の全文検索→一部表示サーバーをインターネット上につくる(仮称=ジャパニーズ・ブックダム)

何度か「ジャパニーズ・ブックダム」という計画をやりたい、と表明していたので、
その具体的なことをできるだけ整理してみました。
また、参考にマガジン航の「ジャパニーズ・ブックダムの夢」もどうぞ。

──────────────────────────────
ジャパニーズ・ブックダム計画は、日本で、日本語(ジャパニーズ)の本(将来は雑誌や電子書籍も)のインターネット上での全文検索を可能にし、検索されたページ=本の一部表示をするサーバー設置を、国立国会図書館と出版社の共同の取組みで実現しようというものです。

国立国会図書館長尾真館長が、いわゆる「長尾プラン」を発表して、本を生業にしている出版業界、書店、取次、図書館、をはじめネットワークでさまざまな発言している人たちの間でも話題になりました。
この構想は、国立国会図書館が、日本全国さまざまな地域に住む人たちに、ひとしく資料へのアクセスを提供するために、書籍を電子化し、利用者からの料金徴収をおこなうというものでした。

今日大きな話題になっている電子書籍の普及は、kindleやiPadを始めとした電子書籍端末と、端末で読むことのできる読み物(=書籍/コンテンツ)の提供という、二つのバランスによって大きく左右されると思います。
kindleやiPadが騒がれていますが、日本ではまだ「実験」や「挑戦」の状態のようです。

ただし、この電子書籍は、デジタル/ネットワークがますます拡大し定着している中で、いずれ普及するのは間違いないと思います。
そこで、それを活用した新たな出版状況、書籍の世界を豊かにする取組みを、できるところから進めたいと思います。

出版社の積極的な取組みで、本の全文検索→一部表示のデータベースサイト=「ジャパニーズ・ブックダム」の実現をその第一歩としたいと考えました。。

●ジャパニーズ・ブックダムとは何か

・インターネット上のデータベースサーバとして
・日本語で書かれた書籍の
・ページスキャン画像からOCRでテキストにしたものから
・「言葉」による全文を対象にした検索を提供し
・スキャン画像の一定ページ部分を表示させるものです。
そして、ここで一部表示させる書籍は、
・このジャパニーズ・ブックダム計画に賛同する出版社一社一社が
・著作権者の了解を得て、提供する
ものです。

●国立国会図書館の保存のためのデジタル化(画像スキャン)との関係

現在、国立国会図書館がすすめているのは、発行年の古いものからスキャニングして画像を保存し、国立国会図書館内での閲覧に画像表示を提供するというものです。

OCRでのテキスト化は出版社代表を含む関係者協議会との合意として、行なわないとしています。
しかし、国会図書館内での閲覧のためにデジタル化された書籍を探す時も、全文検索どころか、タイトルやせいぜい目次データ程度しか検索することができません。そうして「探し出した」書籍も、テキストデータを含まないため画像のファイルを1ページずつ目で見て、必要箇所があるかどうかを探さねばなりません。
館内閲覧は、利用者・研究者にとっての利便向上どころか、むしろ後退だと見られてしまいそうです。

さらには、既にGoogleの全文検索(Googleブックサーチ)が実現しているなかで、館内での閲覧にとどまっていては、読者から見て歯がゆいだけではないでしょうか?
むしろ、今、出版社自身が書籍の全文検索→一部表示に前向きに取組み、検索の利便性を高め書籍へのアクセスを豊富にし本の世界そのものを豊かにする、それがひいては出版の未来につなげていけるのではないでしょうか?
出版の未来の可能性とすることができるのではないでしょうか?

●長尾プランとの関係

2008年、国立国会図書館の長尾真館長が、いわゆる「長尾プラン」を発表しました。
長尾プランは、電子化した本を、図書館を経由してさまざまな地域に住む人々に、ネットワークから一定の利用料を徴収して提供しようというものです。

長尾プランの画期的な意義は、出版社の商業活動の成果物である書籍の利用に、図書館が利用料徴収を打ち出した点です。
これまで、図書館は「無料の原則」により、利用者からの費用徴収にほとんど対応していませんでした。
長尾プランは「無料の原則」から一歩踏み出し、単なるサービスの有料化ではなく、極めて高度なサービスに限って費用徴収する可能性を示しました。

出版社は、商業活動を通して、日本の知的なインフラづくりの一部を担ってきたといえます。そういう意味では、出版社の商業活動もまた公共的性格を合わせ持つと言えるでしょう。
長尾プランは、こうした出版の公共的な側面をふまえたうえで、図書館界が出版界と協同して、知的インフラを支えることに取り組もうとするものだと言うことができます。

一方、電子書籍の行く末の不確定さや、コンテンツを生み出すための費用のあり方、あるいはそうした費用をどの程度一般の読者に負担してもらうのかという見通しは不鮮明な状況です。
さらに「図書館経由で書籍をすべて読めるようにする際の費用金額」の確定や、そのルール作り、組織づくりは今すぐに実現できるものではありません。
費用を徴収したものの、それでそもそも徴収のための費用をまかなえるのか? まだまだ手探りで検討していかなければならないことが山積みだと思います。

したがって、長尾プランの画期的な意義を了解したうえで、まず、本の全文検索→一部のページ画像の表示からはじめ、国立国会図書館との前向きな協議、電子書籍市場の動向をふまえた取組みを、同時に進めていくことが有効だと考えます。

●日本の知的なインフラ、と経済発展

日本経済は、金融危機から始まった世界的な不況のただ中にいます。
環境産業の育成など、いくつかのアイデアが提出されていますが、どのようなアイデアもその発展の基礎は、全国民の知的水準の向上です。
その点で、書籍と読書が子供から大人に果たす役割はとても大きなものだと思います。
子供に学校や図書館や書店を通じて、読書習慣のための基本条件を提供すること、大人にも書店や図書館を通じて、常にさまざまな選択肢に耐える書籍が提供されることが、今後の日本の産業の発展に欠くことのできない基礎をきずきます。

そしてこの書籍を提供する一翼を担っているのが出版界です。
こうした意義をもつ出版界が、図書館などと協同して、書籍の世界を豊かにすることは、出版界の利益にかなうばかりでなく、日本経済、ひいては日本の発展に寄与するものです。

●補足──1 ジャパニーズ・ブックダム計画を出版社として推進する理由

出版業界は、これまでも電子書籍に取組んできました。
2000年の電子書籍実証実験をはじめ、各社で、あるいは複数の出版社の協同の事業としてさまざまな取組みがありました。

しかし、電子書籍が大きな話題になる現在、出版界は「ネット社会の発展」に竿を差す抵抗する、コンサバなものだと思われていないでしょうか?
もちろんこのような世論は、われわれ出版社の責任も大きいと思います。
したがって、ここでもう一度ネットワーク社会の発展に寄与する大胆な取組みが必要ではないかと思うのです。

さらに、次のような可能性も生まれるでしょう。
・検索システムのAPI提供することによる、個人/法人による独自のサービスの発展
・全文検索→一部表示サービスによる、書籍利用・購入の促進
・このシステム構築により、著作権者データベースの整備を必然となり、その準備が始まる
・著作権者データベースが、著作物の一部・全部の有料利用を機会を増やす可能性
著作物は、より多く・長く、利用され・利用しあうことで生かされるものだと思います。
利用の制限よりも、利用の対価を適切に交換することで、もっともっと利用されるようにすべきです。
そのためには、著作権者の正確な把握、徴収システム、著作権者の意思にもとづいた出版社の協力、などを整備しなければなりません。
このジャパニーズ・ブックダムの取組みは、こうした体制作りの第一歩になりえると思います。
・国立国会図書館のスキャニング画像/OCRを利用した、絶版本などの復刊や、電子書籍化の可能性

●補足──2 ジャパニーズ・ブックダム計画をめぐるいくつかの考え

データの提供は、既刊本のすべてを出発の条件にしなくても良いと思います。
たとえば、
・今後あらたに発行する際に、著作権者の了解をえて提供することから始める。「すべて」にこだわって提供時期を先延ばしにするのではなく、まず提供してから、拡充に取組むのも一つの方法です
・著作権者の意思を尊重して、まず提供意思のある著作権者のものから公開していくことも一つの方法です
・このデータベースを利用した、個人・法人などさまざまな人々の独自サービスが行われるような公開性・オープン性に留意したいと思ってます。

(文責・沢辺均/ver.1.1/20100218)