2010-11-02

「全文テキスト化実証実験参加協力会社との定例会(第1回)」の記録

国立国会図書館から、10月29日の概要記録を送ってもらいました。
議論の実態が、それなりにわかります。ごらんください。

────────────────────
全文テキスト化実証実験参加協力会社との定例会(第1回)
日 時: 平成22年10月29日(金)10時 ~11時
場 所: 国立国会図書館新館3階研修室
参加者: 参加協力会社29名(26社)、国立国会図書館(以下「NDL」)6名、
株式会社三菱総合研究所3名
※他オブザーバ参加:総務省2名、経済産業省2名
≪概要記録≫
○(資料2-2)電子書籍出力フォーマットについて
・ 全文テキスト化プロトタイプの電子書籍出力フォーマット6種の詳細は?
→(NDL)XMDF、.book、ePUB、透明テキスト付PDF等を想定している。
・ 電子書籍出力表示機能において、館内でiPadやガラパゴス、Kindleなどの利用を想定しているのか?
→(NDL)館内の利用は、基本的には端末での利用を想定している。今回の実証実験は技術検証を目的としたもので、具体的なサービスを想定したものではない。
・ OCRを用いたデジタル画像の全文テキスト化対象の資料も電子書籍フォーマットで出力されるのか?
→(NDL)その想定である。
・ 館内において端末で表示するだけであれば、電子書籍フォーマットでの出力対応は不要と考える。再考いただきたい。
→(NDL)検索以外のサービスは想定していない。ご指摘の点は重要なことであり、プロトタイプ構築の範囲について、ご理解を得られるようあらためて検討させていただきたい。
※ ご指摘の点を踏まえて、再考の結果、当初想定の各種フォーマット(6種類を予定)に対応した電子書籍出力機能は、公共サービスの観点で必要と思われるDAISYでの出力を除き、取りやめることといたします。
○(資料2-2)共同校正及び共同構造化作業について
・ 文字認識率の目標数値は?
→(NDL)実証実験ではバラエティに富んだ資料を対象にしているので、どの程度の認識精度になるか明らかにしていきたい。
・ 共同校正、共同構造化に出版社は関与するのか?
→(NDL)ボランティア団体等を想定したもので、出版社の関与は想定していない。
・ 校正システムにおける校正のレベルは?校正を反映した辞書の扱いは?
→(NDL)校正はできるだけ簡単な方法で行うことを目的としている。OCRの機能の活用、修正結果の学習を想定している。辞書はNDLに納品される。
○(資料1)全文テキスト化プロトの対象
・ 出版社提供データ300件(10/29時点)の内容、ジャンルについて教えてほしい。
→(NDL)出版社の要望もあり、すべてのタイトル等を明示できないが、ジャンル等の概要については、とりまとめて、次回定例会(11月)でお示ししたい。