辞書コンテンツのデジタル化と標準化

2014.04.01

ディジタルアシスト  永田 健児

 昨年(2013年)、JEPAとして近代科学資料館に電子辞書・電子書籍端末を寄贈するという活動があり、これに連動して9月10日にはプラットフォーム委員会とレファレンス委員会との共催で「むかしの読書端末、電子辞書大集合」というイベントが開かれました。昨年はさらに、“電子出版検定”の創設準備の一環として、レファレンス委員会で小冊子「電子辞書の世界」の原稿執筆・編集作業を進めました。1980年代に芽吹いた“電子辞書”の歴史を振り返り、整理する1年だったわけです。回顧があれば展望も必要。このタイミングでキーパーソン・メッセージの原稿依頼が舞い込んだのも偶然ではないと思います。事務局の策略恐るべし。
 さて、上記のイベント・編集作業をお手伝いさせていただきながら感じたのが、電子辞書という商品・サービスが、常にユーザにとって必要とされ、一定の市場を保ち続けてきたのだなぁ、という事実。80年代の電卓辞書とCD-ROM辞書、90年代の電子ブック、00年代の専用端末・ネットサービス、そして現在のスマホアプリ…と、デバイスもユーザインタフェースも時代に合わせて進歩・展開を続けているのだけれど、確認の要と知的好奇心を満たすため、デジタルとしてのレファレンスツールは存在し続けてきたのだな、と。
 こういった状況を支えてきたのは、辞書コンテンツが早い段階からデジタルデータとして整備されてきたからであることは疑問の余地がありません。他のデジタルコンテンツも同様なれど、とりわけ辞書・事典類は“ワンソース・マルチユース”の期待度が高いこともあり、“標準フォーマット”の必要性が強く意識されて、デジタルデータ整備が進められてきました。そしてその結果、日本では世界でも類を見ないほどの、辞書XMLデータの集積とノウハウの蓄積が実現しているのです(たぶん)。これらの資産をうまく活かして、さらなるビジネスの発展に結びつけなければいけません。辞書XMLのガラパゴス化とか言われないように。
 そのために、第一歩。レファレンス委員会でかねてより検討課題としているテーマですが、デジタル辞書利用にあたっての“お約束”の確認と整理が必要です。特に90年代、CD-ROM辞書全盛のころは、利用環境もユーザも限定的で、作り手側と利用者の間で検索のための“約束事”が共通理解として存在していました。原形・終止形で調べるといった当たり前のことから、日本語特有の事情に基づく検索語の正規化まで、いろいろあります。ところが、ネットサービスやスマホアプリが増えてきたころから、この“約束事”が崩れてきたような印象を持っています。個々のサービス・アプリでは使いやすいのかもしれませんが、結果としてユーザに混乱を与えているような気もします。システム側で吸収できることは対応し、ユーザにも一定の利用基準を理解してもらう。理想的なバランスを求めて、“お約束”についての提言をまとめたいと考えています。
 第二歩は今年度のレファレンス委員会の主要検討テーマです。タブレットや電子書籍端末などで“表示されている文字列をタップして検索”という利用シーンが急激に増えていますが、基本的には上述した“お約束”にお構いなく検索が実行されています。皆さん、このような場面での検索結果に満足していますか?(「いーえ」とご唱和ください)。システム側もデータ側もこのような利用法にまだまだ充分に対応できていないのが現実。この問題、以前から存在してはいたのですが、デジタル学習教材が本格的に動き始めて、対応の要は急速に高まっています。児童生徒は最初からタブレットでタッチで検索なのです。オトナの事情も過去の約束事も関係ないのです。タブレット教材でのレファレンスツール連携について、早急に問題点をまとめなければいけません。
 まだまだあります、第三歩……と行きたいところですが、実務も多くて今年度はこれくらいで手一杯になりそうです。2012年にJEITA(社団法人電子情報技術産業協会)とのリエゾンで国際標準として発効した辞書交換フォーマット「IEC 62605 ed1.0 : Multimedia systems and equipment - Multimedia e-publishing and e-books - Interchange format for e-dictionaries」の更新改訂を今年中に進めなければいけません。また、EPUBの辞書拡張についてもドラフトが出てきました。こちらの読み込み、対応検討も必要そうです。
 2001年の起業以来、辞書・事典類のデジタル化を推奨・提案してきた弊社ディジタルアシストとしても、何かと忙しい1年になりそうです。興味深いのが、XML化したデジタルデータの版下作成のお仕事が最近増えてきていること。外部提供も可能なデジタルデータと組版データの一元化は確かに理想形のひとつ。これが紙への回帰なのか、次のフェーズへの発展なのか、それぞれの仕事を全うしながら一歩一歩、前に進んで行きたいと考えています。