電子辞書や電子書籍向けの全文検索技術を開発することで電子出版を推進します

2012.02.01

富士通  片岡 正弘

 富士通の片岡です。全文検索エンジンの開発を担当しています。1992年にEPWINGコンソーシアムの設立を契機に電子出版関連の技術開発に従事するようになり、約20年が経過しました。
 1986年に㈱岩波書店、大日本印刷㈱、ソニー㈱、富士通㈱の4社が電子出版として広辞苑第三版CD-ROM版を試作しました。これをもとに、電子出版のための共通フォーマットを制定するために、EPWINGコンソーシアムが設立され、1997年に、JIS X-4081として登録されました。
 1995年には、FMVに広辞苑が標準搭載され、現在のオールインワンPCの先駆けとして、電子出版を牽引しました。1990年代末期に専用機の電子辞書が発売され、2000年代に後半には、年間約200~300万台の市場に成長しました。また、2000年代にインターネットが急速に普及し、Googleに象徴されるように、Webサーバーによる全文検索が主流となりました。
 これに対し、2008年12月に組込み機器での全文検索を可能としたONESWINGをFMVに実装しました。EPWINGの圧縮技術を発展させ、圧縮形式のままでの照合することにより、広辞苑を約1秒で全文検索することに成功しました。また、2010年に携帯電話に、2011年にスマートフォンに、広辞苑やリーダーズ英和辞典を中心とした本格電子辞書を搭載し出荷しました。このように、電子辞書の市場では、大きな成果を達成することができました。
 一方、2000年代後半に、欧米で電子書籍端末が発売され、日本では2010年にiPadが発売され、電子書籍元年と呼ばれ、XMDFや.bookやEPUB等の電子書籍フォーマットが提案されています。実は、これまで培った全文検索技術をもとに、電子書籍への応用を検討していますが、電子書籍に採用されているZIPなどの圧縮技術とDRM認証技術が全文検索性能を著しく劣化させることが原因で、技術開発が難航しています。現在、小説や新聞や雑誌などを中心に電子書籍化が進められているため、全文検索はあまり重視されていませんが、今後、実用書、教科書、専門書などに市場が拡充すると、全文検索のの機能や性能の問題が顕在化すると考えています。
 従って、近い将来に発生する、電子書籍の高速な全文検索技術のニーズにお答えできるように、例えば、ZIPの圧縮率相当で部分伸長できる圧縮方式の実現など、圧縮と認証技術の改良に関する技術開発に注力し、電子出版を推進していきます。