キーパーソン・メッセージ

2020.01.06

AIの品質を確保するためのデータ基盤、データ契約モデルを探る

日本マイクロソフト 田丸 健三郎

 2019年は実に様々なスタートアップ、企業、公的機関がAI分野に更なる研究投資を行った。その中でも2016年に設立された杉山将先生が率いる革新知能統合研究センター(理化学研究所)は、基盤研究から社会問題の解決まで様々な分野に取り組み、成果を上げている組織の一つと言える。

 杉山先生をはじめとする研究者の多くが挙げる課題に人材とデータの不足がある。人材については既に多くの媒体が取り上げ初等教育から大学教育に至る様々な問題が指摘されている。理工系学生の比率が5割を超える米国に対し、日本は約2割となっている中で、容易にはAI人材を増やすことが出来ない構造的な問題も1つではなかろうか。

 データも問題だ。個人情報保護法による国民の個人情報に対する意識の高まりと反比例するように、日本国内ではデータの収集が難しくなっている。AIはアルゴリズムだけでは何も実現することが出来ない。データによる学習があって始めてその形を成すことが出来る。(アルゴリズム、学習モデルなどの技術的詳細は本稿では触れない。)

 また、AIの品質は、アルゴリズムは当然のことながら、学習に用いるデータの品質に大きく左右される。音声認識のAIもより多くの音声データを収集し、学習させることによりその品質を向上することが可能となる。国の研究機関、AIベンダーも、音声データの収集には苦労しており、比例して高齢者、方言に対する音声認識精度は一向に向上しない。高齢化や人手不足に直面し、AIへの期待が高い領域ほどデータが無い状況となっている。

2019.12.02

「元年」から10年、電子書籍はまだちょっと残念なところもあるけれど

JTBパブリッシング  井野口 正之

 2019年も残すところあと1ヶ月。このところ言葉として聞く機会も少なくなってしまったけれど、「電子書籍元年」が2010年だったとすれば、今年、令和元年は電子書籍暦(?)10年だったのですね。

 元年から10年経って、これまで自分が購入してきた電子書籍が書店別にどんな割合になっているのかと、ふと思って、書店別の冊数を数えてみると、とりあえず上位10社でざっとこんな感じでした。

 合冊版を1タイトルに数えていたり、雑誌のサブスクリプションは含まなかったり等々あるので、あくまで大まかなイメージですが、上位3社でちょうど75%(まあ、想像していた通り「A社」はA社でしたが)。とはいえ、やはり結構バラけています。各書店それぞれのキャンペーンやクーポンなどの特典はもちろん、「このジャンル、この作家はこのアプリの書棚に揃えたい」的な好みや、見みたい本を見つけたタイミング、その場の勢い?等々の理由で、買う場所はどうしても複数にまたがってきます。

  • 電子出版アワード
  • 図書館館外貸出可否識別マーク