キーパーソン・メッセージ

2020.02.03

電子出版への多様なアプローチと利用可能性をサポートする活動を

JEPA顧問 三瓶 徹

 日経によれば、米アップルのティム・クックCEOが、注目する分野として、現実の光景にデジタル情報を重ねて示す拡張現実(AR)を挙げ、「次のコンピュータープラットフォームになる」と述べた。モバイルネットワーク5Gの進展と同期し、情報伝達系、エンタメ系、教育系ではARという新しいメディアが花盛りになろうというのが巷の予測で、電子雑誌では、ARが当たり前になるかもしれませんね。
 紙の代替としてCD-ROM電子出版が始まってから30年、電子書籍が始まって10年になります。インプレス総合研究所によると電子書籍は3000億円を超える売り上げとなっており、特にマンガを売り上げる大手出版社の決算は大変良好です。それでも出版界には電子出版に踏み込まない出版社が沢山おられます。
 本には学術系、情報伝達系、リファレンス系、エンタメ系の分類のほか、評価軸を変えると、沢山売りたい本、限られた読者を対象にした本、図書館を対象にした本、面白い本、読むのが苦痛な本など、色々な種類があります。著作権の重さも、ビジネスモデルも違います。電子出版でやる場合も、ビジネスモデルも千差万別にならざるを得ません。電子出版に踏み込めなかった理由も千差万別でしょう。

2020.01.06

AIの品質を確保するためのデータ基盤、データ契約モデルを探る

日本マイクロソフト 田丸 健三郎

 2019年は実に様々なスタートアップ、企業、公的機関がAI分野に更なる研究投資を行った。その中でも2016年に設立された杉山将先生が率いる革新知能統合研究センター(理化学研究所)は、基盤研究から社会問題の解決まで様々な分野に取り組み、成果を上げている組織の一つと言える。

 杉山先生をはじめとする研究者の多くが挙げる課題に人材とデータの不足がある。人材については既に多くの媒体が取り上げ初等教育から大学教育に至る様々な問題が指摘されている。理工系学生の比率が5割を超える米国に対し、日本は約2割となっている中で、容易にはAI人材を増やすことが出来ない構造的な問題も1つではなかろうか。

 データも問題だ。個人情報保護法による国民の個人情報に対する意識の高まりと反比例するように、日本国内ではデータの収集が難しくなっている。AIはアルゴリズムだけでは何も実現することが出来ない。データによる学習があって始めてその形を成すことが出来る。(アルゴリズム、学習モデルなどの技術的詳細は本稿では触れない。)

 また、AIの品質は、アルゴリズムは当然のことながら、学習に用いるデータの品質に大きく左右される。音声認識のAIもより多くの音声データを収集し、学習させることによりその品質を向上することが可能となる。国の研究機関、AIベンダーも、音声データの収集には苦労しており、比例して高齢者、方言に対する音声認識精度は一向に向上しない。高齢化や人手不足に直面し、AIへの期待が高い領域ほどデータが無い状況となっている。

  • 電子出版アワード
  • 図書館館外貸出可否識別マーク