サイトアイコン DG Lab Haus

人工知能(AI)はより身近な場所に 第2回AI・人工知能 EXPO

講演中のラヴィ・ジェイン氏(Amazon.com, Inc.)

講演中のラヴィ・ジェイン氏(Amazon.com, Inc.)

「第2回AI・人工知能EXPO」が、2018年4月4日、東京ビッグサイトで開幕した。前回よりも規模を3倍に拡大したという今回は、最新のAI(人工知能)技術を用いたさまざまな、製品が開発中のものも含め多数展示されており、食や趣味、仕事など、日常生活にAIが浸透していることが感じられた。

AI関連のサービスや製品を扱う約300社が出展した「第2回AI・人工知能EXPO」

「ふだん使い」のAIサービスといえば、現在世界中で展開されているAIスピーカー(スマートスピーカー)だろう。その代表的な存在であるアマゾンエコー(Amazon Eco)開発の中心人物で、Alexaマシンラーニングプラットフォーム担当のバイス・プレジデントであるラヴィ・ジェイン氏の講演が4月4日に開催された。会場は3000人を超える観客で埋まり、講演に対する注目度の高さが伝わってきた。

 講演のタイトルは「AmazonによるAIの民主化」。ジェイン氏が語ったのは、アマゾンエコーの頭脳となるAI「アレクサ(Alexa)」をより多くのユーザーや開発者が使えるようにするために、アマゾンがどのような取り組みを行っているかということだった。

 取り組みのひとつは、その地域に合った知識を深めるというもの。たとえば日本では「ドリームズ・カム・トゥルー(DREAMS COME TRUE)」と言えばミュージシャンであり、さらに「ドリカム」という略称で呼ばれる―など。

 ふたつめの取り組みが、大学生を対象とした開発コンテスト「アレクサ・プライズ(The Alexa Prize)」の開催だ。アレクサを使って、人間と自然に会話できるチャットポッド(ソーシャルポッド)を作るというのが目的で、大学生や教員と協力しながら、技術の向上や知識の共有を図るという。

 さらにジェイン氏は、AIの民主化の重要な取り組みとして、VUI(音声ユーザーインターフェース)の専門家でなくとも、アレクサを活用してさまざまなアプリやサービスを開発できる環境作りを挙げた。アマゾンが提供しているのは、開発者がアレクサの機能を使って製品やサービスを開発できる「アレクサ・スキル・キット(Alexa Skills Kit)」と、そうした製品やサービスをさまざまなデバイスに組み込むことができる「アレクサ・ボイス・サービス(Alexa Voice Service)」という2つのサービスだ。このサービスを使い、企業や開発者はさまざまなサービスや製品を作ることができる。ジェイン氏はこうしたサードパーティの参入を「AIの民主化の最もエキサイティングな部分」であるとした。

 Amazonの思惑通りになるかどうかは別にしても、今後AIスピーカーを起点としたさまざまなサービスが生活の中に入り込んでくる可能性の高さを強く感じられた。

“インスタ映え”だけではない、撮った写真は健康管理にも

 初日からにぎわった展示会場では、日立ソリューションズ・クリエイトが、食事の写真から、AIがそのメニュー内容を自動で判別し、食事成分や栄養素を自動で算出する「食事記録・栄養成分分析システム」を紹介していた。

展示されていた「食事記録・栄養成分分析システム」

焼き魚定食があると、 AIがその写真から焼き魚、ごはん、味噌汁、サラダと個別に認識し、カロリーや栄養成分を表示する。こうした計算は栄養士が行っているが、その作業をこのシステムに担わせることで、業務負担を大幅に軽減できるという。

 ただし、AIに料理の素材などを学習させるには、ひとつの料理につき数千枚にも及ぶ膨大な画像データが必要だ。トンカツであれば、ソースをかけたものと、大根おろしをかけたものでは、画像が変わってくるため、さまざまなパターンの撮影が必要で苦労したという。新たなジャンルでのAI技術開発の裏には“人海戦術”が必要になるというのが悩ましいところだ。

講演録作成をAIがサポート

 ひょっとすると記者のかわりになるのではないかと、興味をひかれたのは、メディアドゥの「音声自動文字起こし×AI要約」システムだ。これは、セミナーや講演会などの音声を自動的に文字に起こすだけではなく、テキスト化した文章をAIによって任意の長さに要約できるというシステムだ。

メディアドゥのブースで行われていた「音声自動文字興し×AI要約」のデモの様子

 音声を自動で文字起こしする機能では、文字起こし中に誤って変換された箇所にすばやくハイライトでき、収録後にセンテンス単位で音声を聞き直しながら修正することができる。また要約の機能では、テキスト量を全体の10%、20%、30%……と割合を指定して要約できるのが特長だ。

 このシステムは2017年10月から2018年3月まで徳島県庁で実証実験が行われ、知事の定例会見などの文字起こしに利用され好評を得たという。

 ただ、実際に音声からの文字を起こすデモを見ると、会社名や商品名などを正確に変換するのは難しいようだ。また要約についても、重要な語句を含む箇所を残し、残りの部分を削除する仕組みはあるものの、全体の文意を理解して短くするといった要約はではない。議事録には使えても、人間のかわりに講演を記事に仕立ててくれるレベルにはまだ到達していない。会議の発言録や社内向けの議事録といったニーズには現状でも応えられそうだが、記者の仕事を奪うにはまだ力不足だ。

* * *

 今回の「AI・人工知能エキスポ」では、中小企業や大学などの展示ブースが目立ち、産業用の提案だけでなく、日常生活に生かせるものも多かった。いよいよAIの技術が「ふだん使い」のフェーズに入ったことを実感した。

モバイルバージョンを終了