「人工知能とバーチャルリアリティ(VR)の接点」と題し、機械学習を中心とした人工知能の最近の話題、さらにVRとの連携を見据えたトレンドを紹介していきたい。
その際に重要なトレンドのひとつとして、前編ではバーチャルYouTuber(VTuber)の盛り上がりや、アバターを着飾る文化とその普及がもたらす未来のコミュニケーションについて触れたいと思う。続く後編では、機械学習の手法のひとつである「Generative Adversarial Network(GAN)」による動作生成や、対話システムの研究開発について紹介し、上記のVRの話題との親和性の高さについて説明したい。前後編を通して「七〇億の幸福なバーチャル世界は訪れるか」という壮大な議論に向けて、さまざまなトピックを紹介したい。
インターネット時代を象徴する職業のひとつとして、日常的にYouTubeへ動画を投稿して広告や企業とのコラボレーション案件を収入源とする「YouTuber」という職業が生まれた。さらに最近では、セルルックなアバター(アニメキャラクター調の3DCGモデル)を着飾ってYouTuberとして活動するバーチャルYouTuber(VTuber)が登場し人気を集めている。
VTuberの筆頭に挙げられるキズナアイが本格的に活動を始めたのは2016年12月。現在では5000名を超えるVTuberが存在し、その活動の幅も広がってきている。例えばキズナアイは、NHKの「まるわかりノーベル賞2018」特集のキャストに抜擢されるなど、YouTubeに留まらずマスメディアでの活躍も目立つ。また最近では、ミライアカリというVTuberがNHKのeスポーツを特集した番組でリポーターを務めている。
こうしたVTuberを支えているさまざまな技術のうち、注目したいのは演者の身体の動きをトラッキングする高精度なキャプチャシステムだ。事前に演者の動きを保存しておき、撮影後に動きを編集することも可能だが、現在ではリアルタイムでレンダリングすることさえも可能となっており、生放送なども積極的に行われている。
かつては高価で、かつ取り扱いが難しかったキャプチャシステムも、現在では約20万円程度で購入できる。HTC VIVEとVIVE トラッカーを組み合わせて身体のトラッキングを行うiKinema Orionなどが発売されたことが、VTuberブームを後押ししたと言える。
なお、身体をトラッキングすること目的としたキャプチャシステムにも、さまざまな方式があり、Perception Neuronようにジャイロ・加速度センサ式のものや、HTC VIVEなどのVR関連機器を用いた、さらには光学反射式のVICONなどの選択肢も存在する。
そして、人工知能(機械学習)の技術が発展していく中で期待されるのは、画像認識による身体のトラッキングだ。すでに二次元については、深層学習を用いたスケルトン検出を行うOpenPoseというライブラリを用いることで、単眼の映像にも関わらず精度の高いトラッキングを行うことができる。今後は機械学習の進歩により、特別なキャプチャシステムなしで三次元の姿勢推定や補正を行うことができ
このようにVTuberが注目されつつある中、トップVTuberのひとりである輝夜月(かぐやるな)が、VR空間上(Zepp VR)で大規模なライブを開催した。このライブでは輝夜月だけではなく、視聴者もVRヘッドセットを使ってZepp VRを訪れ、ライブを楽しむという形式となっている。これは「YouTubeで動画を配信する」という形式から、参加者を含めた多くの人々が、現実とバーチャル空間上との間をパラレルに行き来する未来を予感させる出来事だ。
演者ではない人々がバーチャル空間に存在するという流れは加速している。バーチャルタレントすなわち演者としての参加に限らず、バーチャル空間で自身が他者と簡単に交流することを可能にするアプリケーションが続々と公開されている。これらのアプリでは画像認識など、人工知能分野の技術も大きく貢献している。
このような流れを受けて、グリー株式会社(GREE)はVTuberのマネジメントやコンテンツ制作・配信を行う新会社「Wright Flyer Live Entertainment」を新たに設立した。今後の数年間で研究開発40億円を含む約100億円規模を投資し、VTuberによるライブエンターテインメントを軸に、グローバルで事業を展開するという。
同社はVTuber向けのライブ配信プラットフォーム「REALITY」をリリースしており、続けて公開されたアプリでは、個人でも簡単に自分の3DCGモデルをデザインすることが可能になっている。同アプリは2週間で10万人に利用され、エンゲージメント率は40%を超える結果を残した。
GREEに次いで大規模な研究開発・投資を行っているのがドワンゴである。同社も、プリセットされた3Dモデルのパーツを差し替えることで簡単に自分のモデルが作成できる「カスタムキャスト」を発表している。
今後の大きな流れとして、いずれのアプリも「人類総VTuber計画」などと呼ばれている、全人類がアバターを持ってバーチャル空間でコミュニケーションを取るという未来を想定しているようだ。現時点ではセルルックのアバターがほとんどではあるが、今後ユーザーが拡大するにつれてさまざまなモデルが普及し、バーチャルコミュニケーションが実現していくものと思われる。
ここではVRやVTuberの発展を軸に据えてそのトレンドを紹介した。後編では、人工知能の発展(動作生成や対話システム)のトレンドについて紹介しながら、「七〇億の幸福なバーチャル世界」で人間が暮らすという未来像についての解説を進めたい。