世界中で驚きを持って迎えられた「ChatGPT」。なぜこれほど注目を集めたのか。それは「人ともっともらしい対話ができるAI」だったからだ。
これまでも人工知能(AI)によるチャットボットなどは存在したが、その能力は定型的な応答ができる程度だった。それが、「曖昧な質問にもきちんと回答できる」「長い文章をうまく要約する」など「AIには無理、ヒトにしかできない」と思っていた作業を楽々とこなすようになった。
ChatGPTなど、大規模言語モデル(LLM)による生成AIの能力が広く知られるようになったのは2022年末頃だが、それ以前から「AIとの対話」に取り組んできたスタートアップがある。以前、当媒体でも紹介した「大喜利AI」に取り組む「株式会社わたしは」だ。
4月12日にオンライン形式で開催されたセミナー「Generative AI ~ChatGPTはAI未踏の領域への第一歩になるか~(主催:DG Daiwa Ventures)」に、DG Daiwa Ventures投資先の株式会社わたしはのCEO竹之内大輔氏とCTO小橋洋平氏が、「ChatGPTを主とした大規模言語モデルの現状把握」と題し、生成AIの進化、活用などについて話を展開した。
わたしは社の大喜利AIは、「対話のズレ」を利用して笑いを作り出してきた。通常の対話AI開発の歴史では、「質問に対して、いかにピンポイントな回答を出すかのゲーム」(竹之内氏)を競ってきたが、実際の人の会話には曖昧なやり取りもあり、「ズレ」があることの方が自然だ。わたしは社では、これまで「ズレてることが当たり前」を前提とした言語モデルに取り組んできた。そこに、質問の曖昧さがあっても対話ができるChatGPTが現れたわけだが、竹之内氏の理解としては、GPTのような生成AIは「30%くらいはうちの領域に入って来ている」と見ているという。
桁違いの大規模データと、巨大な計算能力が必要な生成AIの開発は、ビックテックが得意とするところだ。GPTなどの生成AIは、この先もビックテックの手でさらに進化していくだろう。
竹之内氏の見立てによれば、費用対効果だけで考えるなら、自ら生成AI作ろうとは考えずに、オープンソースの生成AIや、有料で公開されているGPTのAPIなどを利用するのが良さそうだという。
利用にあたっては自らの利用目的に合うようにAIを操作、改良していく必要がある。
その手段には2つの方法ある。ひとつは「ファインチューニング」だ。これは学習モデル自体を再トレーニングし、新たなタスクに適合するようにパラメーターを調整する。もうひとつが生成AIに作業命令をする「プロンプト」を工夫することで、この2つが併存していることが、GPTの進化を特徴づけているというという。
ファインチューニングをするには、AIに関する専門知識やスキルが必要だ。一方、“呪文”などと言われているが「プロンプト」は、人が話しかけるように命令文を書くだけでよい。
ファインチューニングによって、AIは進化・向上していくわけだが、その向上した能力、機能は次のバージョンでは生成AI本体の標準に取り込まれており、プロンプトから手軽に利用できる(図1)。つまりバージョンが上がるほどプロンプトの工夫だけでできることが増えることになる。
ChatGPTは、利用者が質問(プロンプト)し、それにAIが回答する。その質問は「明日の天気を調べて」といった検索依頼のような簡単なものから、「メール一斉送信をしたいので、VBAのマクロを書いて」といったプログラミングなどの専門知識が必要な作業依頼までもが可能だ。
作業レベルのバーを上げても、プロンプトをうまく書けば生成AIはそれをクリアしてくる。より高度な作業をAIにさせるために、どういうプロンプトを書けばいいのか。良いプロンプトの文法を探し、それを記述することは「プロンプトエンジニアリング」といわれる。「プロンプトの可能性はまだ(その限界が)OpenAI社の開発者にさえ見えていないのではないか」(竹之内氏)という。
ChatGPTは何を知っているのか、どこまで要求に応えてくれるのか。推測し、質問を投げることで、生成AIの限界を探る楽しみが誰にでも味わえる。
「世界中の人が、毎日ツイッター上で『こんなプロンプトで、こんな出力が出た』ということを自慢しまくっている」(竹之内氏)
プロンプトエンジニアリング自体も進化している。「人の思考の連鎖のプロセスのそのものをプロンプトで再現する」や「プログラム言語のような推論過程で命令を与える」など、多くのテクニックが日々開発されており、それらのプロンプトを売買するサイト(「Prompt Base」など)もすでに存在している。
ところで、わたしは社がこれまで行ってきた「AIによる大喜利」は、ChatGPTにもできるのだろうか。竹之内氏の解説によると、これもやはりプロンプトの書き方の工夫で、「奇をてらう変換をしろ」といった命令文などを追加することで、初級の大喜利のレベルの回答ができるという(図2)。
ビジネスでの活用方法についてはどうだろうか。
「(GPT等を)チャット AI みたいなものだととらえると『カスタマーサポートのリプレイス』とかになってしまう。可能性はもっと広く、より大きな変化だと捉える必要がある」と竹之内氏は述べる。
まず、確実なのはデスクワークの生産性が向上するということ。プレゼン資料や議事録の作成などは、AIに任せることができる。議事録をリアルタイムで自動生成すれば、会議に途中参加した人は、AIにここまでの話の進み具合を質問すればいい。AIが議事録を要約して、これまでの議事内容を教えてくれる。「これまでなに話していたの?」と隣の席の人にこっそり聞く必要もない。
さらに、生産性が向上するという考え方を延長していくと、より具体的な利用法が見えてくる。その方向性として3つあげた(図3)。
ひとつは、ChatGPTのプラグインを導入し、既存の自社のサービスに組み込むことによって、サービスの付加価値向上を図ることでできる。ECサイトや財務・会計アプリなどAIを組み込むことでより便利になるものは数多くある。
2つ目はクリエイティブやエンジニアリングのたたき台を作ること。イメージ画像やコピーライティングのたたき台、草案の作成といったテクニックが必要なものから、プログラミングやSEOが効くリリース文などの専門知識が必要なものまで、AIに任せてしまえる作業は多い。
もちろん最終的には人がチェックしてから公開する必要があるが、AIは人がパッとは思いつかないアイデアを提供してくれることもあるので、確かにAIとの協業は有効な手法になるだろう。
3つ目がコンテンツのインターフェイスとしての利用だ。例えば、KindleやYouTubeのインターフェイスとして活用すれば、物語や動画の内容を要約提示してくれるだけでなく、「一番盛り上がった場面はどこ?」などというようにコンテンツの内容をネタにしての対話もできる。
ビジネスに活用するにあたって留意すべきことは、現在この分野の進化は著しく、技術的なハードルも早い速度で下がり続けている。つまり、ちょっと前までファインチューニングが必要で手間も費用もかかったことが、今はプロンプトで可能になっており、より簡単にサービスに組み込むことができる。ゆえに――『まず自分たちで(ChatGPTなどを)ひたすら触り』、『超リサーチしている人に相談する』――(講演資料より補足引用)ことが肝心だという。
2016年の創業以来、ひたすら対話型のAIに向き合ってきたわたしは社は、まさに“超リサーチしている人の集団“だ。「これまで、自分たちの技術の話を社外ですることはなかったのですけど、最近こういう(生成AIのビジネス利用について)お問い合わせいただくことが増えたので、それにちゃんと答えたい」と述べ竹之内氏はセミナーでの話を締めくくった。
※株式会社わたしは は、DG Daiwa Ventures投資先の一社となります。DG Daiwa Venturesは株式会社大和証券グループ本社と株式会社デジタルガレージが合弁で設立したベンチャーキャピタルです。