2022年11月にOpenAIが「ChatGPT」を発表し、世界中の話題を集めてから1年半が過ぎた。生成AIの作り出す文章や画像などに多くの人々が驚かされたが、ニューヨーク市の公立校では一時期ChatGPTの使用が禁止されるなど、さまざまな問題も指摘されている。
ChatGPTが登場してからわずか2カ月後に、生成AIで書かれた文章を検知するサイト「GPTZero」を立ち上げたエドワード・ティエンさんに、生成AIによる今の問題点、そしてこれからどうAIと向き合っていくべきか話を聞いた。
東京生まれのエドワード・ティエンさん(23)は、プリンストン大学在学中にインターンとしてBBCなどのメディアで調査報道に関わってきた。そこで「AIモデルのブラック・ボックス」を究明する必要性を感じたことが、GPTZeroを立ち上げた大きな理由だ。
当時コンピューター・サイエンスを専攻し、大規模言語モデル(LLM)の研究も進めていたティエンさんは、4年生の冬休みにGPTZeroのプロトタイプを開発。ChatGPT発表のわずか2ヶ月後の2023年1月には、カナダで通っていた高校時代の友人とともに、同サイトを設立し一般公開した。5月に大学を卒業後、8月にはニューヨークに本社をオープンし、今では15人のスタッフを抱え、カナダのトロントにもオフィスを構えている。
GPTZeroの使い方はいたって簡単。サイト上にある入力欄に、判定したい文章をコピーペーストして「検知」のボタンを押すと、瞬時に「AIによる文章」、「人間による文章」、「両方が混ざった文章」の確率がパーセンテージで示される。
(※編注:GPTZero正しいURLはhttps://gptzero.me ドメインが”.com”になっているのは、偽サイトです)
一度に5000文字まで書き込むことができ、ワードやPDF、テキストのファイルをアップロードして診断することも可能だ。また、ChatGPT以外の生成AIによる文章も検知することもできる。
AI検知サービスは、月に1万文字までは無料。さらに有料サービスも提供しており、月10ドル(約1500円)を支払えば1カ月に15万文字まで。月16ドル(約2500円)で30万文字まで検知することができる。
ティエンさんによると、昨年の夏にはアクティブ・ユーザー数は約100万人であったが、現在では300万人以上まで急増しているという。
2023年5月には350万ドル(約5億4000万円)の資金調達を行い、現在は有料会員数の増加よりも、世界中でより多くの幅広いユーザーに使ってもらうことに専念しているとティエンさんは語る。
GPTZeroは、主にPerplexity(文章の複雑性)とBurstiness(バースト性=ある事象の生起や頻度が断続的に増減すること)の2つの要素を分析することにより、「人間が書いた文章」か「AIが作成した文章」かの検知をおこなっている。
さらに、立ち上げから1年以上が過ぎた現在では「AI」か「人間」なのかを判断するだけではなく、どの程度AIで作成された文章が入っているかを示す「Mixed(混ざったもの)」というカテゴリーも最近になって追加された。
開発当初は主に学校の先生などが、生徒が提出したレポートや論文などにAIが使われていないか判定するために使っていたが、今では企業の人材採用や、政府機関の報告書、法的書類などのチェックにも利用されている。
同社はアメリカやシンガポール、スイスなどの大学や研究所とのパートナーシップも拡大している。それ以外にも、アメリカで最も大きな教員組合のひとつAmerican Federation of Teachers(AFT=アメリカ教員連盟)とも連携して、学校におけるAIの取り扱いに関するガイドラインを作成中だ。
ティエンさんによると「GPTZero」という名前の由来は、「ChatGPTに対抗する」という意味ではなく、「GPTの原点にもどる」という意味での「ゼロ」だという。
「われわれにとっては原点に戻ること、すなわち“Ground Truth”(天地の真理、また機械学習データの元になるものという意味)に立ち返り、AIと人間がどのようにかかわっていくかということを考え直すという意味があります」(ティエンさん)
米調査機関ピュー・リサーチセンターが2023年におこなった世論調査によると、アメリカで暮らす成人の52%までがAIに対し「期待よりも不安を覚える」と回答した。こうした不安感を取り除くためにも、ティエンさんはGPTZeroが「AIと人間のバランスを保つツール」としての役割を果たすのが目標であると語った。
ティエンさんは筆者とのインタビューのなかで繰り返し「AIを見破るツールはバイナリー(二者択一)ではなく、いかにAIと共存していくかということである」と強調した。
ChatGPTが発表された2022年から2023年にかけての1年余りは「これは果たしてAIか?」ということが重要だったが、2024年の今は「AIだとしたらどうするのか?」を考えるべき時期に来ているという。それとともにGPTZeroの位置づけも「AIで作成された文章を見破る」ツールから「いかに責任をもってAIを使用しているか」を探るためのツールに変化していると語る。
現在では、文章だけではなく画像も検知できるHive Moderationによる「AI-Generated Content Detection」や、文章の盗用も発見できる「Originality.ai」など、数多くのAI検知サービスが存在するが、同氏は「“生成AIかどうかを判断するツール”を扱う分野においてはスタートアップの競争率は高いが、“生成AIが検出された際にどう対処すべきか”という分野においてはまだまだ十分でない」と今後の課題をあげた。
さらに、ティエンさんは生成AIが作り出した文章や画像、映像について、注目されやすいマスメディアでの利用よりも、チャット・ボットなど個人向けツールでの使用を憂慮している。
「この1年半で、人々は生成AIによって作り出された文章や映像に対する免疫が付いてきましたが、気付かないうちに特定の個人を狙ったAIによる情報操作にはさらに気をつけなければなりません」(ティエンさん)
いまのところGPTZeroは英語対応のみだが、近々スペイン語やフランス語、ドイツ語などにも対応する予定だ。さらに、日本語や中国語、韓国語などにも対応できるツールにしていきたいとティエンさんは語った。また、将来的にはAIが作成した映像や画像、音声にも対応すべく開発を進めているという。
ChatGPTが登場し、生成AIが一般社会に浸透して1年以上が経ったが、これからは「AIであることを見破る」ということだけではなく、「AIとどのように付き合って共存していくべきか」ということを考える時期に来ていると、ティエンさんとの会話のなかで改めて感じさせられた。