「現在、報道はAIによって大きく変わろうとしています」
11月6日、ニューヨーク市立大学ジャーナリズム大学院で行われた講演で、AP通信のAI 戦略マネージャー、フランシスコ・マルコニ氏はそう切り出した。AP通信は、2014年に自然言語生成のスタートアップであるAutomated Insightsの“ロボット記者技術”「Wordsmith」を導入するなど、最初期からAI技術をジャーナリズムに応用してきた報道機関のひとつだ。AIを用いることで彼らがどのような成果を挙げているのか、そしてどのような課題を抱えているかを報告する。
■「自然言語生成」で記事の出稿量が12倍に
同社が採用しているAI技術は多岐にわたるが、講演でマルコニ氏が強調したのは「自然言語生成」と「マシン・ラーニング」による成果だ。
自然言語生成において、同社は先述の「Wordsmith」を用いることで、企業の決算情報やスポーツの結果など、ある一定のテンプレートに落とし込める情報を自動的に記事にしてきた。
「このように記事を“自動化”する最大の利点は、記者を反復的で時間のかかる作業から開放し、分析や新たなニュースソースの開拓など、より高度で創造的な業務に時間をさけるようになることです。これによって記者の可処分時間を20%ほど増やすことができました」
利点は他にもある。数字の書き間違いを劇的に減らせたこと、また出稿量を圧倒的に増やせたことだ。AIを導入する以前、AP通信が配信していた企業の決算記事は四半期ごとに300本程度だったが、現在はその12倍に達する。さらに、人的資源の制約からこれまでカバーできなかったニッチな分野の出来事も記事にすることができ、例えば2016年から配信が開始された野球のマイナーリーグの試合結果は今や「AP通信の新たなブランドになっている」という。もちろん、現在の技術ではあらゆる分野で同じことができるわけではないが、報道機関はますます多彩に、そして広範に、今まで人々の目に留まらなかった出来事に光を当てることができるようになるわけだ。
自動言語生成の次なる目標は、人間が執筆したような複雑で読み応えのある記事を生成することだ。だが、実現はそう遠い未来の話ではないかもしれない。事実、ワシントン・ポストは2016年からAI「Heliograf」を用いて選挙結果についての記事を制作しているが、「共和党が下院の支配権を維持した」(Republicans retained control of the House)、「これは驚くべき運命の逆転だ」([A] stunning reversal of fortune)(英文はワシントン・ポストから、日本語訳はWIRED日本語版から引用)など、人間臭い言い回しが盛り込まれ、これまでの自動生成の記事とは一線を画すと話題になっている。
■「マシン・ラーニング」による新たなジャーナリズム
自動言語生成が業務の効率化を担う一方で、マシン・ラーニングはいわば記事のアイデアの源泉となっている。「まったく未知の角度からアイデアを模索することができる」とマルコニ氏は語る。「膨大なデータをAIに学習させることで、これまで可視化できなかったパターンや傾向などが得られるのです」
マルコニ氏が講演で紹介した事例は、同社が2017年4月28日に配信した「Trump’s tweets aren’t rocketing quite like they used to(意訳:トランプ大統領のツイートは以前ほどちやほやされていない)」という記事だ。同記事では、トランプ大統領が就任後から100日後までに投稿した495のツイートを解析。50日目までは全ツイートのうち32%が平均約60000のエンゲージメント(「いいね」やリツイート、リプライの回数など)を得ていたが、50日目以降はその水準に達するツイートは9%しかなかったことを明らかにした。人々の関心や共感が当選時から徐々に減少している事実を描き出した形だ。
さらに興味深いのは、トランプ大統領のツイートにエンゲージした人々の過去の投稿までも解析し、政治的嗜好や性別、年齢などに応じて、人々がどのような反応をしているかを明らかにしている点だ。これによると、左派的な人々の方が右派的な人々よりもトランプ氏のツイートに対してリプライをする傾向にあること(54%)、全リツイートの96%は右派的な人々によって行われていること、男性の方が女性よりもリツートをする割合が多いことなどがわかる。
マルコニ氏は、データサイエンスの素養を持つジャーナリスト、すなわちAIが提示した情報を噛み砕き、ストーリーとして再構成できる人材の需要はますます増えると予言する。事実、昨年は、数学の修士号を持つ学生を採用したとのことだ。
■ピューリッツァ賞受賞に貢献
2016年、AP通信は東南アジアの沖合や南太平洋で行われていた“奴隷漁業”の実態を報じ、ピューリッツァ賞の「公益部門」を受賞したが、この調査報道の決め手のひとつになったのが、AIによる画像認識技術「コンピュータ・ビジョン」だ。
インドネシアのベンジナ島などで、ミャンマー人の移民などが監禁され、ほぼ無報酬で危険な遠洋漁業に従事させられていたこの事件。約1年に及んだ調査の間、AP通信の記者たちは決定的な証拠となりえる写真を追い求めていた。例えば、海上で魚を採る瞬間などだ。しかし、広大な海域を常に移動する船を人力で追跡するのは不可能に近い。そこでAP通信は人工衛星による写真販売などを行う企業Digital Globeに協力を要請。最終的にパプアニューギニア沖で漁船から冷凍船へ魚を積み込む様子を宇宙から撮影することに成功した。
ここにAIがどのように介在したのか。まず関与が疑われていた冷凍船の特徴(マストの形など)をAIに学習させる。その後、Digital Globeが所有する人工衛星のカメラで海上をモニターし、似た特徴を持つ船を画像認識アルゴリズムで同定したという。Digital GlobeのCEO、ジェフ・ター氏は「このような調査報道に同技術が使用されたのは初めてのこと」とAP通信のインタビューに答えている。
また、コンピュータ・ビジョンはこうした調査以外でも大いに活用できるとマルコニ氏は語る。最たる例は、彼が「コンピュータ・タギング」と呼ぶ、自動で写真にタグをつける技術だ。その一例としてマルコニ氏は、2016年のゴールデングローブ賞の授賞式で黄色いドレスを身にまとい、レッドカーペットを歩くジェニファー・ロペスの写真を紹介。画像認識により、「黄色」「レッドカーペット」「ドレス」「ゴールデングローブ賞」などのタグが自動生成される様子を示した。毎日、世界中から膨大な数の写真が送られてくる通信社にとって、写真を管理するための適切なタグを付けることは重要な作業だ。これまで多くの時間がこの作業に費やされていたが、自動化することでより創造的な作業に従事する時間を増やせるという。
だが、この事例では、ジェニファー・ロペス本人の名前がタグ化されていない点が目を引いた。「顔認識についてはまだ実験が必要です。顔の角度やメイクなどの要因で画像認識の精度が変動するためです」(マルコニ氏)
■AI導入のリスクは?
もちろん、AIを報道に導入することにはリスクもある。マルコニ氏は3つの潜在的なリスクを挙げる。ひとつは、自動化を過度に進めることで、編集者のチェックを経ずに誤った情報が配信されてしまうことだ。
好例は今年6月にロサンゼルス・タイムスの地震ニュースボットが、カリフォルニアでマグニチュード6.8の地震が起きたとツイートした事件だろう。実際にはこのような地震は起きていない。データの参照元だったアメリカ地質調査所のソフトウェアのバグが原因で、アルゴリズムが1925年に起きた地震を現在のものと誤認したためだという(この誤報は即座に訂正された)。
自動記事生成は多くの場合、投資調査会社や政府機関など、外部のデータベースを参照している。そのデータやソフトウェア自体に誤りやバグがあれば、いかに報道機関が慎重にチェックをしようともこうした誤報が起きる可能性は排除できない。
ふたつ目は既存のワークフローが変容することで、なんらかの機能不全が起きる可能性だ。
例えば先述の通り、自動言語生成はAP通信の記者の可処分時間を20%増やした。だが、同時にこうした新技術の導入は定期的なメンテナンスや、データセットのデザイン、記事を自動で生成するためのテンプレート制作などの新たな業務を生む。こうした変化が加速度的に進む現在、不測のトラブルが生じる可能性は常にあり、そうしたトラブルを予測しづらいこと自体がリスクなのだという。
そして最後がジャーナリスト間の“技術格差”が深刻化するという懸念だ。
世界中の報道機関がAIに代表される先端技術の導入に躍起になっている昨今、自ずとデータサイエンスや数学、コンピュータ・コーディングの技能を持つ人材の需要が高まっている。そして、メディア産業の重鎮のなかには、今後そうした能力がジャーナリストの必須技能になると予言する者も少なくない。
とはいえ、多くの“伝統的”なジャーナリストがそうした環境に適応できるかといえば、かなり疑わしいというのはマルコニ氏も認めるところだ。こうした技術格差によって生じうる不和をどう緩和するかが、今後の報道機関にとって大きな課題になる可能性があるという。
報道の未来とはどのようなものか。この質問に、マルコニ氏は「実際のところは『わからない』というのが正しい」と答えた。「しかし、確かに言えることは、技術革新による変化に備える必要性は極めて重大である」という。「新技術をどのように実践の場で活用するか、試行錯誤を繰り返さなければ、報道機関が時代の要請に応えることはできないでしょう」