イーロン・マスクが設立に関わった人工知能研究開発団体OpenAIが、MITとともに精巧な嘘ニュースを書くAI "GPT-2"を開発したという話題は2月にお伝えしました。ただ当時は、もし悪用されるとフェイクニュースやスパム、疑わしい情報が世に溢れ出し混乱を来してしまうとの恐れから、GPT-2の簡易版のみが公開され、我々がその真の実力をうかがい知ることはできませんでした。
しかしOpenAIはその後も研究開発を継続しており、フル機能を備える完全版を公開しても「誤用されるという強力なエビデンスはない」として、ウェブ上にそれを公開しました。GPT-2は、最小限の情報を与えるだけでつじつまの合う内容のテキストを生成する能力を持つテキスト生成システムで、ウェブサイトから集めた800万を超えるテキストドキュメントで鍛え上げられました。そして、見出しとなる(偽の)文を与えるとニュース記事を、詩の出だしの1文を与えるとそのポエムを完成させるといった芸当を得意とします。
また、研究者はその言葉の組み立てにはときに知性すら感じられるとも述べています。念のために記しておけば、GPT-2には知性や認知機能といったものはなく、あくまで出力した文章がたまたまそのように感じさせているにすぎないはずです。
また、GPT-2は出力する文章を微調整することができるため、たとえば特定の差別的な思想などを擁護するように手を加えてプロパガンダを自動生成するシステムに仕立て上げることも可能だとされます。しかし、OpenAIは、3月に公開された制限付きバージョンがフェイクニュース生産などに悪用された兆候が見られないため、フル機能バージョンの公開を行ったと説明します。
なお研究者らは、GPT-2が生成した文章を95%の確率で検出できるシステムも開発しているとのこと。とはいえこれは完全な自動処理でなく、フェイク画像/動画の検出のように一部で人間の目も借りて強化していく必要があるとしています、
OpenAIは今後、GPT-2がコミュニティや一般の人々によってどのように使用されるかを監視しつつ「機械学習のための責任ある出版規範」プロジェクトに参加しコミュニティとともに議論していくとしました。
ちなみにAIに文章を出力させると、短い文章ならそこそこでも、長文になるにつれだんだんとその精度が怪しくなって行きます。GPT-2もその辺は同様で、だんだんと単調で同じような文章ばかりになっていくとのこと。夏休みの宿題の読書感想文を代わりに書いてくれるAIは、まだまだやって来そうにありません。