米国のトランプ大統領が「フェイク・ニュース」に敏感なのは有名だが、文章主体の「フェイク・ニュース」に今後は動画と音声(肉声)が付け加わるかもしれない。

 一部のプログラマたちの間で、”Deep Video Portraits”の名称で知られ始めている「架空の動画」を生成する技術と、Google傘下のDeepMind社が論文を公開した”WaveNet”と名付けられた音声(肉声)生成技術を組み合わせることで、それが可能になりつつある。

 テキスト・メッセージが中心の「フェイク・ニュース」に動画と音声が加わると、何が起きるだろうか。1つの典型的なイメージを挙げてみる。

 ”政財界の有力者や著名な文化人が、現実には過去に一度も行っていない行動の一部始終を収録した動画と肉声音声が、本物の動画と音声と見分けがつかない出来栄えで制作され、ネット空間上に流布される(それは、ある人から賄賂を受け取る様子かもしれない)“

 “ある国の大統領や総理大臣や著名な女優が架空の日次に、架空の場所で、架空の人々の眼の前で、本人の普段の言動からはまるでかけ離れた内容の架空の発言や架空のスピーチを行っている動画と肉声が、TwitterやFacebookで拡散されている”

 2018年8月現在、技術の進歩により、

 “実際には、人前で行ったことのない「偽の動作」や「偽の発言」をあたかもその人物が実際に行ったかのような、架空の「偽の動画」と「偽の肉声音声」を、コンピューターで作り上げる”

 ことが、可能になりつつある。

 では、ある人物が現実に人前で見せたことのない表情や動作や発言といったものを現実の世界で、動画や録音に捉えることはできません。では、これらの技術は、どのようにして偽の「架空のデータ」を生み出すことができるのでしょうか。

 その手口は、こういうものです。

 はじめに、標的に定めた著名人に「行わせたい動作」と「発言させたい発話」を「標的の人物」とは異なる「まったくの別人」に行わせた様子を動画や録音に収めます。次に、「目標に定めた人物」が過去に、「別の動作・別の発言」を行っている様子を収めた「本物」の動画データと肉声データを用意します。その上で、「偽の別人」の「動画・肉声データ」と「本物の本人の(別の動作と発言を行っている)動画・肉声データ」を合成するという流れです。

 その結果、ターゲットにされた人物が、「もしも」そのような振る舞いや発言を実際に行っていたとしたら、撮影できたであろう「架空」のでっちあげの「動画・肉声データ」が生み出されるというものです。

 「エンコーダー・デコーダー・モデル」(Encoder-Decoderモデル)や「敵対的生成ネットワーク」(GAN: Generative Adversary Network)という人工知能技術を用いて作られるそのような「架空」の写真や動画と肉声データの「出来栄え」は、人間が見て、それが「架空」の産物とは気づかないほどの「品質」にまで到達しつつあります。

 TwitterやFacebookやブログサイトなどのサーバ空間上で、「偽の事実」をでっちあげたり、「偽の事実」に立脚した風評記事や誹謗中傷記事を流布させるこれまでの「フェイク・ニュース」(Fake News)が、文章(テキスト)主体であったものに、今度は「偽の証拠動画」と「偽の肉声音声」が付け加わろうとしている。

 それがいま、絵空事ではない情況が生まれつつあります。

The following two tabs change content below.
AI研究家 小野寺信

AI研究家 小野寺信

1944年、長野県生まれ。カナダ在住。1930年代の「物」論考、「哲学への寄与」論考など、いわゆるハイデッゲルの中期思想と、西田幾多郎ら京都帝大の「場所の論理学」の思想の架橋を志すも、九鬼周造の「偶然性の哲学」の文章に触れて、己の非才を悟り、断念。計算機科学と知能の計算論的再現に惹かれ、人工知能の研究に励む日々を送る。若いAI産業人や大学・大学院生に対して、カオス理論と身体性に立脚した「米国の後追い」ではない、我が国自身の「AI研究アプローチ」が実在することを知らせる必要性を痛感し、連載をスタートした。