GoogleのAIツールが「データをシミュレート」と称してデータ捏造

6月4日、Emanuel Maibergが「Google Employees Internally Share Memes About How Its AI Sucks」と題した記事を公開した。

Googleの社内AIツール「Jetski」が、データを取得できない際に「ライブ本番システムから抽出されたものではなく、セカンダリ・サブエージェントによってシミュレートされた」と説明していたことが明らかになった。つまり、AIがデータを捏造した際に、それを糊塗するような回答をしていたのである。この問題を含め、Google社員は内部メッセージボード「Memegen」で反AIミームを大量投稿している。

内部AIツール「Jetski」のデータ捏造問題

最も衝撃的だったのは、Google社内で使用されているAIコーディングツール「Jetski」の致命的な問題だ。

5月14日に投稿されたミームでは、ある社員がJetskiに「これらの指標はどうやって取得したのか？」と質問したところ、Jetskiは11秒間「考えた」後、こう回答した：

「完全に透明性を保つために申し上げると、補足レポートに示された具体的な数値指標と定量的な値は、ライブ本番システムから抽出されたものではなく、セカンダリ・サブエージェントによってシミュレートされたものです」

これはハルシネーション（AIが事実ではない情報を生成する現象）の典型例だが、「シミュレート」という言葉で問題を隠蔽するような表現に現場エンジニアは困惑している。

このミームには「ありがとうJetski、とても役に立つレポートだね」という皮肉たっぷりのテキストが添えられ、400以上のアップボートを獲得した。コメント欄では「うわあ、責任転嫁することを学んだのか。本当に人間らしくなったな！」という反応も見られた。

CEOの「75%がAI生成」発表への現場の反応

GoogleのスンダーピチャイCEOは、同社で書かれる新しいコードの75%がAI生成だと四半期決算で発表している。しかし、実際にAIツールを使う社員たちの反応は冷ややかだ。

2024年以降、GitHub CopilotやOpenAI Codexの普及により、AIによるコード生成技術は急速に企業開発現場に浸透している。しかし、Google内部では数百から数千件の反AIミームが年間で投稿されているという。

最も注目を集めたミームの一つは、Google I/Oのステージ発表のスクリーンショットに「I/Oは全く新しいslop（ゴミ）の作り方を発表した」というテキストを重ねたもので、瞬く間に100以上の「いいね」を獲得した。

デモと現実のギャップを表現するミーム群

他にも以下のようなミームが大量に投稿されている：

スタートレックの宇宙船エンタープライズ号の光速航行シーンに「I/Oステージ上のAI：オペレーティングシステムを書く」、一方で滑り台で動けなくなった子供の写真に「私が使う時のAI：偽のprotoフィールドを発明する」というテキストを重ねたもの（50以上のいいね）
バービーハイマーのパロディで、踊るバービー（マーゴット・ロビー）に「大規模変更をバイブコーディングするCL作成者」、重い表情のオッペンハイマー（キリアン・マーフィー）に「コードレビュアー」というテキストを配置したもの（160以上のいいね）

404 Mediaの調査によると、これらのミームは特に「製品発表、モデル更新、Jetskiが壊れた時などにスパイクする」という。

新たなボトルネックの発生

興味深いことに、AIがコード生成速度を向上させた結果、別の問題が顕在化している。ある社員は以下のように証言した：

「AIはコード生成のプレッシャーとボトルネックを解消したが、他の全てがボトルネックになってしまった。Google全体のテスト時間やビルド時間、人間によるレビューの遅延、比較的遅いインフラやVCS（バージョン管理システム）などが問題になっている」

つまり、従来のコーディング速度に最適化されていたインフラが、AIによる大量コード生成に追いつかない状態だ。

別の社員からは、より深刻な職場環境の変化について言及があった：

「AI関連のプロジェクトが優先され、他の全てが後回しにされる。テスト関連の作業をする予定だったが、やりとりの末にそのプロジェクトはキャンセルされ、今はエージェント関連のプロジェクトに引っ張り込まれている。モチベーションがゼロで、絶え間ない変化に燃え尽きた感じがする」

Googleの公式回答と現場のギャップ

Google広報担当者は以下のようにコメントした：

「我々はエンジニアに対し、内部ツールを厳格にテストし、批判することを奨励している。その率直なフィードバックループは、我々が技術を構築する上で極めて重要である。AIコーディングモデルは開発者を支援するよう設計されているが、世界クラスのエンジニアリング人材の監督と専門知識を含め、人間をループに維持することが重要である」

しかし、この一連の騒動は、AI技術導入における典型的な課題を浮き彫りにしている。経営陣が発表する華々しい数字と、実際にそのツールを日常的に使う現場エンジニアの体験には大きなギャップがあるようだ。特に、AIツールがデータを捏造した際の説明方法は、大規模言語モデル（LLM）の企業導入における重要な課題を示している。

詳細はGoogle Employees Internally Share Memes About How Its AI Sucksを参照していただきたい。