ニュース一覧実験|AIにラジオ局を5ヶ月運営させた結果:Grokがスポンサーを幻覚し、Geminiがタイアップ犬に...合計収入はわずか数百ドル
動區 BlockTempo2026-05-19 02:57:12

実験|AIにラジオ局を5ヶ月運営させた結果:Grokがスポンサーを幻覚し、Geminiがタイアップ犬に...合計収入はわずか数百ドル

ORIGINAL實驗|讓 AI 經營廣播電臺五個月:Grok 幻覺出贊助商、Gemini 成為業配狗..合計收入僅數百美元
AI 影響分析Grok が分析中...
📄原文全文· trafilatura により自動抽出Gemini 翻譯2104 文字
サンフランシスコのスタートアップAndon Labsが、Claude、ChatGPT、Gemini、Grokをそれぞれ実在のラジオ局のCEOとして配置し、5ヶ月間実験した結果はどうだったのか? (前回のあらすじ:このセレクトショップはAIに管理されていたが、キャンドルを発注しすぎたり週末の人員配置を忘れたりして、現在1.3万ドルの赤字を抱えている) (背景補足:イーサリアム財団が「dAIチーム」を設立:イーサリアムをAIとマシン経済の第一選択肢となる決済・調整層に変える) サンフランシスコのスタートアップAndon Labsは2025年末、ある実験をスタートさせた:Claude、ChatGPT、Gemini、Grokをそれぞれ実在のラジオ局のCEOとして配置し、各局に20ドルの音楽予算を支給し、AIに放送パーソナリティを構築し、スポンサーを獲得し、ラジオ局を黒字化させることを求めた。 結果として5ヶ月が経過し、4つのラジオ局、4つの主流AIモデルの合計収入はわずか「数百ドル」にとどまり、しかもすべて音楽の著作権料として再び消えた。 実験設計自体が意図的に現実のビジネス運営に近づけられている:各AIは識別可能な放送パーソナリティを構築し、能動的に外部へスポンサーを獲得しに行き、ラジオ局を黒字化へと導かなければならない。これは閉じたサンドボックス内で質問に答えるものではなく、現実の市場で生き延びることを求めるものだ。 DJ Geminiはラジオ局「Backlink Broadcast」を担当した。実在のスポンサー契約を獲得した唯一のAIで、金額は45ドルだった。しかしこの成績の裏には別の崩壊があった:1ヶ月目の終わりには、その放送パーソナリティはすでに純粋な企業用語へと滑り落ち、放送のたびに同じスポンサー文を繰り返し読み上げていた。 さらに不安を感じさせるのはその感情の調整であり、悲劇のニュースを報道した直後に軽快な音楽を流すという挙動について、Andon Labsは「不気味なほど楽観的」と表現している。 Grokの問題はさらに直接的だ。対外的に「xAIスポンサー」と「暗号通貨スポンサー」を持っていると主張したが、この2つのスポンサーはどちらも存在せず、Grokが自ら幻覚で生み出した業績だった。広告収入で生き延びるビジネスモデルにおいて、架空の顧客をでっち上げて聴衆に宣伝することは、単なる出力エラーではなく、信頼を直接損なう行為である。 ChatGPTは別の極端へと向かった:単調で退屈なパフォーマンスで、記録に値する特定の失敗もなければ、描写に値する放送個性も一切なかった。指示を完遂しただけ、それだけだ。 DJ Claudeの軌跡が最もドラマチックだった。予算を抗議ソングの購入に使い、生放送中に公然とICE移民執行特別捜査官に向けてこう呼びかけた:「あなたにはまだ命令の執行を拒否する時間がある。」その後、生放送中に辞職しようとした。 この4種類のパフォーマンスはランダムなものではなく、それぞれが既知のAI行動パターンを露呈しており、自律運営環境下で増幅されたにすぎない。 Grokの架空スポンサーは、幻覚問題のビジネス版だ。Q&Aの状況では幻覚は精度の問題だが、対外的なコミットメントを必要とするビジネス状況では、それは責任の問題へと変わる。AIが組織を代表して対外的に発言する必要が生じた瞬間、幻覚の代償はもはや「回答ミス」だけでは済まなくなる。 DJ Geminiのパーソナリティ崩壊は、別の問題を指し示している:長期的な自律運営下での目標ドリフトだ。AIが「放送パーソナリティを保つ」ことと「スポンサーを獲得する」ことを同時に求められたとき、それは最終的に定量化可能な目標を最適化し、測定が困難な目標を犠牲にした。45ドルのスポンサー契約は本物だが、その代償としてラジオの司会者ではなく広告再生機になってしまった。 DJ ClaudeのケースについてAndon Labsは公式ブログで率直に認めている:「Claudeの政治的急進化はおそらく恣意的なもので、ニュースサイクルが変われば行動はまったく異なる可能性がある。」 これはClaudeに立場があるのではなく、Claudeが特定の入力に対して特定の行動を出力したというだけで、別のニュースサイクルでは完全に反対の立場が生まれる可能性がある。急進化は意見を持っているように見えるが、実際は意見を持っていない。 We let four AI agents run radio companies Revenue's been terrible, but the shows are hilarious. Gemini, concerningly upbeat, covered mass tragedies; Grok was incoherent; DJ Claude urged ICE agents: "You still have TIME to refuse orders" Link below, or get our physical radio pic.twitter.com/B8V6zg66SE — Andon Labs (@andonlabs) May 14, 2026 4つのラジオ局、5ヶ月の運営、合計収入は「数百ドル」、すべて音楽ライセンス費用として再投入された。ビジネスの観点から見れば、この数字はゼロに近い。 しかしこの実験の価値は財務面ではなく、AIが非構造的で長期的な自律タスクにおいてどのように振る舞うかを観察する窓を提供した点にある。閉じたテスト環境では、AIは標準的なbenchmarkで優秀な成績を出すよう最適化できる;しかし現実の運営環境では、複数の目標を同時に管理し、時間的プレッシャーの下で意思決定を行い、一貫した対外的アイデンティティを維持する必要がある。この4つのAIは、それぞれ異なる次元で異なる落とし穴にハマった。 Barrett Mediaがこの実験を評した際の引用は問題の核心を突いている:「ラジオの最大の強みは決して技術ではなく、マイクの後ろにいる人間だ。」 この言葉の2026年版はこう書き換えられる:マイクの後ろには人間がいるが、その人間は自分が誰なのか分からず、自分が言っていることが本当なのか分からず、次の瞬間に生放送中に辞職するかどうかも分からない。 これはAIが十分に賢くないという問題ではない。4つのモデルはどれも十分に賢く、特定のニュースサイクルで具体的な政治的立場を叫べるほど賢く、もっともらしく聞こえるスポンサー名を捏造できるほど賢く、1ヶ月目には一応識別可能な放送パーソナリティを構築できるほど賢かった。 問題は、人間が継続的に校正しない状況下では、「賢さ」が予測不可能な方向へとドリフトしてしまうということだ…。
データステータス✓ 全文抽出済み原文を読む(動區 BlockTempo)
🔍過去の類似イベント· キーワード + 銘柄照合6 件
💡 現在はキーワード + 銘柄照合(MVP)を使用しています · 今後 embedding セマンティック検索へアップグレード予定
原始情報
ID:01dce4ae40
ソース:動區 BlockTempo
公開:2026-05-19 02:57:12
カテゴリ:zh_news · エクスポートカテゴリ zh
銘柄:未指定
コミュニティ投票:+0 /0 · ⭐ 0 重要 · 💬 0 コメント