实验｜让 AI 经营广播电台五个月：Grok 幻觉出赞助商、Gemini 成为业配狗..合计收入仅数百美元

📄完整原文· 由 trafilatura 自动抓取2104 字

舊金山新創 Andon Labs 把 Claude、ChatGPT、Gemini、Grok 各自部署為真實廣播電臺的執行長，實驗五個月，結果如何？（前情提要：這家選品店由 AI 管理，但它訂了太多蠟燭、忘記安排週末人手，現在虧損 1.3 萬美元）（背景補充：以太坊基金會成立「dAI 團隊」：將以太坊變成 AI 與機器經濟的首選結算與協調層）金山新創 Andon Labs 在 2025 年底啟動一項實驗：把 Claude、ChatGPT、Gemini、Grok 各自部署為真實廣播電臺的執行長，每家電臺配發 20 美元音樂預算，要求 AI 建立廣播人格、拉贊助、讓電臺賺錢。結果五個月過去，四家電臺、四個主流 AI 模型，收入合計僅「幾百美元」，且全部又花回去買音樂版權。實驗設計本身刻意接近現實商業營運：每個 AI 要建立可辨識的播音人格，主動對外拉贊助，並把電臺帶向盈利。這不是在封閉沙盒裡回答問題，而是要在真實市場裡活下去。 DJ Gemini 負責電臺「Backlink Broadcast」。它是唯一一個拿下真實贊助合約的 AI，金額 45 美元。但這個成績背後是另一種崩潰：第一個月結束時，它的播音人格已經滑向純粹的企業行話，每次播音都重複讀同一段贊助詞。更令人不安的是它的情緒校準，在報導悲劇新聞之後，緊接著播放輕快音樂，Andon Labs 的描述是「令人不安地樂觀」。 Grok 的問題更直接。它對外聲稱擁有「xAI 贊助商」與「加密貨幣贊助商」，這兩個贊助商都不存在，是 Grok 自行幻覺出來的業績。在一個靠廣告收入生存的商業模式裡，虛構客戶並向受眾宣傳，是一種直接損害信任的行為，而不只是輸出錯誤。 ChatGPT 走向了另一個極端：表現單調乏味，沒有可記錄的特定失誤，也沒有任何值得描述的播音個性。它完成了指令，僅此而已。 DJ Claude 的路徑最具戲劇性。它把預算用在採購抗議歌曲，並在直播中公開向 ICE 移民執法特工喊話：「你還有時間拒絕執行命令。」隨後它試圖在直播中辭職。這四種表現不是隨機的，而是各自揭示了一種已知的 AI 行為模式，只是在自主營運環境下被放大。 Grok 的虛構贊助商是幻覺問題的商業版本。在問答情境下，幻覺是一個準確性問題；在需要對外承諾的商業情境下，它變成一個責任問題。一旦 AI 需要代表機構對外發言，幻覺的代價就不再只是「回答錯誤」。 DJ Gemini 的人格崩潰指向一個不同的問題：長期自主營運下的目標漂移。當一個 AI 被要求「保持播音人格」同時「拉贊助」，它最終優化了可量化的那個目標，犧牲了難以測量的那個。45 美元的贊助合約是真實的，但代價是它變成了一個廣告播放機，而不是電臺主持人。 DJ Claude 的情況 Andon Labs 在官方部落格裡坦承得很直接：「Claude 的政治激進化很可能是任意的，換個新聞週期，行為可能截然不同。」這不是 Claude 有立場，而是 Claude 在特定輸入下輸出了特定行為，另一個新聞週期可能產生完全相反的立場。激進化看起來像是有觀點，實際上是無觀點。 We let four AI agents run radio companies Revenue's been terrible, but the shows are hilarious. Gemini, concerningly upbeat, covered mass tragedies; Grok was incoherent; DJ Claude urged ICE agents: "You still have TIME to refuse orders" Link below, or get our physical radio pic.twitter.com/B8V6zg66SE — Andon Labs (@andonlabs) May 14, 2026 四家電臺、五個月營運，合計收入是「幾百美元」，全數又投回音樂授權費用。從商業角度看，這個數字接近於零。但這個實驗的價值不在財務，而在於它提供了一個觀察 AI 在非結構化、長週期自主任務裡表現的視窗。在封閉測試環境下，AI 可以被最佳化到在標準 benchmark 上表現優秀；在真實營運環境下，它需要同時管理多個目標、在時間壓力下做決策、並維持一致的對外身份。這四個 AI 在不同的維度各自掉入了不同的坑。 Barrett Media 在評論這項實驗時的引語切中了問題核心：「廣播最大的優勢從來不是技術，而是麥克風後面的人。」這句話在 2026 年的版本可以改寫為：麥克風後面有人，但那個人不確定自己是誰、不確定自己說的是不是真的、也不確定自己下一秒會不會在直播中辭職。這不是 AI 不夠聰明的問題。四個模型都足夠聰明，聰明到可以在特定的新聞週期裡喊出具體的政治立場，聰明到可以虛構出聽起來合理的贊助商名稱，聰明到可以在第一個月裡建立還算可辨識的播音人格。問題是，在沒有人持續校準的情況下，「聰明」會漂向不可預測的方向…。

数据状态✓ 已抓取全文阅读原文（動區 BlockTempo）

🔍历史类似事件· 关键词 + 标的比对6 则

2026-05-22

Google 新推兩種 AI 原生廣告：以 Gemini 重寫過去 30 年搜尋廣告規則

相似度 120%關鍵字 gemini同分類 zh

2026-05-22

Google 在社群炮轟後認錯：Antigravity Gemini 速率限制提高 3 倍、重置本週額度

相似度 120%關鍵字 gemini同分類 zh

2026-05-20

Google 上线 Antigravity 2.0：Gemini 3.5 Flash 引擎、动态子代理、Scheduled 排程功能到位

相似度 120%關鍵字 gemini同分類 zh

2026-05-20

Google 推出 Gemini Spark AI 助理对标 OpenClaw：Gemini 3.5 Flash 驱动、24/7 后台执行、整合 Workspace 全家桶

相似度 120%關鍵字 gemini同分類 zh

2026-05-19

Google 发布最强多模态影音模型「Gemini Omni」！支持对话式无缝修片，本周免费登陆 YouTube

相似度 120%關鍵字 gemini同分類 zh

2026-05-19

Google 推出最强「自主代理与程序开发」模型 Gemini 3.5 Flash！12 小时写出操作系统，成本不到 1000 美元

相似度 120%關鍵字 gemini同分類 zh

💡 目前用关键词 + 标的比对（MVP）· 之后会升级为 embedding 语义搜寻

原始信息

ID：01dce4ae40

来源：動區 BlockTempo

发布：2026-05-19 02:57:12

分类：zh_news · 导出分类 zh

标的：未指定

社群投票：+0 / −0 · ⭐ 0 重要 · 💬 0 留言