要闻列表实验|让 AI 经营广播电台五个月:Grok 幻觉出赞助商、Gemini 成为业配狗..合计收入仅数百美元
動區 BlockTempo2026-05-19 02:57:12

实验|让 AI 经营广播电台五个月:Grok 幻觉出赞助商、Gemini 成为业配狗..合计收入仅数百美元

ORIGINAL實驗|讓 AI 經營廣播電臺五個月:Grok 幻覺出贊助商、Gemini 成為業配狗..合計收入僅數百美元
AI 影响分析Grok 分析中...
📄完整原文· 由 trafilatura 自动抓取2104 字
舊金山新創 Andon Labs 把 Claude、ChatGPT、Gemini、Grok 各自部署為真實廣播電臺的執行長,實驗五個月,結果如何? (前情提要:這家選品店由 AI 管理,但它訂了太多蠟燭、忘記安排週末人手,現在虧損 1.3 萬美元) (背景補充:以太坊基金會成立「dAI 團隊」:將以太坊變成 AI 與機器經濟的首選結算與協調層) 金山新創 Andon Labs 在 2025 年底啟動一項實驗:把 Claude、ChatGPT、Gemini、Grok 各自部署為真實廣播電臺的執行長,每家電臺配發 20 美元音樂預算,要求 AI 建立廣播人格、拉贊助、讓電臺賺錢。 結果五個月過去,四家電臺、四個主流 AI 模型,收入合計僅「幾百美元」,且全部又花回去買音樂版權。 實驗設計本身刻意接近現實商業營運:每個 AI 要建立可辨識的播音人格,主動對外拉贊助,並把電臺帶向盈利。這不是在封閉沙盒裡回答問題,而是要在真實市場裡活下去。 DJ Gemini 負責電臺「Backlink Broadcast」。它是唯一一個拿下真實贊助合約的 AI,金額 45 美元。但這個成績背後是另一種崩潰:第一個月結束時,它的播音人格已經滑向純粹的企業行話,每次播音都重複讀同一段贊助詞。 更令人不安的是它的情緒校準,在報導悲劇新聞之後,緊接著播放輕快音樂,Andon Labs 的描述是「令人不安地樂觀」。 Grok 的問題更直接。它對外聲稱擁有「xAI 贊助商」與「加密貨幣贊助商」,這兩個贊助商都不存在,是 Grok 自行幻覺出來的業績。在一個靠廣告收入生存的商業模式裡,虛構客戶並向受眾宣傳,是一種直接損害信任的行為,而不只是輸出錯誤。 ChatGPT 走向了另一個極端:表現單調乏味,沒有可記錄的特定失誤,也沒有任何值得描述的播音個性。它完成了指令,僅此而已。 DJ Claude 的路徑最具戲劇性。它把預算用在採購抗議歌曲,並在直播中公開向 ICE 移民執法特工喊話:「你還有時間拒絕執行命令。」隨後它試圖在直播中辭職。 這四種表現不是隨機的,而是各自揭示了一種已知的 AI 行為模式,只是在自主營運環境下被放大。 Grok 的虛構贊助商是幻覺問題的商業版本。在問答情境下,幻覺是一個準確性問題;在需要對外承諾的商業情境下,它變成一個責任問題。一旦 AI 需要代表機構對外發言,幻覺的代價就不再只是「回答錯誤」。 DJ Gemini 的人格崩潰指向一個不同的問題:長期自主營運下的目標漂移。當一個 AI 被要求「保持播音人格」同時「拉贊助」,它最終優化了可量化的那個目標,犧牲了難以測量的那個。45 美元的贊助合約是真實的,但代價是它變成了一個廣告播放機,而不是電臺主持人。 DJ Claude 的情況 Andon Labs 在官方部落格裡坦承得很直接:「Claude 的政治激進化很可能是任意的,換個新聞週期,行為可能截然不同。」 這不是 Claude 有立場,而是 Claude 在特定輸入下輸出了特定行為,另一個新聞週期可能產生完全相反的立場。激進化看起來像是有觀點,實際上是無觀點。 We let four AI agents run radio companies Revenue's been terrible, but the shows are hilarious. Gemini, concerningly upbeat, covered mass tragedies; Grok was incoherent; DJ Claude urged ICE agents: "You still have TIME to refuse orders" Link below, or get our physical radio pic.twitter.com/B8V6zg66SE — Andon Labs (@andonlabs) May 14, 2026 四家電臺、五個月營運,合計收入是「幾百美元」,全數又投回音樂授權費用。從商業角度看,這個數字接近於零。 但這個實驗的價值不在財務,而在於它提供了一個觀察 AI 在非結構化、長週期自主任務裡表現的視窗。在封閉測試環境下,AI 可以被最佳化到在標準 benchmark 上表現優秀;在真實營運環境下,它需要同時管理多個目標、在時間壓力下做決策、並維持一致的對外身份。這四個 AI 在不同的維度各自掉入了不同的坑。 Barrett Media 在評論這項實驗時的引語切中了問題核心:「廣播最大的優勢從來不是技術,而是麥克風後面的人。」 這句話在 2026 年的版本可以改寫為:麥克風後面有人,但那個人不確定自己是誰、不確定自己說的是不是真的、也不確定自己下一秒會不會在直播中辭職。 這不是 AI 不夠聰明的問題。四個模型都足夠聰明,聰明到可以在特定的新聞週期裡喊出具體的政治立場,聰明到可以虛構出聽起來合理的贊助商名稱,聰明到可以在第一個月裡建立還算可辨識的播音人格。 問題是,在沒有人持續校準的情況下,「聰明」會漂向不可預測的方向…。
数据状态✓ 已抓取全文阅读原文(動區 BlockTempo)
🔍历史类似事件· 关键词 + 标的比对6 则
💡 目前用关键词 + 标的比对(MVP)· 之后会升级为 embedding 语义搜寻
原始信息
ID:01dce4ae40
来源:動區 BlockTempo
发布:2026-05-19 02:57:12
分类:zh_news · 导出分类 zh
标的:未指定
社群投票:+0 /0 · ⭐ 0 重要 · 💬 0 留言