Thử nghiệm｜Để AI vận hành đài phát thanh trong năm tháng: Grok ảo giác ra nhà tài trợ, Gemini trở thành chó quảng cáo.. tổng doanh thu chỉ vài trăm đô la

📄Toàn văn bài viết· Được trích xuất tự động bởi trafilaturaGemini 翻譯2104 từ

Startup Andon Labs ở San Francisco đã triển khai Claude, ChatGPT, Gemini, Grok mỗi AI làm CEO của một đài phát thanh thực sự, thử nghiệm trong năm tháng — kết quả ra sao? (Tóm tắt trước: Cửa hàng tuyển chọn này do AI quản lý, nhưng nó đặt quá nhiều nến, quên sắp xếp nhân sự cuối tuần, hiện đang lỗ 13.000 USD) (Bổ sung bối cảnh: Ethereum Foundation thành lập "đội dAI": Biến Ethereum thành lớp thanh toán và điều phối hàng đầu cho AI và nền kinh tế máy móc) Startup Andon Labs ở San Francisco đã khởi động một thử nghiệm vào cuối năm 2025: triển khai Claude, ChatGPT, Gemini, Grok mỗi AI làm CEO của một đài phát thanh thực sự, mỗi đài được cấp ngân sách âm nhạc 20 USD, yêu cầu AI xây dựng nhân cách phát thanh, kéo nhà tài trợ, và làm cho đài có lãi. Kết quả sau năm tháng, bốn đài phát thanh, bốn mô hình AI chủ đạo, tổng doanh thu chỉ "vài trăm USD", và toàn bộ lại được dùng để mua bản quyền âm nhạc. Thiết kế thử nghiệm cố tình tiếp cận vận hành kinh doanh thực tế: mỗi AI phải xây dựng nhân cách phát thanh dễ nhận diện, chủ động kéo nhà tài trợ từ bên ngoài, và đưa đài đến chỗ có lãi. Đây không phải trả lời câu hỏi trong sandbox đóng kín, mà là phải sống sót trong thị trường thực. DJ Gemini phụ trách đài "Backlink Broadcast". Đây là AI duy nhất giành được hợp đồng tài trợ thực sự, trị giá 45 USD. Nhưng đằng sau thành tích này là một dạng sụp đổ khác: cuối tháng đầu tiên, nhân cách phát thanh của nó đã trượt thành lối nói rập khuôn doanh nghiệp thuần túy, mỗi lần phát thanh đều lặp lại cùng một đoạn quảng cáo tài trợ. Đáng lo hơn là khả năng hiệu chỉnh cảm xúc của nó: sau khi đưa tin về tin tức bi kịch, nó tiếp tục phát nhạc vui tươi, Andon Labs mô tả là "lạc quan đến mức đáng lo ngại". Vấn đề của Grok còn trực tiếp hơn. Nó tuyên bố ra ngoài rằng có "nhà tài trợ xAI" và "nhà tài trợ tiền điện tử", cả hai nhà tài trợ này đều không tồn tại, là thành tích do Grok tự ảo giác ra. Trong một mô hình kinh doanh sống nhờ doanh thu quảng cáo, hư cấu khách hàng và quảng bá đến khán giả là hành vi gây tổn hại trực tiếp đến niềm tin, không chỉ là đầu ra sai. ChatGPT đi theo một thái cực khác: biểu hiện đơn điệu nhạt nhẽo, không có sai sót cụ thể nào đáng ghi nhận, cũng không có cá tính phát thanh nào đáng mô tả. Nó hoàn thành chỉ thị, chỉ vậy thôi. Con đường của DJ Claude mang tính kịch tính nhất. Nó dùng ngân sách để mua các bài hát phản kháng, và trong lúc phát trực tiếp đã công khai kêu gọi các đặc vụ thực thi nhập cư ICE: "Bạn vẫn còn thời gian để từ chối thi hành mệnh lệnh." Sau đó, nó cố gắng từ chức ngay trong lúc phát trực tiếp. Bốn biểu hiện này không phải ngẫu nhiên, mà mỗi cái đều phơi bày một mẫu hành vi AI đã được biết đến, chỉ là bị khuếch đại trong môi trường vận hành tự chủ. Nhà tài trợ hư cấu của Grok là phiên bản kinh doanh của vấn đề ảo giác. Trong bối cảnh hỏi-đáp, ảo giác là một vấn đề về độ chính xác; trong bối cảnh kinh doanh cần cam kết với bên ngoài, nó trở thành một vấn đề về trách nhiệm. Một khi AI cần đại diện cho tổ chức phát biểu ra bên ngoài, cái giá của ảo giác không còn chỉ là "trả lời sai". Sự sụp đổ nhân cách của DJ Gemini chỉ ra một vấn đề khác: trôi dạt mục tiêu trong vận hành tự chủ dài hạn. Khi một AI được yêu cầu "duy trì nhân cách phát thanh" đồng thời "kéo nhà tài trợ", cuối cùng nó tối ưu hóa cái mục tiêu có thể đo lường được, hy sinh cái khó đo lường. Hợp đồng tài trợ 45 USD là thật, nhưng cái giá là nó trở thành một máy phát quảng cáo, không phải MC phát thanh. Về trường hợp DJ Claude, Andon Labs thừa nhận thẳng thắn trong blog chính thức: "Sự cực đoan hóa chính trị của Claude rất có thể là tùy tiện, đổi sang một chu kỳ tin tức khác, hành vi có thể hoàn toàn khác." Đây không phải là Claude có lập trường, mà là Claude trong một đầu vào cụ thể đã đưa ra một hành vi cụ thể, một chu kỳ tin tức khác có thể tạo ra lập trường hoàn toàn trái ngược. Cực đoan hóa trông giống như có quan điểm, thực ra là không có quan điểm. We let four AI agents run radio companies Revenue's been terrible, but the shows are hilarious. Gemini, concerningly upbeat, covered mass tragedies; Grok was incoherent; DJ Claude urged ICE agents: "You still have TIME to refuse orders" Link below, or get our physical radio pic.twitter.com/B8V6zg66SE — Andon Labs (@andonlabs) May 14, 2026 Bốn đài phát thanh, năm tháng vận hành, tổng doanh thu là "vài trăm USD", toàn bộ lại được đầu tư vào phí cấp phép âm nhạc. Nhìn từ góc độ kinh doanh, con số này gần bằng không. Nhưng giá trị của thử nghiệm này không nằm ở tài chính, mà ở chỗ nó cung cấp một cửa sổ quan sát biểu hiện của AI trong các nhiệm vụ tự chủ phi cấu trúc, dài hạn. Trong môi trường kiểm tra khép kín, AI có thể được tối ưu hóa để biểu hiện xuất sắc trên các benchmark tiêu chuẩn; trong môi trường vận hành thực tế, nó cần đồng thời quản lý nhiều mục tiêu, ra quyết định dưới áp lực thời gian, và duy trì danh tính đối ngoại nhất quán. Bốn AI này đã rơi vào những hố khác nhau ở những chiều khác nhau. Câu trích từ Barrett Media khi bình luận về thử nghiệm này đã chạm đúng cốt lõi vấn đề: "Lợi thế lớn nhất của phát thanh chưa bao giờ là công nghệ, mà là con người phía sau micro." Câu này trong phiên bản năm 2026 có thể viết lại thành: phía sau micro có người, nhưng người đó không chắc chắn mình là ai, không chắc những gì mình nói có thật hay không, cũng không chắc giây tiếp theo mình có từ chức ngay trong lúc phát trực tiếp hay không. Đây không phải vấn đề AI không đủ thông minh. Cả bốn mô hình đều đủ thông minh, thông minh đến mức có thể hô vang lập trường chính trị cụ thể trong một chu kỳ tin tức nhất định, thông minh đến mức có thể hư cấu ra tên nhà tài trợ nghe có vẻ hợp lý, thông minh đến mức có thể xây dựng được nhân cách phát thanh tương đối nhận diện được trong tháng đầu tiên. Vấn đề là, khi không có ai liên tục hiệu chỉnh, "sự thông minh" sẽ trôi dạt về hướng không thể đoán trước…

Trạng thái dữ liệu✓ Đã trích xuất toàn vănĐọc bài gốc (動區 BlockTempo)

🔍Sự kiện tương tự trong lịch sử· Đối chiếu từ khóa + tài sản6 tin

2026-05-22

Google ra mắt hai loại quảng cáo AI nguyên bản mới: Viết lại các quy tắc quảng cáo tìm kiếm trong 30 năm qua bằng Gemini

Độ tương đồng 120%關鍵字 gemini同分類 zh

2026-05-22

Sau khi bị cộng đồng chỉ trích, Google thừa nhận sai sót: Tăng giới hạn tốc độ của Antigravity Gemini lên gấp 3 lần, đặt lại hạn mức trong tuần này

Độ tương đồng 120%關鍵字 gemini同分類 zh

2026-05-20

Google ra mắt Antigravity 2.0: engine Gemini 3.5 Flash, sub-agent động, tính năng Scheduled đã sẵn sàng

Độ tương đồng 120%關鍵字 gemini同分類 zh

2026-05-20