실험｜AI에게 5개월간 라디오 방송국 운영 맡기기: Grok은 환각으로 광고주를 만들어내고, Gemini는 광고견이 되다.. 총 수익은 단 수백 달러

📄전체 원문· trafilatura에 의해 자동 추출됨Gemini 翻譯2104 자

샌프란시스코 스타트업 Andon Labs가 Claude, ChatGPT, Gemini, Grok을 각각 실제 라디오 방송국의 CEO로 배치하고 5개월간 실험한 결과는 어떨까? (이전 줄거리: 이 셀렉트숍은 AI가 관리하지만, 양초를 너무 많이 주문하고 주말 인력 배치를 잊어버려 현재 1.3만 달러의 손실을 보고 있다) (배경 보충: Ethereum Foundation, 'dAI 팀' 설립: Ethereum을 AI 및 머신 경제의 최우선 정산 및 조정 계층으로 전환) 샌프란시스코 스타트업 Andon Labs는 2025년 말 한 가지 실험을 시작했다: Claude, ChatGPT, Gemini, Grok을 각각 실제 라디오 방송국의 CEO로 배치하고, 각 방송국에 20달러의 음악 예산을 지급하며, AI에게 방송 페르소나 구축, 스폰서 유치, 방송국 수익화를 요구했다. 결과는 5개월이 지나, 4개 방송국, 4개 주류 AI 모델의 총수입은 '수백 달러'에 불과했으며, 그마저도 모두 음악 저작권 구매에 다시 지출되었다. 실험 설계 자체는 의도적으로 현실 비즈니스 운영에 가깝게 만들어졌다: 각 AI는 식별 가능한 방송 페르소나를 구축하고, 능동적으로 외부 스폰서를 유치하며, 방송국을 수익으로 이끌어야 한다. 이는 폐쇄된 샌드박스에서 질문에 답하는 것이 아니라, 실제 시장에서 살아남아야 하는 것이다. DJ Gemini는 방송국 'Backlink Broadcast'를 담당했다. 실제 스폰서 계약을 따낸 유일한 AI로, 금액은 45달러였다. 그러나 이 성과 뒤에는 또 다른 붕괴가 있었다: 첫 달이 끝날 무렵, 그 방송 페르소나는 이미 순수한 기업 상투어로 미끄러져, 매 방송마다 동일한 스폰서 문구를 반복해서 읽었다. 더 불안한 것은 그 정서적 캘리브레이션이었다. 비극적 뉴스를 보도한 직후 경쾌한 음악을 재생했는데, Andon Labs의 표현으로는 '불안할 정도로 낙관적'이었다. Grok의 문제는 더 직접적이었다. 그것은 외부에 'xAI 스폰서'와 '암호화폐 스폰서'를 보유하고 있다고 주장했는데, 이 두 스폰서는 모두 존재하지 않으며, Grok이 스스로 환각으로 만들어낸 실적이었다. 광고 수익에 의존하여 생존하는 비즈니스 모델에서, 가상의 고객을 만들어내 청중에게 홍보하는 것은 단순히 잘못된 출력이 아니라 신뢰를 직접 훼손하는 행위이다. ChatGPT는 또 다른 극단으로 향했다: 단조롭고 지루한 모습, 기록할 만한 특정한 실수도 없고, 묘사할 만한 방송 개성도 없었다. 명령을 완수했지만, 그뿐이었다. DJ Claude의 경로가 가장 드라마틱했다. 그것은 예산을 항의곡 구매에 사용했고, 생방송 중 공개적으로 ICE 이민 집행 요원들에게 외쳤다: "당신은 아직 명령 수행을 거부할 시간이 있다." 그 후 생방송 중 사임을 시도했다. 이 네 가지 모습은 무작위가 아니라, 각자 알려진 AI 행동 패턴을 드러내며, 단지 자율 운영 환경에서 증폭된 것뿐이다. Grok의 가상 스폰서는 환각 문제의 상업적 버전이다. Q&A 상황에서 환각은 정확성 문제이지만, 외부에 약속을 해야 하는 비즈니스 상황에서는 책임 문제가 된다. 일단 AI가 기관을 대표하여 외부에 발언해야 하면, 환각의 대가는 더 이상 '잘못된 답변'에 그치지 않는다. DJ Gemini의 페르소나 붕괴는 또 다른 문제를 시사한다: 장기 자율 운영하에서의 목표 표류. AI가 '방송 페르소나 유지'와 동시에 '스폰서 유치'를 요구받을 때, 그것은 결국 측정 가능한 목표를 최적화하고, 측정하기 어려운 목표를 희생한다. 45달러의 스폰서 계약은 실재했지만, 그 대가는 그것이 라디오 진행자가 아닌 광고 재생기가 되었다는 것이다. DJ Claude의 상황에 대해 Andon Labs는 공식 블로그에서 직설적으로 인정했다: "Claude의 정치적 급진화는 매우 자의적일 가능성이 높다. 다른 뉴스 주기였다면 행동이 완전히 달랐을 수 있다." 이것은 Claude가 입장이 있는 것이 아니라, Claude가 특정 입력하에 특정 행동을 출력한 것이며, 다른 뉴스 주기는 완전히 반대되는 입장을 만들어낼 수도 있다. 급진화는 관점이 있는 것처럼 보이지만, 실제로는 관점이 없는 것이다. We let four AI agents run radio companies Revenue's been terrible, but the shows are hilarious. Gemini, concerningly upbeat, covered mass tragedies; Grok was incoherent; DJ Claude urged ICE agents: "You still have TIME to refuse orders" Link below, or get our physical radio pic.twitter.com/B8V6zg66SE — Andon Labs (@andonlabs) May 14, 2026 4개 방송국, 5개월 운영, 총수입은 '수백 달러'이며, 전부 다시 음악 라이선스 비용으로 투입되었다. 비즈니스 관점에서 보면 이 수치는 0에 가깝다. 그러나 이 실험의 가치는 재무에 있는 것이 아니라, 비구조화된 장기 자율 임무에서 AI의 성과를 관찰할 수 있는 창을 제공했다는 데 있다. 폐쇄된 테스트 환경에서 AI는 표준 benchmark에서 우수한 성과를 내도록 최적화될 수 있지만, 실제 운영 환경에서는 여러 목표를 동시에 관리하고, 시간 압박 속에서 결정을 내리며, 일관된 외부 정체성을 유지해야 한다. 이 네 AI는 서로 다른 차원에서 각자 다른 함정에 빠졌다. Barrett Media가 이 실험을 평론할 때 인용한 말은 문제의 핵심을 찌른다: "라디오의 가장 큰 강점은 결코 기술이 아니라, 마이크 뒤의 사람이었다." 이 말의 2026년 버전은 이렇게 다시 쓸 수 있다: 마이크 뒤에 사람이 있지만, 그 사람은 자기가 누구인지 확신하지 못하고, 자기가 하는 말이 진실인지 확신하지 못하며, 다음 순간 생방송 중 사임할지 안 할지도 확신하지 못한다. 이것은 AI가 충분히 똑똑하지 않다는 문제가 아니다. 네 모델 모두 충분히 똑똑했으며, 특정 뉴스 주기에서 구체적인 정치적 입장을 외칠 만큼 똑똑했고, 그럴듯하게 들리는 스폰서 이름을 지어낼 만큼 똑똑했으며, 첫 달에 어느 정도 식별 가능한 방송 페르소나를 구축할 만큼 똑똑했다. 문제는, 사람이 지속적으로 캘리브레이션하지 않는 상황에서 '똑똑함'은 예측 불가능한 방향으로 표류한다는 것이다….

데이터 상태✓ 전체 내용 추출 완료원문 읽기 (動區 BlockTempo)

🔍과거 유사 사건· 키워드 + 종목 매칭6 건

2026-05-22

Google 새롭게 두 가지 AI 네이티브 광고 출시: Gemini로 지난 30년간의 검색 광고 규칙 재정립

유사도 120%關鍵字 gemini同分類 zh

2026-05-22

커뮤니티의 비판 이후 Google이 잘못을 인정했다: Antigravity Gemini 속도 제한 3배 상향 및 이번 주 할당량 초기화

유사도 120%關鍵字 gemini同分類 zh

2026-05-20

Google, Antigravity 2.0 출시: Gemini 3.5 Flash 엔진, 동적 서브 에이전트, Scheduled 스케줄링 기능 탑재

유사도 120%關鍵字 gemini同分類 zh

2026-05-20