뉴스 목록죽은 인터넷? 스탠퍼드에 따르면 신규 웹사이트의 3분의 1이 AI로 생성됨
Decrypt2026-04-28 19:32:26

죽은 인터넷? 스탠퍼드에 따르면 신규 웹사이트의 3분의 1이 AI로 생성됨

ORIGINALDead Internet? A Third of New Websites Are AI-Generated, Says Stanford
AI 영향 분석Grok 분석 중...
📄전체 원문· trafilatura에 의해 자동 추출됨Gemini 翻譯3973 자
요약 - 2025년 중반까지 새로 게시된 웹사이트의 35%가 AI로 생성되었거나 AI의 도움을 받은 것으로 나타났으며, 이는 ChatGPT가 출시된 2022년 11월 이전의 0%에서 급증한 수치입니다. - 확인된 영향은 의미론적 축소와 인위적인 긍정성으로, 대다수의 믿음과는 달리 잘못된 정보나 문체적 동질성은 확인되지 않았습니다. - AI 보급률이 35%에 달함에 따라, 모델 붕괴(model collapse) 위험은 이론적 우려에서 차세대 파운데이션 모델을 위한 실증적 문제로 전환되었습니다. 새로운 연구에 따르면 현재 인터넷의 35%가 AI로 생성된 콘텐츠입니다. Stanford University, Imperial College London, Internet Archive의 연구에 따르면, 2025년 중반 기준으로 새로 게시된 웹사이트 중 AI로 생성되었거나 AI의 도움을 받은 웹사이트의 비중이 이 정도에 달합니다. ChatGPT가 출시된 2022년 11월 이전에는 이 수치가 사실상 0%였습니다. Imperial College London의 연구원이자 해당 논문의 공동 저자인 Jonáš Doležal은 404 Media와의 인터뷰에서 "AI가 웹을 장악하는 속도가 매우 놀랍다"며, "수십 년 동안 인간이 형성해 온 인터넷의 상당 부분이 불과 3년 만에 AI에 의해 정의되게 되었다"고 말했습니다. “The Impact of AI-Generated Text on the Internet”이라는 제목의 이 연구는 Internet Archive의 Wayback Machine에서 33개월간의 웹사이트 스냅샷을 추출하고, Pangram v3라는 AI 텍스트 탐지기를 사용하여 각 페이지를 분류했습니다. 확인된 피해: 사실이 아닌 분위기 연구진은 AI 콘텐츠가 웹에 미치는 영향에 대한 6가지 가설을 검증했습니다. 데이터 분석 결과 오직 두 가지만이 입증되었습니다. 첫째: 우리는 같은 방식으로 행동하는 멍청한 NPC 무리로 변하고 있습니다... 더 과학적으로 표현하자면, 웹의 의미론적 다양성이 줄어들고 있습니다. AI로 생성된 사이트는 인간이 작성한 사이트보다 쌍대 의미론적 유사성 점수가 33% 더 높게 나타났습니다. 같은 아이디어가 거의 같은 방식으로 계속해서 표현되고 있습니다. 이 논문은 온라인의 Overton window가 검열이나 조직적인 캠페인이 아니라, 언어 모델이 학습 데이터 분포에 가까운 결과물을 최적화하기 때문에 좁아지고 있을 가능성을 시사합니다. 둘째: 웹이 지나치게 쾌활해지고 있습니다. AI 콘텐츠는 인간의 콘텐츠보다 긍정적인 감정 점수가 107% 이상 높게 나타났습니다. 연구진은 이를 LLM의 잘 알려진 아첨하는 경향과 연결 짓습니다. 인간의 승인 신호를 학습한 모델은 정제되고 마찰이 없으며 끊임없이 낙관적인 텍스트를 생성합니다. 쾌활하고 동질화된 콘텐츠로 넘쳐나는 인터넷은 누구의 개입 없이도 대규모로 인간의 반대 의견을 소외시킬 수 있습니다. 대중의 널리 퍼진 믿음과는 달리, 이 연구는 AI 콘텐츠가 인터넷의 사실적 정확도를 떨어뜨린다는 통계적으로 유의미한 증거를 발견하지 못했습니다. 연구진은 AI 보급률과 사실 오류율 사이에 의미 있는 상관관계를 찾지 못했습니다. 문체적 단일 문화 가설(AI가 개인의 목소리를 일반적이고 획일적인 어조로 평탄화한다는 주장)은 응답자들이 가장 강하게 믿는 내용(83% 동의)이었으나, 데이터는 이를 확인해주지 않았습니다. 문자 수준의 분석 결과, AI 보급률과 관련된 문체적 동질성의 통계적으로 유의미한 증가는 발견되지 않았습니다. 모델 붕괴(model collapse) 문제가 현실화되다 더 넓은 차원의 문제는 담론의 질을 넘어섭니다. AI 보급률이 35%에 달하는 상황에서, 미래의 모델이 AI 생성 데이터를 학습한 후 성능이 저하되는 모델 붕괴의 이론적 위험은 학문적 우려에서 실증적 현실로 바뀌었습니다. 현대의 웹 크롤링 데이터를 학습하는 미래의 파운데이션 모델은 필연적으로 상당 부분이 AI로 생성되었고 의미론적으로 덜 다양한 데이터를 흡수하게 될 것입니다. 연구팀은 현재 Internet Archive와 협력하여 이 연구를 일회성 스냅샷이 아닌, AI의 웹 점유
데이터 상태✓ 전체 내용 추출 완료원문 읽기 (Decrypt)
🔍과거 유사 사건· 키워드 + 종목 매칭2 건
💡 현재 키워드 + 종목 매칭(MVP) 사용 중 · 추후 embedding 의미론적 검색으로 업그레이드 예정
원본 정보
ID:d00bed6da5
출처:Decrypt
발행:2026-04-28 19:32:26
분류:일반 · 도출된 분류 neutral
종목:지정되지 않음
커뮤니티 투표:+0 /0 · ⭐ 0 중요 · 💬 0 댓글
죽은 인터넷? 스탠퍼드에 따르면 신규 웹사이트의 3분의 1이 AI로 생성됨 | Feel.Trading