ニュース一覧「Dead Internet」?Stanfordによれば、新規ウェブサイトの3分の1はAI生成
Decrypt2026-04-28 19:32:26

「Dead Internet」?Stanfordによれば、新規ウェブサイトの3分の1はAI生成

ORIGINALDead Internet? A Third of New Websites Are AI-Generated, Says Stanford
AI 影響分析Grok が分析中...
📄原文全文· trafilatura により自動抽出Gemini 翻譯3973 文字
要約 - 2025年半ばまでに、新規公開されたウェブサイトの35%がAI生成またはAI支援によるものとなり、ChatGPTが公開された2022年11月以前のゼロから急増した。 - 確認された影響は、多くの人が信じているような誤情報や文体の均質化ではなく、意味の収縮と人工的なポジティブさである。 - AIの普及率が35%に達したことで、モデル崩壊(model collapse)のリスクは理論上の懸念から、次世代の基盤モデルにとっての経験的な問題へと移行した。 インターネットのどれくらいが現在AIによって生成されているかを示す数値が、新しい研究で明らかになった。35%である。Stanford University、Imperial College London、およびInternet Archiveの研究によると、これは2025年半ばまでにAI生成またはAI支援と分類された新規公開ウェブサイトの割合である。2022年11月にChatGPTが公開される前、この数値は実質的にゼロだった。 「AIがウェブを乗っ取るスピードの速さに非常に驚いています」と、Imperial College Londonの研究者であり、論文の共著者であるJonáš Doležalは404 Mediaに語った。「人間が数十年にわたって形作ってきたインターネットの大部分が、わずか3年でAIによって定義されるようになりました」 「The Impact of AI-Generated Text on the Internet」と題されたこの研究は、Internet ArchiveのWayback Machineから取得した33か月分のウェブサイトのスナップショットを基にしており、Pangram v3と呼ばれるAIテキスト検出器を使用して各ページを分類した。 確認された害:事実ではなく「雰囲気」 研究者たちは、AIコンテンツがウェブにどのような影響を与えるかについて6つの仮説を検証した。データ精査の結果、裏付けられたのは2つだけだった。 1つ目:私たちは同じように振る舞う愚かなNPCの群れになりつつある……あるいは、より科学的に言えば、ウェブの意味的な多様性が低下している。 AI生成サイトは、人間が書いたサイトよりもペアワイズ意味的類似度スコアが33%高かった。同じアイデアが、ほぼ同じ方法で繰り返し表現されている。 この論文は、オンラインのオーバートンウィンドウが、検閲や組織的なキャンペーンによってではなく、言語モデルがトレーニングデータの分布に近い出力を最適化するために狭まっている可能性を示唆している。 2つ目:ウェブは過度に陽気になっている。 AIコンテンツは、人間によるコンテンツよりもポジティブな感情スコアが107%以上高かった。研究者たちはこれを、LLMの十分に文書化された追従的傾向と結びつけている。人間の承認シグナルに基づいてトレーニングされているため、彼らは浄化され、摩擦がなく、絶え間なく前向きなテキストを生成する。 陽気で均質化されたコンテンツで溢れかえったインターネットは、誰もレバーを引くことなく、大規模に人間の異論を疎外する可能性がある。 世間一般の広く信じられていることとは裏腹に、この研究では、AIコンテンツがインターネットの事実正確性を低下させているという統計的に有意な証拠は見つからなかった。研究者たちは、AIの普及率と事実誤認率の間に意味のある相関関係を見出せなかった。 文体のモノカルチャー仮説(AIが個々の声を一般的な均一なトーンに平坦化するという説)は、回答者が最も強く信じていたもの(83%が同意)だったが、データはそれを裏付けなかった。文字レベルの分析では、AIの普及に関連した文体の均質化の統計的に有意な増加は見られなかった。 モデル崩壊(model collapse)の問題が現実のものに より広範なリスクは、言説の質を超えている。AIの普及率が35%に達したことで、AI生成データでトレーニングされた将来のモデルが劣化するというモデル崩壊の理論的リスクは、学術的な懸念から経験的な現実へと移行した。現代のウェブクロールでトレーニングされる将来の基盤モデルは、必然的にAI生成の割合が高く、意味的な多様性が測定可能なほど低いデータを取り込むことになる。 チームは現在、Internet Archiveと協力して、この研究を一回限りのスナップショットではなく、AIのウェブシェアをリアルタイムで追跡する継続的なライブ監視ツールへと発展させる作業を進めている。 この研究と並行して実施された米国の調査では、ほとんどのアメリカ人が、データが裏付けていないものを含め、6つの否定的な仮説すべてをすでに信じていることがわかった。AIを頻繁に使用しない人は、頻繁に使用する人よりも12%高い確率でこれらの害を信じていた。「Dead Internet
データステータス✓ 全文抽出済み原文を読む(Decrypt)
🔍過去の類似イベント· キーワード + 銘柄照合2 件
💡 現在はキーワード + 銘柄照合(MVP)を使用しています · 今後 embedding セマンティック検索へアップグレード予定
原始情報
ID:d00bed6da5
ソース:Decrypt
公開:2026-04-28 19:32:26
カテゴリ:一般 · エクスポートカテゴリ neutral
銘柄:未指定
コミュニティ投票:+0 /0 · ⭐ 0 重要 · 💬 0 コメント
「Dead Internet」?Stanfordによれば、新規ウェブサイトの3分の1はAI生成 | Feel.Trading