DeepSeek-R1のハルシネーション発生率はV3の4倍に達しており、Crypto AI Agentトークンにとって危険信号となっている

📄原文全文· trafilatura により自動抽出Gemini 翻譯4126 文字

中国の研究所DeepSeekが開発したフラッグシップ推論モデルDeepSeek-R1は、VectaraのHHEM 2.1ベンチマークによると14.3%のハルシネーション（幻覚）を引き起こす。これは、3.9%を記録した非推論モデルの前身DeepSeek-V3の約4倍の高さである。このギャップは、暗号資産セクターに困難な問いを突きつけている。急速に成長しているAIエージェントトークンのクラスは現在、自律的な取引、シグナル、オンチェーン実行のために推論型LLMに依存している。 Vectaraのデータが示すR1の「過剰な支援」と誤った事実 Vectaraは、DeepSeekの双方のモデルを、同社のハルシネーション評価専用フレームワークであるHHEM 2.1でテストした。チームはGoogleのFACTS手法を用いて結果をクロスチェックした。R1は、すべてのテスト構成においてV3よりも多くの誤った、または裏付けのない記述を生成した。その原因は推論の深さだけではない。Vectaraのアナリストは、R1が「過剰に支援（overhelp）」する傾向があることを発見した。このモデルは、ソーステキストに存在しない情報を付け加える。その追加された詳細は、それ自体は事実として正しくても、ハルシネーションとしてカウントされる。この挙動は、一見健全な回答の中に捏造された文脈を紛れ込ませる。 Vectaraは、Xへの公開投稿でこの発見を直接的に述べた。「DeepSeek-R1は14.3%のハルシネーション率を示しており、DeepSeek-V3の約4倍である」とVectaraは投稿で指摘した。このパターンはDeepSeek特有のものではない。業界のトラッカーは、他の研究所の推論トレーニング済みモデル全体で同様のトレードオフが見られると指摘している。Chain-of-thought（思考の連鎖）を鋭くする強化学習は、より大胆で自信に満ちた生成も報酬として与えてしまうからだ。なぜ暗号資産AIトークンはこのトレードオフに直面するのか暗号資産市場には現在、Virtuals Protocol (VIRTUAL)、ai16z (AI16Z)、aixbt (AIXBT) を筆頭に、数百のAIエージェントトークンが存在する。このカテゴリーは、直近30日間で約39.4%の成長を記録した。Virtuals単体でも時価総額は5億7,600万ドルを超えている。これらのエージェントのほとんどは、大規模言語モデルをツールでラップしている。そのツールにより、エージェントはソーシャルメディアへの投稿、取引のルーティング、トークンのミント、市場コメントの生成などを行う。基盤となるモデルが価格水準、パートナーシップ、またはコントラクトアドレスを捏造した場合、その結果はオンチェーンに及ぶ可能性がある。 BeInCryptoによるAIXBTの分析では、同エージェントが416のトークンを宣伝し、平均19%の利益を上げたことが示された。しかし、同じ表面的なメカニズムは、モデルが失敗した際にフォロワーを誤った判断にさらすリスクも孕んでいる。リスクの範囲は自律性と共に拡大する。センチメントを要約する読み取り専用のエージェントと、トレジャリーの鍵を保持するエージェントでは、賭けられているものが異なる。推論モデルは、複数のステップにわたって計画を立てるエージェントにとって特に魅力的である。しかし、それこそがVectaraの14.3%という数値が最も深刻な影響を与えるユースケースでもある。思考の連鎖の初期段階で発生した単一のハルシネーションは、その後のすべてのダウンストリームのアクションに伝播する可能性がある。 LeCunが主張するアーキテクチャ上の問題 MetaのAIチーフサイエンティストであるYann LeCunは、自己回帰型LLMはハルシネーションから完全に逃れることはできないと長年主張してきた。彼の見解では、アーキテクチャ自体に、現実世界の根拠となるモデルが欠如している。 Chain-of-thoughtに対する強化学習は、数学やコーディングといった狭い領域内では問題を覆い隠すことができる。しかし、根本的な原因は残ったままである。他のフロンティアAI研究所はこれに同意していない。彼らは、検索拡張生成（RAG）、事後学習のファインチューニング、検証

データステータス✓ 全文抽出済み原文を読む（BeInCrypto）

🔍過去の類似イベント· キーワード + 銘柄照合6 件

2026-05-08

Crypto Biz: Wall Street は Bitcoin 以上のものを求めている

類似度 180%關鍵字 more/crypto/than

2026-04-23

100以上のCrypto組織が上院の行動を促す中、CLARITY Actが新たな緊急性を帯びる

類似度 150%關鍵字 more/crypto/than

2026-04-23

100社以上の暗号資産関連企業が、米国の市場構造法案を前進させるよう上院に要請

類似度 150%關鍵字 more/crypto/than

2026-05-11