ニュース一覧DeepSeek-R1のハルシネーション発生率はV3の4倍に達しており、Crypto AI Agentトークンにとって危険信号となっている
BeInCrypto2026-05-11 19:03:07

DeepSeek-R1のハルシネーション発生率はV3の4倍に達しており、Crypto AI Agentトークンにとって危険信号となっている

ORIGINALDeepSeek-R1 Hallucinates 4x More Than V3, Raising Red Flags for Crypto AI Agent Tokens
AI 影響分析Grok が分析中...
📄原文全文· trafilatura により自動抽出Gemini 翻譯4126 文字
中国の研究所DeepSeekが開発したフラッグシップ推論モデルDeepSeek-R1は、VectaraのHHEM 2.1ベンチマークによると14.3%のハルシネーション(幻覚)を引き起こす。これは、3.9%を記録した非推論モデルの前身DeepSeek-V3の約4倍の高さである。 このギャップは、暗号資産セクターに困難な問いを突きつけている。急速に成長しているAIエージェントトークンのクラスは現在、自律的な取引、シグナル、オンチェーン実行のために推論型LLMに依存している。 Vectaraのデータが示すR1の「過剰な支援」と誤った事実 Vectaraは、DeepSeekの双方のモデルを、同社のハルシネーション評価専用フレームワークであるHHEM 2.1でテストした。チームはGoogleのFACTS手法を用いて結果をクロスチェックした。R1は、すべてのテスト構成においてV3よりも多くの誤った、または裏付けのない記述を生成した。 その原因は推論の深さだけではない。Vectaraのアナリストは、R1が「過剰に支援(overhelp)」する傾向があることを発見した。このモデルは、ソーステキストに存在しない情報を付け加える。 その追加された詳細は、それ自体は事実として正しくても、ハルシネーションとしてカウントされる。この挙動は、一見健全な回答の中に捏造された文脈を紛れ込ませる。 Vectaraは、Xへの公開投稿でこの発見を直接的に述べた。 「DeepSeek-R1は14.3%のハルシネーション率を示しており、DeepSeek-V3の約4倍である」とVectaraは投稿で指摘した。 このパターンはDeepSeek特有のものではない。業界のトラッカーは、他の研究所の推論トレーニング済みモデル全体で同様のトレードオフが見られると指摘している。Chain-of-thought(思考の連鎖)を鋭くする強化学習は、より大胆で自信に満ちた生成も報酬として与えてしまうからだ。 なぜ暗号資産AIトークンはこのトレードオフに直面するのか 暗号資産市場には現在、Virtuals Protocol (VIRTUAL)、ai16z (AI16Z)、aixbt (AIXBT) を筆頭に、数百のAIエージェントトークンが存在する。 このカテゴリーは、直近30日間で約39.4%の成長を記録した。Virtuals単体でも時価総額は5億7,600万ドルを超えている。 これらのエージェントのほとんどは、大規模言語モデルをツールでラップしている。そのツールにより、エージェントはソーシャルメディアへの投稿、取引のルーティング、トークンのミント、市場コメントの生成などを行う。 基盤となるモデルが価格水準、パートナーシップ、またはコントラクトアドレスを捏造した場合、その結果はオンチェーンに及ぶ可能性がある。 BeInCryptoによるAIXBTの分析では、同エージェントが416のトークンを宣伝し、平均19%の利益を上げたことが示された。しかし、同じ表面的なメカニズムは、モデルが失敗した際にフォロワーを誤った判断にさらすリスクも孕んでいる。 リスクの範囲は自律性と共に拡大する。センチメントを要約する読み取り専用のエージェントと、トレジャリーの鍵を保持するエージェントでは、賭けられているものが異なる。 推論モデルは、複数のステップにわたって計画を立てるエージェントにとって特に魅力的である。しかし、それこそがVectaraの14.3%という数値が最も深刻な影響を与えるユースケースでもある。 思考の連鎖の初期段階で発生した単一のハルシネーションは、その後のすべてのダウンストリームのアクションに伝播する可能性がある。 LeCunが主張するアーキテクチャ上の問題 MetaのAIチーフサイエンティストであるYann LeCunは、自己回帰型LLMはハルシネーションから完全に逃れることはできないと長年主張してきた。彼の見解では、アーキテクチャ自体に、現実世界の根拠となるモデルが欠如している。 Chain-of-thoughtに対する強化学習は、数学やコーディングといった狭い領域内では問題を覆い隠すことができる。しかし、根本的な原因は残ったままである。 他のフロンティアAI研究所はこれに同意していない。彼らは、検索拡張生成(RAG)、事後学習のファインチューニング、検証
データステータス✓ 全文抽出済み原文を読む(BeInCrypto)
🔍過去の類似イベント· キーワード + 銘柄照合6 件
💡 現在はキーワード + 銘柄照合(MVP)を使用しています · 今後 embedding セマンティック検索へアップグレード予定
原始情報
ID:c7213aac49
ソース:BeInCrypto
公開:2026-05-11 19:03:07
カテゴリ:一般 · エクスポートカテゴリ neutral
銘柄:未指定
コミュニティ投票:+0 /0 · ⭐ 0 重要 · 💬 0 コメント
DeepSeek-R1のハルシネーション発生率はV3の4倍に達しており、Crypto AI Agentトークンにとって危険信号となっている | Feel.Trading