為什麼 AI 應用公司都開始自己訓練模型？你的用戶數據，就是你的護城河

📄原文全文· trafilatura により自動抽出1950 文字

凡是以長週期代理迴圈為核心產品的公司，正系統性地離開大型實驗室模型、轉向自訓專屬模型。本文源自 Baseten 共同創辦人 Charlie O’Neill 文章，由動區編譯、整理。（前情提要：Cursor 用 Kimi K2.5 訓練模型被抓包！刪推、官方表態急轉彎）（背景補充：Cursor 估值翻倍衝 500 億美元，迎接新一輪 20 億鎂融資）去五年，我每天做的事就是拿一個通用 LLM，教它做特定的事。最初是教 GPT-2 做模組化加法；現在則是教兆參數以上的模型執行有時需要數小時才能完成的任務。 2024 年是「包裝層」之年。Cursor 是最典型的例子：它包裝大型實驗室的模型，超越 GitHub Copilot，成為 AI 輔助編程的首選。 2025 年，Cursor 推出了 Composer。底層基礎是開源的 Kimi，但魔法來自一個完全在內部進行後訓練（post-training）的模型。他們這麼做不是為了省 API 費用，而是因為他們想清楚了一件市場尚未完全定價的事：在 Cursor 裡做好程式碼的 reward signal，只存在於 Cursor 內部，別無他處。 Cursor 只是最顯眼的例子，這件事已成為整個 App 層越來越一致的策略：貼近用戶，理解模型在何時真正有效，然後訓練出更好的模型與產品，讓飛輪轉起來。這個模式一再出現，已不可能只是巧合。任何產品是長流程 agentic loop 的公司，都在離開大型實驗室，轉向用自己互動數據訓練出來的模型。 Decagon、Abridge、OpenEvidence、Hippocratic、Intercom、Chroma、Pinterest、Cognition、Lovable、Notion、Harvey、Gamma、World Labs 等前沿公司，全都在開源權重之上訓練自己的模型。在 Baseten，我們協助這一波公司訓練核心 agent，讓他們從前沿 API 轉移到專業化模型。常見的反駁是：「一般化終將勝過專業化，也就是說預訓練規模會贏，等下一個基礎模型就好。」這個論點在你用算力對抗固定目標時成立。但大多數目標並不固定。「在這個用戶的 repo 裡做好程式碼補全」或「為這位醫生的病患群撰寫好的臨床記錄」，這些都是移動的目標。正確性是透過產品迭代才被發現的。對靜態語料庫做再多的 next-token prediction，也產生不了它。只有針對結果做 RL（被接受 vs. 被拒絕的補全，在真實工作流程中成功 vs. 失敗的 agent 軌跡）才能產生它。而那些結果只存在於產品運行的地方。這是專業化勝過一般化的軸線，也是前沿仍有剩餘空間的軸線。過去一年，在相同能力預算下，專業化開源模型已能穩定匹配甚至超越前沿模型在 in-distribution agentic 任務上的表現；任務的流程越長、越依賴工具使用，這個差距就越大。方向與前沿一致，但機制不同。我們正在獲得接近一個數量級更好的單位經濟效益。原因是組織結構。前沿實驗室的組織方式是「用一個模型服務多個客戶」。專業化要求的是相反：「為細分客戶建構多個模型，與推論堆疊和客戶的數據迴路共同設計。」讓實驗室擅長預訓練的特質（集中式訓練運行、單一模型服務經濟、研究室型組織架構），與讓專業化業務成功所需的特質，存在積極的張力。Fine-tuning API 只是附帶業務，因為它必須是附帶業務。佐證：OpenAI 剛剛棄用了他們的 fine-tuning API。把專業化視為一級業務，意味著承認預訓練規模不是現實世界價值的關鍵限制，而這正是他們整個資本結構所立基的論題。他們可以雇用領域專家，但無濟於事，因為讓 OpenEvidence 或 Abridge 優秀的 98%，不是醫學知識，而是他們建立在產品中的反饋迴路。這一波公司都已想清楚：在軟體成本崩潰之後，唯一能存活的護城河，是擁有一個用任何人都看不到的信號訓練出來的模型。 - 每個用戶 session 都在產生訓練數據 - 每次訓練運行都能產出更好的模型 - 更好的模型吸引更多用戶與更多數據飛輪在產品迴路內轉動，而大型實驗室，無論規模多大，都在這個迴路的外面。每個產品都有一個極其細緻的「什麼是好」的標準。公司現在關心的是模型 UX——這是在訓練時決定的，無法透過 prompt 消除（例如，工具調用或搜尋深度的程度、工具調用的並行性等）。 App 層公司現在問的問題已不再是「我們如何使用 AI？」而是：「我們如何抵抗商品化，為客戶提供更好的結果？」答案是：基於你每天服務對象的獨特理解，訓練出專業化模型。大型實驗室做不到，但你可以。

データステータス✓ 全文抽出済み原文を読む（動區 BlockTempo）

🔍過去の類似イベント· キーワード + 銘柄照合0 件

類似イベントが見つかりません（より多くのデータサンプルまたは embedding 検索が必要です。現在は MVP キーワード照合を使用しています）

原始情報

ID：684b922415

ソース：動區 BlockTempo

公開：2026-05-15 00:49:18

カテゴリ：zh_news · エクスポートカテゴリ zh

銘柄：未指定

コミュニティ投票：+0 / −0 · ⭐ 0 重要 · 💬 0 コメント