要闻列表YC CEO Garry Tan 分享如何打造你的 AI「第二大腦」,胖技能+薄框架 (附免費下載包)
動區 BlockTempo2026-05-12 07:02:33

YC CEO Garry Tan 分享如何打造你的 AI「第二大腦」,胖技能+薄框架 (附免費下載包)

ORIGINALYC CEO Garry Tan 分享如何打造你的 AI「第二大腦」,胖技能+薄框架 (附免費下載包)
AI 影响分析Grok 分析中...
📄完整原文· 由 trafilatura 自动抓取4773 字
Y Combinator CEO Garry Tan 在 X 分享他如何用「胖技能、胖程式碼、薄框架」架構打造可複利的個人 AI 系統:10 萬頁知識庫、100 個以上可組合技能、書籍鏡像等實例,以及讓技能自己創造技能的 Skillify 循環。 (前情提要:Anthropic 發布 10 款金融 AI 代理:讀法說會與財報、Pitchbook 製作、月底結帳,Claude 全自動幫你做) (背景補充:急了?OpenAI 開砲 Anthropic 年營收灌水 80 億美元,真實收入不及 ChatGPT) 家一直問我為什麼每天凌晨兩點還在寫程式。我有份很重的工作:Y Combinator 的 CEO,每年幫助數千名創辦人打造真正的新創,追求真實的營收和快速成長。 過去五個月,AI 讓我重新成為一個創造者。去年底,工具好到讓我回去打造東西了。不是玩具專案,而是真正能複利的系統。我想用具體例子展示,當你不再把個人 AI 當作聊天視窗、而是當作作業系統來使用時,它真正的樣子是什麼。 我把這一切做成開源,寫成文章,因為我希望你能跟上我的速度。 這是系列文章的一部分:胖技能、胖程式碼、薄框架介紹了核心架構;解析器涵蓋了智能路由表;LOC 爭議談的是每個技術人如何把自己乘以 100 到 1000 倍;裸模型更笨論証了模型是引擎不是車;Skillify 宣言解釋了為什麼 LangChain 融資 1.6 億美元給了你一套重訓設備卻沒有訓練計劃。 上個月我在讀 Pema Chödrön 的《當事情崩解》,162 頁,22 章,談佛學對於苦難、失根和放手的觀點。一位朋友在我艱難時期推薦給我。 我請 AI 做一個「書籍鏡像」。 具體來說:系統提取書的全部 22 章,對每一章同時執行兩件事的子代理:摘要作者的想法,然後把每個想法對應到我的真實生活。不是泛泛的「這對領導者適用」的廢話,而是具體的映射。它知道我的家族史(移民父母,爸爸來自香港和新加坡,媽媽來自緬甸)。它知道我的職業背景(經營 YC、打造開源工具、輔導數千名創辦人)。它知道我在讀什麼、凌晨兩點在想什麼、我和治療師在探索什麼。 輸出是一份 30,000 字的報告。每章呈現為兩欄:Pema 說了什麼,以及它如何映射到我實際正在經歷的事情。關於失根的那章,連結到我前一週與某位創辦人的具體對話。關於恐懼的那章,映射到我治療師識別出的模式。關於放手的那章,引用了我深夜寫下關於今年找到的創作自由的紀錄。 整件事花了大約 40 分鐘。一位每小時收費 300 美元的治療師讀完這本書並應用到我的生活上,40 小時也做不到這件事,因為他們沒有把我的職業背景、閱讀史、會議記錄和創辦人關係全部載入並可交叉查詢。 我現在已經用這個方式讀了 20 多本書:Amplified(Dion Lim)、Bertrand Russell 自傳、《設計你的人生》、《資優兒童的劇本》、《有限與無限的遊戲》、《海的禮物》、《悉達多》(赫塞)、《荒野之狼》(赫塞)、《做科學與工程的藝術》(Hamming)、《夢想機器》、《禁止了解自己的禁忌之書》(Alan Watts)、《你管別人怎麼想》(費曼)、《當事情崩解》(Pema Chödrön)、《一切的簡史》(Ken Wilber)等等。 每一本都因為「腦」變得更豐富而變得更有價值。第二個鏡像知道第一個的存在,第二十個知道前面十九個的一切。 第一個書籍鏡像很糟糕。第一版有三個關於我家族的事實錯誤:說我父母離婚了,但他們沒有;說我在香港長大,但我其實生在加拿大。 所以我加了一個強制查核步驟。現在每個鏡像在輸出前都會對「腦」中的已知事實做跨模態評估。Opus 4.7 1M 抓精確度錯誤,GPT-5.5 抓缺失的背景,DeepSeek V4-Pro 抓看起來太泛化的內容。 然後升級到搭配 GBrain 工具使用的深度檢索。原始版本善於綜合卻弱於具體性。第三版每個段落都做腦部搜尋,每個右欄條目都引用實際的腦頁。當書中談到處理困難對話時,它不只是綜合一般原則,而是從我實際和特定創辦人(正在跟共同創辦人進行艱難對話的那些人)的會議記錄中提取。或者那個我週四跟弟弟 James 出去玩時產生的想法。或者我 19 歲時跟大學室友聊天的紀錄。那種感覺有點詭異。 這就是技能化(skillification)在實踐中的意義:我把第一次手動嘗試提取成可重複的模式,寫成一個帶有觸發條件和邊緣案例的測試過技能文件,每一次修正都複利到所有後續的書籍鏡像上。 這裡變得有點遞迴,也是我認為最大的洞見所在。 運作我生活的這個系統,並非作為一個整體存在,它是由技能組裝而來的。而那些技能,本身也是由一個技能創造的。 Skillify 是一個能創造新技能的元技能。 當我遇到一個要重複的工作流程,我說「skillify this」,它就會檢查剛才發生了什麼,提取可重複的模式,寫出一個帶有觸發條件和邊緣案例的測試過技能文件,並在解析器中註冊。書籍鏡像流程,是我第一次手動做了之後被技能化的。會議準備工作流程,是在我注意到自己每次通話前都在做相同步驟後被技能化的。 技能可以組合。書籍鏡像呼叫 brain-ops 做存儲、enrich 做背景擴充、cross-modal-eval 做品質控制、pdf-generation 做輸出。每個技能專注於一件事,它們串連在一起創造複雜的工作流程。當我改善一個技能,所有使用它的工作流程都自動變好。 Demis Hassabis 來 YC 做一場爐邊談話,Sebastian Mallaby 為他寫的傳記剛好剛出版。 我請系統幫我備課。 不到兩分鐘,它提取出:Demis 的完整腦頁(幾個月來從文章、播客逐字稿和我的筆記累積而來)、他公開表明的 AGI 時間線觀點(「50% 靠擴展、50% 靠創新」,認為 AGI 在 5–10 年內)、Mallaby 傳記重點、他陳述的研究優先事項(持續學習、世界模型、長期記憶)、對照我公開表達過的 AI 觀點的交叉引用、三個用於在對話中展示「腦」的多跳推理能力的示範腳本,以及根據我們世界觀重疊和分歧之處設計的對話鉤子。 這不只是更好的 Google 搜尋。這是一種利用我對 Demis 累積的背景、我自己的立場,以及對這場對話的戰略目標,所做的準備。系統備課的不只是事實,還有角度。 我維護一個約 10 萬頁的結構化知識庫。每個認識的人都有一頁,包含時間線、狀態欄位(目前真實的情況)、未解的線索和一個評分。每次會議都有逐字稿、結構化摘要,以及我稱之為「實體傳播」的機制:每次會議後,系統遍歷所有提到的人和公司,用討論過的內容更新他們的腦頁。 每本讀過的書有章節鏡像。每 篇文章、Podcast 和影片都被攝入、標記和交叉引用。 結構很簡單。每頁有:頂部的「已編譯的真相」(目前最佳理解)、下方的僅追加時間線(按時間順序的事件),以及源材料的原始數據附件。把它想像成一個個人維基百科,每一頁都由一個「參加了會議、讀了郵件、看了演講、攝入了 PDF」的 AI 持續更新。 這就是文件系統和神經系統的差別。文件系統存儲東西。神經系統連接它們、標記有什麼改變,並浮現出與當下相關的事物。 這是系統的運作方式。我認為這是打造個人 AI 的正確方式,我把整個系統開源了,讓你可以自己打造。 框架(Harness)要薄。 OpenClaw 是執行環境,接收我的訊息、判斷哪個技能適用、然後分派。幾千行路由邏輯。它對書籍、會議或創辦人什麼都不知道,只負責路由。 技能要胖。 現在超過 100 個,每個都是一個自成一體的 Markdown 文件,帶有對一個特定任務的詳細指令。除了上面描述的書籍鏡像和會議準備,還有: - meeting-ingestion:每次會議後,提取逐字稿,創建結構化摘要,然後遍歷所有提到的人和公司,用討論內容更新他們的腦頁。會議頁不是最終產品,傳播回每個人和公司頁的實體更新才是真正的價值。 - enrich:給它一個人名,從五個不同來源提取,合併成一個帶有職涯弧線、聯繫方式、會議紀錄和關係背景的單一腦頁,每個聲明都有引用來源。 - media-ingest:處理影片、音訊、PDF、截圖、GitHub 倉庫。轉錄、提取實體、存入正確的腦位置。 - perplexity-research:腦增強型網路研究。透過 Perplexity 搜尋網路,但在綜合之前先檢查腦中已知的內容,能告訴你什麼真的是新的、什麼你已經記錄過了。 數據要胖。 腦倉庫中的 10 萬頁結構化知識,每個互動過的人、公司、會議、書籍、文章和想法,全部連結、全部可搜尋、每天都在成長。 模型是可替換的。 Opus 4.7 1M 用於精確度,GPT-5.5 用於召回和完整提取,DeepSeek V4-Pro 用於創意工作和第三視角,Groq + Llama 用於速度。技能決定為哪個任務呼叫哪個模型,框架不在乎。當有人問「哪個 AI 模型最好」,答案是:問錯問題了。模型只是引擎,其他一切才是車。 人們問我生產力。我不這樣思考,我想的是複利。 每次會議都添加到腦中。每本書都豐富了下一本書的背景。每個打造的技能都讓下一個工作流程更快。每個更新的人物頁都讓下次會議準備更敏銳。今天的系統是兩個月前的 10 倍,兩個月後又會是現在的 10 倍。 當我凌晨兩點還在寫程式時(確實如此,因為 AI 還給了我打造東西的喜悅),我不只是在寫軟體。我在添加到一個每小時都在變好的系統中。100 個排程任務 24/7 運行。會議攝入自動執行。郵件分類每 10 分鐘執行一次。知識圖譜從每次對話自我豐富。 這不是寫作工具,不是搜尋引擎,不是聊天機器人。這是一個真正運作的第二大腦,不是比喻,而是一個有 10 萬頁、100 個以上技能、每天 100 個排程任務的運行系統,累積了我過去一年參與的每段職業關係、會議、書籍和想法的背景。 OpenClaw、Hermes Agent,或用 Pi 從頭打造自己的。保持它的薄,框架只是路由器。在家裡的備用電腦上用 Tailscale 自架,或用 Render / Railway 在雲端跑。 GBrain 是最佳的檢索系統(在 LongMemEval 上達到 97.6% 召回率,且沒有在檢索循環中使用 LLM),隨附 39 個可安裝技能。一個指令安裝,一個 git 倉庫,每個人、會議、文章和想法都有一頁。 不要從規劃技能架構開始。先做一件事:寫一份報告、研究一個人、下載一個賽季的 NBA 數據並為你的體育預測建模、分析你的投資組合…任何你真正在乎的事。 用你的代理做,反覆迭代直到夠好,然後跑 Skillify 把模式提取成可重用的技能。那個循環把一次性工作變成複利基礎設施。 技能一開始會很平庸,這就是重點。使用它,讀它產出的東西,當有什麼不對時,跑跨模態評估:把輸出送過多個模型,讓它們在你在乎的維度上互相評分。 六個月後你會擁有任何聊天機器人都無法複製的東西,因為價值不在模型,而在你教給系統的關於你的具體生活、工作和判斷的一切。 我用這個系統打造的第一個東西很糟糕。第一百個是我願意信任它管理我的日曆、收件匣、會議準備和閱讀清單的東西。系統學習了,我也學習了。複利曲線是真實的。 胖技能。胖程式碼。薄框架。LLM 本身只是一個引擎,你可以打造自己的車。 這裡描述的一切,所有技能、書籍鏡像流程、跨模態評估框架、Skillify 循環、解析器架構,以及 30 個以上可安裝的技能包 — 全部開源且免費:github.com/garrytan/gbrain。去打造吧。 瀏覽《原文》
数据状态✓ 已抓取全文阅读原文(動區 BlockTempo)
🔍历史类似事件· 关键词 + 标的比对1 则
💡 目前用关键词 + 标的比对(MVP)· 之后会升级为 embedding 语义搜寻
原始信息
ID:a003dcc370
来源:動區 BlockTempo
发布:2026-05-12 07:02:33
分类:zh_news · 导出分类 zh
标的:未指定
社群投票:+0 /0 · ⭐ 0 重要 · 💬 0 留言