要闻列表这个 AI 将“全人类烹饪”压缩到了 2 兆字节
Decrypt2026-05-28 14:07:02

这个 AI 将“全人类烹饪”压缩到了 2 兆字节

ORIGINALThis AI Compressed 'All Human Cooking' Into 2 Megabytes
AI 影响分析Grok 分析中...
📄完整原文· 由 trafilatura 自动抓取Gemini 翻譯4837 字
簡要說明 - KAIKAKU.AI 發布了 Epicure,這是一個由三個食材 AI 模型組成的家族,訓練資料涵蓋 414 萬份多語言食譜。 - 該模型並不儲存食譜——它儲存的是從食譜中學到的內容,讓用戶能夠以數學方式探索烹飪知識。 - 三個版本——Cooc、Chem 和 Core——分別位於食譜情境與風味化學光譜的不同位置,各自從同一個 2MB 檔案中回答略有不同的烹飪問題。 Josef Chen 表示他將全人類的烹飪知識壓縮進了兩兆位元組。這是一個大膽的宣稱。而事實也確實如此。 Chen 是倫敦食品 AI 新創公司 KAIKAKU.AI 的共同創辦人兼 CEO,本週他與研究員 Jakub Radzikowski 一同在 arXiv 上發表了一篇論文,介紹了 Epicure——三個 AI 模型,訓練資料來自 11 個資料集、橫跨七種語言的 414 萬份食譜。其成果是:一張涵蓋 1,790 種食材的地圖,每種食材以 300 個數字來描述,整個檔案大小綽綽有餘地能放進你電子郵件的附件大小限制裡。 "410 萬份食譜。7 種語言。1,790 種食材。300 個維度,"Chen 在 X 上寫道。"全人類的烹飪被壓縮進兩兆位元組。" 在 arXiv 上發表我們的新論文:我們訓練出有史以來規模最大的多語言食物模型。 410 萬份食譜。7 種語言。1,790 種食材。300 個維度。 全人類的烹飪被壓縮進兩兆位元組。pic.twitter.com/b4GiZ62UMt — Josef Chen (@josefchen) 2026 年 5 月 26 日 它並不是在儲存食譜 在你想像有一個塞滿炒菜說明的兩兆位元組 USB 隨身碟之前,這個模型其實連一份食譜都沒有儲存。這兩兆位元組與其說是食譜書,不如說是一張座標表。 把它想成一張地圖。每種食材都根據它在全球數百萬道真實菜餚中的表現,獲得一個精確的位置。其數學計算很直白:1,790 種食材 × 每種食材 300 個數字 × 每個數字 4 位元組 ≈ 2.05 兆位元組。這些數字編碼了哪些食材會一起出現、哪些共享風味化合物,以及哪些屬於同一個烹飪傳統。一旦模型從食譜中學到這一切後,食譜本身就可以丟棄了。知識就活在這些座標之中。 這基本上就是 word2vec 在 2013 年對語言所做的同一種把戲,當時 Google 的研究人員證明你可以對語意進行算術運算。Epicure 對食物做了同樣的事情。拿牛肉來說,把它指向美國,你會得到麵包、生菜,或許還有啤酒。把它指向東南亞,模型就不再想著漢堡和燒烤,而開始想著醬油、薑和麻油。 這是透過論文中描述的一種稱為 SLERP 旋轉的引導運算子來實現的。拿一個種子食材——雞肉——以數學方式將它朝向某個料理方向旋轉。在 30 度時,你開始看到 Tex-Mex 的領域。在 60 度時,雞肉和牛肉匯聚到同一個墨西哥食材庫:玉米餅、莎莎醬、monterey jack 起司、poblano 辣椒。這個角度就像是一個介於"停留在這個食材附近"與"前往全新地方"之間的旋鈕。 Epicure 有三個版本,挑選哪個版本取決於你實際上想問的是什麼。Cooc 從食譜共現性中學習——也就是哪些食材會一起出現在真實菜餚中。Chem 從風味化學中學習——也就是哪些食材在 FlavorDB 化學資料庫中共享香氣化合物。Core 則是前兩者的混合版本。 問 Cooc 什麼食材能搭配巧克力,你可能會得到甜點櫃中的夥伴:可可粉、香草、杏仁。問 Chem,你會得到風味化學上的近親:太妃糖、軟糖、ganache。 同一種食材,不同的問題。一位尋找替代品的廚師與一位繪製風味相容性圖譜的廚師有著不同的需求。 為什麼這不是食物界的 ChatGPT Epicure 沒有通用知識、沒有語言生成能力,也無法幻想出一個它從未見過的食材。它知道 1,790 種食材。對這個模型而言,那就是整個世界的全貌。它在廣度上有所犧牲,換來的是可靠性——不像食譜聊天機器人,如果你用錯方式逼問,它們會自信滿滿地建議把毒藥當作烹飪食材。 此領域先前的最佳水準是 FlavorGraph,這是一個 2021 年的模型,結合了化學資料與僅限英文的 Recipe1M+ 資料集。Epicure 引入的多語言語料庫規模是前者的四倍以上,並為效率而精簡了詞彙。 實際應用不難想像。一位廚師詢問某種地中海食材在東亞的對應版本是什麼。一位食品產品開發者詢問哪種最低限度加工的替代品能落在與某種添加劑相同的風味區域。一個食譜應用程式在食材庫缺少某項食材時需要一個合理的替代建議。最後這一項,正是專門打造的小型模型悄悄勝過大型通用模型的領域。 Epicure 論文是一份研究發布。已訓練完成的模型現已在 Hugging Face 上線,互動式食材地圖則可在 epicure.kaikaku.ai 公開存取。他們甚至為你的 agent 釋出了一個 MCP。完整的訓練程式碼目前尚未釋出。
数据状态✓ 已抓取全文阅读原文(Decrypt)
🔍历史类似事件· 关键词 + 标的比对1 则
💡 目前用关键词 + 标的比对(MVP)· 之后会升级为 embedding 语义搜寻
原始信息
ID:607b3957e3
来源:Decrypt
发布:2026-05-28 14:07:02
分类:一般 · 导出分类 neutral
标的:未指定
社群投票:+0 /0 · ⭐ 0 重要 · 💬 0 留言