要聞列表這個 AI 將「所有人類烹飪知識」壓縮成 2 MB
Decrypt2026-05-28 14:07:02

這個 AI 將「所有人類烹飪知識」壓縮成 2 MB

ORIGINALThis AI Compressed 'All Human Cooking' Into 2 Megabytes
AI 影響分析xAI Grok · medium 信賴度
TL;DR

方向中性AI 技術實現數據極致壓縮,與加密貨幣市場無直接關聯。

建議操作

觀望

📄完整原文· 由 trafilatura 自動擷取Gemini 翻譯4837 字
簡述 - KAIKAKU.AI 發表了 Epicure,這是一個由三個食材 AI 模型組成的系列,以 414 萬份多語言食譜訓練而成。 - 該模型並不儲存食譜,而是儲存從食譜中學到的知識,讓使用者能以數學方式探索烹飪知識。 - 三個版本——Cooc、Chem 與 Core——分別位於「食譜情境」與「風味化學」這個光譜的不同位置,每個版本都從同一個 2MB 的檔案中回答略有不同的烹飪問題。 Josef Chen 說他把人類所有的烹飪知識壓縮成了兩個 megabyte。這是個大膽的宣稱。而且這個說法是站得住腳的。 倫敦食品 AI 新創公司 KAIKAKU.AI 的共同創辦人兼執行長 Chen,本週與研究員 Jakub Radzikowski 一同在 arXiv 上發表了一篇論文,介紹 Epicure——三個以 414 萬份食譜訓練而成的 AI 模型,這些食譜取自 7 種語言、11 個資料集。成果是:一張涵蓋 1,790 種食材的地圖,每種食材以 300 個數字描述,整個檔案小到還能輕鬆塞進電子郵件附件的容量限制中。 「410 萬份食譜。7 種語言。1,790 種食材。300 個維度。」Chen 在 X 上寫道,「整個人類的烹飪知識,壓縮在 2 megabyte 之內。」 在 arXiv 上發表我們的新論文:我們訓練了有史以來最大的多語言食物模型。 410 萬份食譜。7 種語言。1,790 種食材。300 個維度。 整個人類的烹飪知識,壓縮在 2 megabyte 之內。pic.twitter.com/b4GiZ62UMt — Josef Chen (@josefchen) 2026 年 5 月 26 日 它並沒有儲存食譜 在你開始想像一支塞滿炒菜步驟的兩 megabyte USB 隨身碟之前,要知道,這個模型一份食譜都沒儲存。這兩個 megabyte 與其說是食譜書,不如說是一張座標表。 把它想成一張地圖。每一種食材都根據它在全球數百萬道真實菜餚中的表現,被賦予一個精確的位置。數學算式很直白:1,790 種食材 × 每種食材 300 個數字 × 每個數字 4 個 byte ≈ 2.05 megabyte。這些數字編碼了哪些食材會同時出現、哪些食材共享風味化合物、哪些食材屬於同一個烹飪傳統。一旦模型從食譜中學到了這一切,食譜本身就可以丟掉了。知識就活在這些座標裡。 這基本上就是 word2vec 在 2013 年對語言玩的同一招——當時 Google 的研究人員證明你可以對「意義」做加減運算。Epicure 對食物做了同樣的事。把 beef 朝美國的方向推,你會得到 bread、lettuce,可能還有 beer。把它朝東南亞的方向推,模型就不再想著漢堡和燒烤,而開始想著醬油、薑與麻油。 這一切是透過論文中所描述的一種稱為 SLERP rotation 的引導運算子(steering operator)實現的。取一個種子食材——chicken——然後在數學上把它朝某個料理方向旋轉。在 30 度時,你會開始看到 Tex-Mex 領域。在 60 度時,chicken 與 beef 會匯聚到同一個墨西哥食材庫中:corn tortilla、salsa、monterey jack、poblano pepper。角度就是一個旋鈕,介於「靠近這個食材」與「落到一個全新的地方」之間。 Epicure 共有三個版本,選哪一個取決於你實際上問的是什麼。Cooc 從食譜的共現(co-occurrence)中學習——也就是哪些食材會在真實菜餚中同時出現。Chem 從風味化學中學習——也就是根據 FlavorDB 化學資料庫,哪些食材共享香氣化合物。Core 則是前兩者的混合。 問 Cooc 什麼跟 chocolate 搭配,你可能會得到甜點櫃裡的夥伴:cocoa powder、vanilla、almond。問 Chem,你會得到風味化學上的同類:toffee、fudge、ganache。 同樣的食材,不同的問題。一個在找替代品的廚師,跟一個在繪製風味相容性圖譜的廚師,需求是不一樣的。 為何這不是食物版的 ChatGPT Epicure 沒有一般常識、無法產生語言,也無法幻想出一個它從未見過的食材。它認識 1,790 種食材。對這個模型來說,這就是全世界了。它在廣度上的犧牲換來了可靠性——不像那些食譜聊天機器人,如果你用錯誤的方式引導它們,它們會自信滿滿地建議你把毒藥當成烹飪材料。 這個領域先前的最先進技術是 FlavorGraph,這是一個 2021 年的模型,結合了化學資料與僅限英語的 Recipe1M+ 資料集。Epicure 引入了一個規模超過其四倍以上的多語言語料庫,並為了效率而清理了詞彙表。 實際用途並不難想像。一位廚師問,一種地中海食材在東亞料理中對應的食材會是什麼。一位食品研發者問,有哪種最低限度加工的替代品,落在與某添加物相同的風味區間裡。一個食譜 App 在食材缺貨時需要一個合理的替代方案。最後這一項,正是專門打造的小型模型悄悄勝過大型通用模型的領域。 Epicure 的論文屬於研究發表。訓練好的模型已上線 Hugging Face,並有一張可互動的食材地圖可在 epicure.kaikaku.ai 公開存取。他們甚至為你的 agent 發布了一個 MCP。完整的訓練程式碼目前尚未公開。
資料狀態✓ 已擷取全文閱讀原文(Decrypt)
🔍歷史類似事件· 關鍵字 + 標的比對1 則
💡 目前用關鍵字 + 標的比對(MVP)· 之後會升級為 embedding 語意搜尋
原始資訊
ID:607b3957e3
來源:Decrypt
發佈:2026-05-28 14:07:02
分類:一般 · 導出分類 neutral
標的:未指定
社群投票:+0 /0 · ⭐ 0 重要 · 💬 0 留言