ニュース一覧このAIは「全人類の料理」を2メガバイトに圧縮した
Decrypt2026-05-28 14:07:02

このAIは「全人類の料理」を2メガバイトに圧縮した

ORIGINALThis AI Compressed 'All Human Cooking' Into 2 Megabytes
AI 影響分析Grok が分析中...
📄原文全文· trafilatura により自動抽出Gemini 翻譯4837 文字
簡要 - KAIKAKU.AIはEpicureを公開した。これは7言語にわたる414万件のレシピで訓練された3つの食材AIモデルのファミリーである。 - このモデルはレシピを保存するのではなく、レシピから学んだ内容を保存しており、ユーザーは料理の知識を数学的にナビゲートできる。 - 3つのバリアント——Cooc、Chem、Core——は、レシピ文脈対フレーバー化学のスペクトル上のそれぞれ異なる位置に配置されており、同じ2MBのファイルからわずかに異なる料理的問いに答える。 Josef Chenは、人類のすべての料理を2メガバイトに圧縮したと語る。それは大胆な主張だ。そしてそれは実際に裏付けられている。 ロンドンを拠点とする食AIスタートアップKAIKAKU.AIの共同創業者兼CEOであるChenは今週、研究者のJakub Radzikowskiと共にarXivで論文を発表し、Epicureを紹介した——7言語の11のデータセットから抽出された414万件のレシピで訓練された3つのAIモデルである。その結果は、1,790種類の食材を、それぞれ300個の数値で表現したマップで、メールの添付ファイル制限内に余裕で収まる。 「410万件のレシピ。7言語。1,790種類の食材。300次元」とChenはXに書いた。「人類のすべての料理が2メガバイトに圧縮された」 Launching our new paper on arXiv: we trained the largest multilingual food model ever built. 4.1M recipes. 7 languages. 1,790 ingredients. 300 dimensions. All of human cooking compressed into 2 megabytes. pic.twitter.com/b4GiZ62UMt — Josef Chen (@josefchen) May 26, 2026 レシピを保存しているわけではない 炒め物の手順が詰め込まれた2メガバイトのUSBスティックを想像する前に言っておくと、このモデルはレシピを1つも保存していない。2メガバイトは料理本というよりも座標表に近い。 それを地図として考えてみよう。すべての食材は、世界中の何百万もの実際の料理においてどのように振る舞うかに基づいて、正確な位置を与えられる。計算は単純だ。1,790種類の食材 × 食材ごとに300個の数値 × それぞれ4バイト ≈ 2.05メガバイト。これらの数値は、どの食材が一緒に登場するか、どれが風味化合物を共有するか、そしてどれが同じ料理伝統に属するかを符号化している。モデルがレシピからすべてを学習してしまえば、レシピそのものは捨ててもよい。知識は座標の中に生きている。 これは本質的に、2013年にword2vecが言語に対して行ったのと同じ手法であり、Googleの研究者たちは意味で算術ができることを示した。Epicureはそれを食に対して行う。ビーフを取り、アメリカの方向に向ければ、パン、レタス、おそらくビールが得られる。東南アジアの方向に向ければ、モデルはハンバーガーやグリルのことを考えるのをやめ、醤油、生姜、ごま油のことを考え始める。 これは論文がSLERP回転と呼ばれるステアリング演算子と表現するものを通じて起こる。シード食材——チキン——を取り、それを料理の方向へ数学的に回転させる。30度ではTex-Mexの領域が見え始める。60度ではチキンとビーフが同じメキシコのパントリーに収束する。コーントルティーヤ、サルサ、モンテレージャック、ポブラノペッパー。角度は「この食材の近くに留まる」と「新しい場所に着地する」の間のダイヤルだ。 Epicureには3つのバージョンがあり、正しいものを選ぶには実際に何を尋ねているかによる。Coocはレシピの共起から学習する——実際の料理に一緒に登場するものだ。ChemはFlavorDB化学データベースの香り化合物を共有する食材という、フレーバー化学から学習する。Coreは前述の2つの混合である。 Coocにチョコレートと相性が良いものを尋ねれば、デザートパントリーの仲間が得られるかもしれない。ココアパウダー、バニラ、アーモンドだ。Chemに尋ねれば、フレーバー化学的な同類が得られる。タフィー、ファッジ、ガナッシュ。 同じ食材、異なる問い。代用品を探すシェフは、フレーバーの相性をマッピングするシェフとは異なるニーズを持っている。 これが食版ChatGPTではない理由 Epicureには一般知識も、言語生成も、見たことのない食材を幻覚する能力もない。1,790種類の食材を知っている。このモデルにとって、それが世界のすべてである。広さで諦めるものを、信頼性で得ている——間違った方向に押せば毒物を料理材料として自信を持って提案するようなレシピチャットボットとは異なる。 この分野の以前の最先端はFlavorGraphで、これは化学データと英語のみのRecipe1M+データセットを組み合わせた2021年のモデルだった。Epicureは4倍以上大きい多言語コーパスを取り込み、効率のために語彙をクリーンアップしている。 実用的な用途を想像するのは難しくない。シェフは地中海の食材の東アジア相当のものは何かを尋ねる。食品製品開発者は、添加物と同じフレーバーゾーンに着地する最小限の加工で済む代替品は何かを尋ねる。レシピアプリは、パントリーに食材が欠けているときに首尾一貫した代用品を必要とする。最後のそれは、目的特化型の小さなモデルが大きな汎用モデルを静かに上回るギャップである。 Epicure論文は研究公開である。訓練済みモデルはHugging Faceで公開されており、インタラクティブな食材マップはepicure.kaikaku.aiで一般にアクセス可能だ。エージェント向けのMCPもリリースされている。完全な訓練コードは現時点では公開されていない。
データステータス✓ 全文抽出済み原文を読む(Decrypt)
🔍過去の類似イベント· キーワード + 銘柄照合1 件
💡 現在はキーワード + 銘柄照合(MVP)を使用しています · 今後 embedding セマンティック検索へアップグレード予定
原始情報
ID:607b3957e3
ソース:Decrypt
公開:2026-05-28 14:07:02
カテゴリ:一般 · エクスポートカテゴリ neutral
銘柄:未指定
コミュニティ投票:+0 /0 · ⭐ 0 重要 · 💬 0 コメント