Daftar beritaAI Ini Memampatkan 'Semua Masakan Manusia' Menjadi 2 Megabyte
Decrypt2026-05-28 14:07:02

AI Ini Memampatkan 'Semua Masakan Manusia' Menjadi 2 Megabyte

ORIGINALThis AI Compressed 'All Human Cooking' Into 2 Megabytes
Analisis Dampak AIGrok sedang menganalisis...
📄Artikel lengkap· Diambil secara otomatis oleh trafilaturaGemini 翻譯4837 kata
Secara singkat - KAIKAKU.AI menerbitkan Epicure, sebuah keluarga yang terdiri dari tiga model AI bahan makanan yang dilatih pada 4,14 juta resep multibahasa. - Model ini tidak menyimpan resep—ia menyimpan apa yang dipelajari dari resep-resep tersebut, memungkinkan pengguna menavigasi pengetahuan memasak secara matematis. - Tiga varian—Cooc, Chem, dan Core—berada di titik yang berbeda pada spektrum konteks resep vs. kimia rasa, masing-masing menjawab pertanyaan kuliner yang sedikit berbeda dari file 2MB yang sama. Josef Chen mengatakan ia telah mengompresi seluruh masakan umat manusia ke dalam dua megabyte. Itu klaim yang berani. Dan ternyata benar. Chen, salah satu pendiri dan CEO dari startup AI makanan asal London, KAIKAKU.AI, menerbitkan sebuah makalah di arXiv minggu ini, bersama peneliti Jakub Radzikowski, yang memperkenalkan Epicure—tiga model AI yang dilatih pada 4,14 juta resep yang diambil dari 11 dataset dalam tujuh bahasa. Hasilnya: sebuah peta berisi 1.790 bahan, masing-masing dijelaskan oleh 300 angka, yang muat dalam batas lampiran email Anda dengan ruang yang masih tersisa. "4,1 juta resep. 7 bahasa. 1.790 bahan. 300 dimensi," tulis Chen di X. "Seluruh masakan umat manusia dikompresi menjadi 2 megabyte." Meluncurkan makalah baru kami di arXiv: kami melatih model makanan multibahasa terbesar yang pernah dibangun. 4,1 juta resep. 7 bahasa. 1.790 bahan. 300 dimensi. Seluruh masakan umat manusia dikompresi menjadi 2 megabyte. pic.twitter.com/b4GiZ62UMt — Josef Chen (@josefchen) 26 Mei 2026 Ia tidak menyimpan resep Sebelum Anda membayangkan sebuah USB stick dua megabyte yang dijejali dengan instruksi tumis-menumis, modelnya tidak menyimpan satu resep pun. Dua megabyte itu lebih merupakan tabel koordinat daripada buku resep. Bayangkan saja sebagai sebuah peta. Setiap bahan mendapatkan lokasi yang tepat berdasarkan bagaimana ia berperilaku di jutaan hidangan nyata di seluruh dunia. Matematikanya jelas: 1.790 bahan × 300 angka per bahan × 4 byte masing-masing ≈ 2,05 megabyte. Angka-angka itu mengkodekan bahan mana yang muncul bersama, mana yang berbagi senyawa rasa, dan mana yang termasuk dalam tradisi kuliner yang sama. Setelah model mempelajari semua itu dari resep-resepnya, resep-resep itu bisa dibuang. Pengetahuannya hidup di dalam koordinat. Ini pada dasarnya adalah trik yang sama yang dilakukan word2vec pada bahasa kembali pada tahun 2013, ketika peneliti Google menunjukkan bahwa Anda bisa melakukan aritmetika dengan makna. Epicure melakukan hal itu untuk makanan. Ambil daging sapi, arahkan ke America dan Anda akan mendapatkan roti, selada, mungkin bir. Arahkan ke Asia Tenggara dan model berhenti memikirkan burger dan panggangan lalu mulai memikirkan kecap, jahe, dan minyak wijen. Hal ini terjadi melalui apa yang dijelaskan makalah sebagai operator pengarahan bernama SLERP rotation. Ambil bahan benih—ayam—dan putar secara matematis ke arah arah masakan. Pada 30 derajat Anda mulai melihat wilayah Tex-Mex. Pada 60 derajat, ayam dan daging sapi bertemu di lemari penyimpanan Meksiko yang sama: tortilla jagung, salsa, monterey jack, paprika poblano. Sudutnya adalah pengatur antara "tetap di dekat bahan ini" dan "mendarat di tempat yang baru." Epicure tersedia dalam tiga versi, dan memilih yang tepat tergantung pada apa yang sebenarnya Anda tanyakan. Cooc belajar dari co-occurrence resep—apa yang muncul bersama dalam hidangan nyata. Chem belajar dari kimia rasa—bahan mana yang berbagi senyawa aroma dari basis data kimia FlavorDB. Core adalah campuran antara dua yang sebelumnya. Tanyakan kepada Cooc apa yang cocok dengan cokelat dan Anda mungkin akan mendapatkan teman-teman lemari penyimpanan pencuci mulut: bubuk kakao, vanila, almond. Tanyakan kepada Chem dan Anda mendapatkan padanan kimia rasa: toffee, fudge, ganache. Bahan yang sama, pertanyaan yang berbeda. Seorang koki yang mencari pengganti memiliki kebutuhan yang berbeda dengan koki yang memetakan kompatibilitas rasa. Mengapa ini bukan ChatGPT untuk makanan Epicure tidak memiliki pengetahuan umum, tidak memiliki kemampuan menghasilkan bahasa, dan tidak memiliki kemampuan untuk berhalusinasi tentang bahan yang belum pernah dilihatnya. Ia mengenal 1.790 bahan. Itulah seluruh dunia, sejauh model ini memahaminya. Apa yang ia korbankan dalam keluasan, ia dapatkan dalam keandalan—tidak seperti chatbot resep yang dengan percaya diri akan menyarankan racun sebagai bahan masakan jika Anda mendorong mereka ke arah yang salah. Keadaan teknologi tercanggih sebelumnya di bidang ini adalah FlavorGraph, sebuah model dari tahun 2021 yang menggabungkan data kimia dengan dataset Recipe1M+ yang hanya berbahasa Inggris. Epicure membawa masuk korpus multibahasa yang lebih dari empat kali lebih besar dan membersihkan kosakata untuk efisiensi. Penggunaan praktisnya tidak sulit dibayangkan. Seorang koki bertanya seperti apa padanan Asia Timur dari sebuah bahan Mediterania. Seorang pengembang produk makanan bertanya apa pengganti yang minim diproses yang mendarat di zona rasa yang sama dengan suatu zat aditif. Sebuah aplikasi resep membutuhkan substitusi yang koheren ketika sebuah bahan tidak ada di lemari penyimpanan. Yang terakhir itu adalah celah di mana model kecil yang dibangun untuk tujuan tertentu secara diam-diam mengungguli model generalis besar. Makalah Epicure adalah sebuah rilis penelitian. Model-model yang telah dilatih sudah aktif di Hugging Face dan peta bahan interaktif dapat diakses publik di epicure.kaikaku.ai. Mereka bahkan merilis sebuah MCP untuk agen-agen Anda. Kode pelatihan lengkap belum dirilis pada saat ini.
Status data✓ Teks lengkap telah diambilBaca artikel asli (Decrypt)
🔍Peristiwa serupa dalam sejarah· Pencocokan kata kunci + aset1 berita
💡 Saat ini menggunakan pencocokan kata kunci + aset (MVP) · Akan ditingkatkan ke pencarian semantik embedding di masa mendatang
Informasi mentah
ID:607b3957e3
Sumber:Decrypt
Diterbitkan:2026-05-28 14:07:02
Kategori:Umum · Kategori ekspor neutral
Aset:Tidak ditentukan
Voting komunitas:+0 /0 · ⭐ 0 Penting · 💬 0 Komentar