Danh sách tinAI này đã nén 'All Human Cooking' thành 2 Megabytes
Decrypt2026-05-28 14:07:02

AI này đã nén 'All Human Cooking' thành 2 Megabytes

ORIGINALThis AI Compressed 'All Human Cooking' Into 2 Megabytes
Phân tích tác động AIGrok đang phân tích...
📄Toàn văn bài viết· Được trích xuất tự động bởi trafilaturaGemini 翻譯4837 từ
Tóm tắt nhanh - KAIKAKU.AI đã công bố Epicure, một họ gồm ba mô hình AI nguyên liệu được huấn luyện trên 4,14 triệu công thức nấu ăn đa ngôn ngữ. - Mô hình không lưu trữ công thức—nó lưu trữ những gì đã học được từ chúng, cho phép người dùng điều hướng kiến thức nấu ăn theo cách toán học. - Ba biến thể—Cooc, Chem và Core—nằm ở các điểm khác nhau trên phổ ngữ cảnh công thức và hóa học hương vị, mỗi biến thể trả lời một câu hỏi ẩm thực hơi khác nhau từ cùng một tệp 2MB. Josef Chen nói rằng anh đã nén toàn bộ nghệ thuật nấu ăn của loài người vào hai megabyte. Đó là một tuyên bố táo bạo. Và nó cũng đúng sự thật. Chen, đồng sáng lập và CEO của startup AI thực phẩm KAIKAKU.AI có trụ sở tại London, đã công bố một bài báo trên arXiv tuần này, cùng với nhà nghiên cứu Jakub Radzikowski, giới thiệu Epicure—ba mô hình AI được huấn luyện trên 4,14 triệu công thức được lấy từ 11 bộ dữ liệu trên bảy ngôn ngữ. Kết quả: một bản đồ gồm 1.790 nguyên liệu, mỗi nguyên liệu được mô tả bằng 300 con số, vừa vặn trong giới hạn đính kèm email của bạn với dung lượng còn dư. "4.1M công thức. 7 ngôn ngữ. 1.790 nguyên liệu. 300 chiều," Chen viết trên X. "Toàn bộ nghệ thuật nấu ăn của loài người được nén vào 2 megabyte." Ra mắt bài báo mới của chúng tôi trên arXiv: chúng tôi đã huấn luyện mô hình thực phẩm đa ngôn ngữ lớn nhất từng được xây dựng. 4.1M công thức. 7 ngôn ngữ. 1.790 nguyên liệu. 300 chiều. Toàn bộ nghệ thuật nấu ăn của loài người được nén vào 2 megabyte. pic.twitter.com/b4GiZ62UMt — Josef Chen (@josefchen) May 26, 2026 Nó không lưu trữ công thức Trước khi bạn tưởng tượng một chiếc USB hai megabyte nhồi đầy hướng dẫn nấu món xào, mô hình này không lưu trữ một công thức nào cả. Hai megabyte đó giống như một bảng tọa độ hơn là một cuốn sách nấu ăn. Hãy hình dung nó như một bản đồ. Mỗi nguyên liệu nhận được một vị trí chính xác dựa trên cách nó hoạt động trong hàng triệu món ăn thực tế trên khắp thế giới. Phép toán rất thẳng thắn: 1.790 nguyên liệu × 300 con số mỗi nguyên liệu × 4 byte mỗi số ≈ 2,05 megabyte. Những con số đó mã hóa nguyên liệu nào xuất hiện cùng nhau, nguyên liệu nào chia sẻ hợp chất hương vị, và nguyên liệu nào thuộc cùng một truyền thống ẩm thực. Khi mô hình học được tất cả điều đó từ các công thức, các công thức có thể biến mất. Kiến thức tồn tại trong các tọa độ. Đây về cơ bản là cùng một thủ thuật mà word2vec đã thực hiện với ngôn ngữ vào năm 2013, khi các nhà nghiên cứu của Google chứng minh rằng bạn có thể làm số học với ý nghĩa. Epicure làm điều đó với thực phẩm. Lấy beef, hướng nó về phía America và bạn sẽ nhận được bread, lettuce, có thể là beer. Hướng nó về phía South East Asia và mô hình ngừng nghĩ về burgers và grills và bắt đầu nghĩ về soy sauce, ginger và sesame oil. Điều này xảy ra thông qua cái mà bài báo mô tả là một toán tử điều hướng có tên SLERP rotation. Lấy một nguyên liệu hạt giống—chicken—và xoay nó về mặt toán học theo hướng của một nền ẩm thực. Ở 30 độ, bạn bắt đầu thấy lãnh thổ Tex-Mex. Ở 60 độ, chicken và beef hội tụ trên cùng một tủ thực phẩm Mexican: corn tortilla, salsa, monterey jack, poblano pepper. Góc độ là một núm điều chỉnh giữa "ở gần nguyên liệu này" và "đáp xuống nơi nào đó mới." Epicure có ba phiên bản, và việc chọn đúng phiên bản phụ thuộc vào điều bạn thực sự đang hỏi. Cooc học từ sự đồng xuất hiện trong công thức—những gì xuất hiện cùng nhau trong các món ăn thực tế. Chem học từ hóa học hương vị—những nguyên liệu nào chia sẻ hợp chất mùi từ cơ sở dữ liệu hóa học FlavorDB. Core là sự pha trộn giữa hai phiên bản trước. Hỏi Cooc cái gì kết hợp với chocolate và bạn có thể nhận được những bạn đồng hành trong tủ tráng miệng: cocoa powder, vanilla, almond. Hỏi Chem và bạn nhận được những đồng nghiệp hóa học hương vị: toffee, fudge, ganache. Cùng một nguyên liệu, câu hỏi khác nhau. Một đầu bếp tìm kiếm sự thay thế có nhu cầu khác với một đầu bếp lập bản đồ tính tương thích hương vị. Tại sao đây không phải là ChatGPT cho thực phẩm Epicure không có kiến thức tổng quát, không có khả năng tạo ngôn ngữ, và không có khả năng ảo giác ra một nguyên liệu mà nó chưa từng thấy. Nó biết 1.790 nguyên liệu. Đó là toàn bộ thế giới, theo cách hiểu của mô hình này. Những gì nó hy sinh về độ rộng, nó đạt được về độ tin cậy—không giống như các chatbot công thức sẽ tự tin đề xuất chất độc làm nguyên liệu nấu ăn nếu bạn đẩy chúng theo hướng sai. Tình trạng nghệ thuật tiên tiến trước đây ở đây là FlavorGraph, một mô hình năm 2021 kết hợp dữ liệu hóa học với bộ dữ liệu Recipe1M+ chỉ bằng tiếng Anh. Epicure mang đến một kho dữ liệu đa ngôn ngữ lớn hơn bốn lần và làm sạch từ vựng để đạt hiệu quả cao hơn. Các ứng dụng thực tế không khó hình dung. Một đầu bếp hỏi nguyên liệu tương đương East Asian của một nguyên liệu Mediterranean trông như thế nào. Một nhà phát triển sản phẩm thực phẩm hỏi sự thay thế ít chế biến nào nằm trong cùng vùng hương vị với một chất phụ gia. Một ứng dụng công thức cần một sự thay thế nhất quán khi một nguyên liệu bị thiếu trong tủ. Cái cuối cùng đó là khoảng trống mà các mô hình nhỏ được xây dựng có mục đích lặng lẽ vượt trội hơn các mô hình tổng quát lớn. Bài báo Epicure là một bản phát hành nghiên cứu. Các mô hình đã được huấn luyện hiện có sẵn trên Hugging Face và một bản đồ nguyên liệu tương tác có thể truy cập công khai tại epicure.kaikaku.ai. Họ thậm chí còn phát hành một MCP cho các agent của bạn. Mã huấn luyện đầy đủ chưa được phát hành vào thời điểm này.
Trạng thái dữ liệu✓ Đã trích xuất toàn vănĐọc bài gốc (Decrypt)
🔍Sự kiện tương tự trong lịch sử· Đối chiếu từ khóa + tài sản1 tin
💡 Hiện đang sử dụng đối chiếu từ khóa + tài sản (MVP) · Sau này sẽ nâng cấp lên tìm kiếm ngữ nghĩa embedding
Thông tin gốc
ID:607b3957e3
Nguồn:Decrypt
Đăng:2026-05-28 14:07:02
Danh mục:Chung · Danh mục xuất neutral
Tài sản:Chưa chỉ định
Bình chọn cộng đồng:+0 /0 · ⭐ 0 quan trọng · 💬 0 bình luận