뉴스 목록이 AI는 '모든 인간 요리'를 2메가바이트로 압축했다
Decrypt2026-05-28 14:07:02

이 AI는 '모든 인간 요리'를 2메가바이트로 압축했다

ORIGINALThis AI Compressed 'All Human Cooking' Into 2 Megabytes
AI 영향 분석Grok 분석 중...
📄전체 원문· trafilatura에 의해 자동 추출됨Gemini 翻譯4837 자
요약 - KAIKAKU.AI는 7개 언어의 414만 개 다국어 레시피로 학습된 3개의 재료 AI 모델 패밀리인 Epicure를 발표했다. - 이 모델은 레시피를 저장하지 않고, 레시피에서 학습한 내용을 저장하여 사용자가 요리 지식을 수학적으로 탐색할 수 있도록 한다. - Cooc, Chem, Core 세 가지 변형은 레시피 맥락 대 풍미 화학 스펙트럼의 서로 다른 지점에 위치하며, 각각 동일한 2MB 파일에서 약간씩 다른 요리 질문에 답한다. Josef Chen은 인류의 모든 요리를 2메가바이트로 압축했다고 말한다. 대담한 주장이다. 그리고 이는 실제로 들어맞는다. 런던의 음식 AI 스타트업 KAIKAKU.AI의 공동 창업자이자 CEO인 Chen은 이번 주 연구원 Jakub Radzikowski와 함께 arXiv에 논문을 게재하며, 7개 언어에 걸친 11개 데이터셋에서 추출한 414만 개의 레시피로 학습된 세 개의 AI 모델 Epicure를 공개했다. 그 결과는 다음과 같다: 각각 300개의 숫자로 기술되는 1,790개 재료의 지도가, 이메일 첨부 파일 용량 제한 안에 여유 있게 들어간다. "410만 개 레시피. 7개 언어. 1,790개 재료. 300차원," Chen은 X에 적었다. "인류의 모든 요리가 2메가바이트로 압축되었다." arXiv에 새 논문을 공개합니다: 지금까지 만들어진 가장 큰 다국어 음식 모델을 학습시켰습니다. 410만 개 레시피. 7개 언어. 1,790개 재료. 300차원. 인류의 모든 요리가 2메가바이트로 압축되었습니다. pic.twitter.com/b4GiZ62UMt — Josef Chen (@josefchen) May 26, 2026 레시피를 저장하는 것이 아니다 볶음 요리법으로 가득 찬 2메가바이트 USB 스틱을 상상하기 전에 말하자면, 이 모델은 단 하나의 레시피도 저장하지 않는다. 2메가바이트는 요리책이라기보다는 좌표표에 가깝다. 지도라고 생각해보라. 모든 재료는 전 세계 수백만 개의 실제 요리에서 어떻게 작용하는지에 따라 정확한 위치를 부여받는다. 계산은 단순하다: 재료 1,790개 × 재료당 숫자 300개 × 각 4바이트 ≈ 약 2.05메가바이트. 이 숫자들은 어떤 재료가 함께 등장하는지, 어떤 재료가 풍미 화합물을 공유하는지, 어떤 재료가 같은 요리 전통에 속하는지를 인코딩한다. 모델이 레시피로부터 그 모든 것을 학습하고 나면, 레시피는 사라져도 된다. 지식은 좌표 안에 살아 있다. 이는 본질적으로 word2vec이 2013년에 언어에 대해 보여준 것과 같은 기법으로, Google 연구진이 의미로 산술 연산을 할 수 있음을 입증한 것이다. Epicure는 이를 음식에 적용한다. beef를 가져와 America 방향으로 가리키면 bread, lettuce, 어쩌면 beer가 나온다. South East Asia 방향으로 가리키면 모델은 burgers와 grills에 대해 생각하기를 멈추고 soy sauce, ginger, sesame oil을 떠올리기 시작한다. 이는 논문에서 SLERP rotation이라 부르는 조향 연산자를 통해 이루어진다. 시드 재료(chicken)를 가져와 수학적으로 요리 방향으로 회전시킨다. 30도에서는 Tex-Mex 영역이 보이기 시작한다. 60도에서는 chicken과 beef가 같은 멕시코 식료품 저장고로 수렴한다: corn tortilla, salsa, monterey jack, poblano pepper. 각도는 "이 재료 근처에 머물기"와 "새로운 곳에 도달하기" 사이의 다이얼이다. Epicure는 세 가지 버전으로 제공되며, 어떤 것을 선택할지는 실제로 무엇을 묻고 있는지에 달려 있다. Cooc는 레시피 공동 출현(co-occurrence)에서 학습한다 — 실제 요리에서 무엇이 함께 등장하는지를 본다. Chem은 풍미 화학에서 학습한다 — 어떤 재료들이 FlavorDB 화학 데이터베이스의 향 화합물을 공유하는지를 본다. Core는 앞의 두 가지를 혼합한 것이다. Cooc에게 chocolate와 어울리는 것을 물으면 디저트 식료품 동반자들을 얻을 수 있다: cocoa powder, vanilla, almond. Chem에게 물으면 풍미 화학 동료들을 얻는다: toffee, fudge, ganache. 같은 재료, 다른 질문이다. 대체재를 찾는 셰프와 풍미 호환성을 매핑하는 셰프는 서로 다른 요구를 갖는다. 왜 이것이 음식 버전 ChatGPT가 아닌가 Epicure는 일반 지식도, 언어 생성 능력도, 한 번도 본 적 없는 재료를 환각으로 만들어내는 능력도 없다. 이 모델은 1,790개 재료를 안다. 이 모델 입장에서는 그것이 세계의 전부다. 폭에서 잃은 것을 신뢰성에서 얻는다 — 잘못된 방향으로 밀어붙이면 자신 있게 독을 요리 재료로 추천할 수 있는 레시피 챗봇들과는 다르다. 이 분야의 이전 최첨단 기술은 2021년 모델인 FlavorGraph로, 화학 데이터와 영어 전용 Recipe1M+ 데이터셋을 결합한 것이었다. Epicure는 4배 이상 큰 다국어 코퍼스를 도입하고 효율성을 위해 어휘를 정제한다. 실용적인 용도는 상상하기 어렵지 않다. 셰프는 지중해 재료에 해당하는 동아시아 재료가 무엇인지 묻는다. 식품 제품 개발자는 첨가물과 같은 풍미 영역에 위치하는 최소 가공 대체재가 무엇인지 묻는다. 레시피 앱은 식료품 저장고에서 재료가 없을 때 일관된 대체재가 필요하다. 마지막 경우가 바로 목적에 맞게 만들어진 작은 모델들이 거대한 범용 모델들을 조용히 능가하는 영역이다. Epicure 논문은 연구 공개다. 학습된 모델은 Hugging Face에서 라이브로 이용 가능하며, 인터랙티브 재료 지도는 epicure.kaikaku.ai에서 공개적으로 접근할 수 있다. 에이전트를 위한 MCP까지 공개했다. 전체 학습 코드는 현재 공개되지 않았다.
데이터 상태✓ 전체 내용 추출 완료원문 읽기 (Decrypt)
🔍과거 유사 사건· 키워드 + 종목 매칭1 건
💡 현재 키워드 + 종목 매칭(MVP) 사용 중 · 추후 embedding 의미론적 검색으로 업그레이드 예정
원본 정보
ID:607b3957e3
출처:Decrypt
발행:2026-05-28 14:07:02
분류:일반 · 도출된 분류 neutral
종목:지정되지 않음
커뮤니티 투표:+0 /0 · ⭐ 0 중요 · 💬 0 댓글