뉴스 목록OpenAI 출시 ChatGPT Images 2.0: 텍스트 렌더링 대폭 개선, 다중 이미지 생성 지원, 하지만 '중국어 생성'은 여전히 난항
動區 BlockTempo2026-04-21 18:29:43

OpenAI 출시 ChatGPT Images 2.0: 텍스트 렌더링 대폭 개선, 다중 이미지 생성 지원, 하지만 '중국어 생성'은 여전히 난항

ORIGINALOpenAI 推出 ChatGPT Images 2.0:文字渲染大進化、支援多圖生成,但「中文生成」仍卡關
AI 영향 분석Grok 분석 중...
📄전체 원문· trafilatura에 의해 자동 추출됨Gemini 翻譯1394 자
AI 드로잉의 진화! OpenAI는 이번 주 화요일 새로운 이미지 생성 모델인 「ChatGPT Images 2.0」을 공식 출시했습니다. 새로운 모델은 '추론 능력'과 '텍스트 렌더링' 기술을 대폭 강화하여, 사용자는 이제 한 번에 여러 장의 이미지를 생성하고 극단적인 화면 비율을 커스텀할 수 있으며, 이미지 내에 영문 단어를 정확하게 생성할 수도 있게 되었습니다. 다만 외신 테스트 결과, 해당 모델은 중국어 등 비영어권 언어를 처리할 때 여전히 식별하기 어려운 'AI 난수(AI 亂碼)'가 발생하는 것으로 나타났습니다. (이전 기사: 수명은 단 3개월! OpenAI, 예고 없이 과학 연구 글쓰기 플랫폼 Prism 종료, 전략 대전환으로 "부업은 이제 그만") (배경 보충: ChatGPT의 배후 인물 Srinivas Narayanan, OpenAI 전격 사임, 일주일 새 고위급 3명 이탈) ChatGPT Images 2.0은 유료 구독자에게 더 강력한 연산 버전을 제공합니다. 이미지 생성 전쟁이 다시 뜨거워지고 있습니다. OpenAI는 화요일(21일) 전 세계 ChatGPT 및 Codex 사용자를 위한 새로운 이미지 생성 AI 모델을 출시했다고 발표했습니다. 이번 대규모 업데이트는 더 정교한 화면 표현을 가져왔을 뿐만 아니라, 과거 AI 드로잉에서 가장 골치 아팠던 '텍스트 렌더링(Text rendering)' 문제를 해결하고자 했습니다. 추론 능력 결합, 단일 프롬프트로 여러 장의 이미지 생성 과거 모델과 비교했을 때, Images 2.0의 가장 큰 돌파구는 ChatGPT의 강력한 '추론(Reasoning)' 능력을 통합했다는 점입니다. 이는 AI가 이미지를 생성하기 전에 더 많은 사고 단계를 거치며, 심지어 인터넷에 접속해 최신 정보를 검색할 수 있음을 의미합니다(해당 모델의 기초 지식 베이스 마감일은 2025년 12월). 새로운 모델의 주요 업그레이드 사항은 다음과 같습니다: - 다중 이미지 연속 생성: 사용자는 프롬프트(Prompt)를 한 번만 입력하면 모델이 일련의 이미지를 생성하게 할 수 있습니다. 예를 들어 학습 매뉴얼 한 권 분량의 시각적 콘텐츠를 만들 수 있습니다. - 고도로 커스터마이징 가능한 사이즈: 기존의 비율 제한을 깨고, 새로운 모델은 3:1(극도로 넓음)부터 1:3(극도로 높음)까지의 화면 비율을 지원하며, 사용자는 프롬프트에서 직접 원하는 사이즈를 지정할 수 있습니다. - 더 정교한 인포그래픽: 외신이 '샌프란시스코 내일 날씨 예보 및 추천 활동' 인포그래픽 생성을 테스트했을 때, AI는 날씨 세부 정보와 지역 랜드마크(페리 빌딩, 카스트로 극장, 트랜스아메리카 피라미드 등)를 하나의 화면에 정확하게 융합하는 데 성공했습니다. 영문 철자는 완벽하게 통과, 하지만 '중국어 포스터'는 난수 투성이 지난 몇 년간 주류 모델들이 이미지 내에 텍스트를 생성하려고 시도할 때, 종종 왜곡된 문자나 철자가 틀린 단어가 출력되곤 했습니다. 테스트 결과, Images 2.0은 영문 텍스트 렌더링에서 놀라운 발전을 이루었으며, 화면 속 영문 단어는 훨씬 더 선명하고 정확해졌습니다. 그러나 비영어권 언어에 도전할 때, Images 2.0은 여전히 역부족인 모습을 보였습니다. 외신 테스트 담당자는 ChatGPT에게 중국 팬을 흉내 내어 할리우드 배우 Timothée Chalamet을 위한 '중국어 응원 포스터'를 제작해 달라고 요청했습니다. 생성된 포스터는 시각적으로 매우 강렬했지만(전통 의상, 고양이 귀, 버블티, 판다 등의 요소 포함), 화면에 가득 찬 20개 이상의 글자는 읽을 수 없는 상태였습니다. 테스트 담당자가 ChatGPT에게 이 글자들이 무슨 뜻인지 되묻자, AI는 매우 강력한 '자기 비판' 능력을 보여주며 솔직하게 답변했습니다. "이 중 대부분은 가짜이거나 중국어 밈 포스터를 가장한 반쯤 엉터리인 AI 텍스트이므로 완전히 유창하게 번역할 수 없습니다. 어떤 부분은 명백히 왜곡되어 있거나 일본어처럼 보이는 문자가 섞여 있습니다... 이것들은 대부분 동아시아 팬들이 편집한
데이터 상태✓ 전체 내용 추출 완료원문 읽기 (動區 BlockTempo)
🔍과거 유사 사건· 키워드 + 종목 매칭6 건
💡 현재 키워드 + 종목 매칭(MVP) 사용 중 · 추후 embedding 의미론적 검색으로 업그레이드 예정
원본 정보
ID:b6f0f51663
출처:動區 BlockTempo
발행:2026-04-21 18:29:43
분류:zh_news · 도출된 분류 zh
종목:지정되지 않음
커뮤니티 투표:+0 /0 · ⭐ 0 중요 · 💬 0 댓글