要闻列表OpenAI 推出 ChatGPT Images 2.0:文字渲染大進化、支援多圖生成,但「中文生成」仍卡關
動區 BlockTempo2026-04-21 18:29:43

OpenAI 推出 ChatGPT Images 2.0:文字渲染大進化、支援多圖生成,但「中文生成」仍卡關

AI 影响分析Grok 分析中...
📄完整原文· 由 trafilatura 自动抓取1394 字
AI 繪圖再進化!OpenAI 於本週二正式推出全新影像生成模型「ChatGPT Images 2.0」。新模型大幅強化了「推論能力」與「文字渲染」技術,用戶現在能一次生成多張圖片、自訂極端長寬比,甚至能在圖片中精準生成英文單字。不過外媒實測發現,該模型在處理中文等非英語系文字時,仍會出現難以辨識的「AI 亂碼」。 (前情提要:壽命僅 3 個月!OpenAI 無預警關停科研寫作平台 Prism,戰略大轉向「不再搞副業」) (背景補充:ChatGPT 幕後推手 Srinivas Narayanan 閃辭 OpenAI,一週三已有高層出走) ChatGPT Images 2.0,並為付費訂閱者提供更強大的運算版本。 像生成的戰場再度升溫。OpenAI 於週二(21 日)宣布為全球 ChatGPT 與 Codex 用戶推出全新的影像生成 AI 模型 ——這次的重大更新不僅帶來了更細緻的畫面表現,更試圖解決過去 AI 繪圖最令人頭痛的「文字拼寫(Text rendering)」問題。 結合推論能力,單次提示可產出多張圖片 與過去的模型相比,Images 2.0 最大的突破在於它整合了 ChatGPT 強大的「推論(Reasoning)」能力。這意味著 AI 在生成圖片前,會執行更多的思考步驟,甚至能連上網路搜尋最新資訊(該模型的基礎知識庫截止日期為 2025 年 12 月)。 新模型的亮點升級包含: - 多圖連續生成:用戶只需輸入一次提示詞(Prompt),就能讓模型產出一系列圖片,例如一整本學習手冊的視覺內容。 - 高度客製化尺寸:打破傳統的比例限制,新模型支援從 3:1(極寬)到 1:3(極高) 的長寬比,用戶可直接在提示詞中指定所需尺寸。 - 更細緻的資訊圖表:外媒實測要求生成「舊金山明日天氣預報與推薦活動」的資訊圖表時,AI 成功將天氣細節與當地地標(如渡輪大廈、卡斯楚戲院、泛美金字塔)精準地融合在同一個畫面中。 英文拼寫完美過關,但「中文海報」慘成亂碼 過去幾年,當主流模型嘗試在圖像中生成文字時,往往會產出扭曲的字元或拼寫錯誤的單字。根據實測,Images 2.0 在英文文字渲染上取得了令人驚豔的進步,畫面中的英文單字變得更加清晰且準確。 然而,當挑戰非英語系語言時,Images 2.0 仍顯得力不從心。外媒測試人員要求 ChatGPT 模仿中國粉絲,為好萊塢男星提摩西·夏勒梅(Timothée Chalamet)製作一張「中文應援海報」。雖然產出的海報視覺極具張力(包含傳統服飾、貓耳、珍珠奶茶與熊貓等元素),且畫面中塞滿了超過 20 處文字,但這些字卻無法閱讀。 當測試員反問 ChatGPT 這些字是什麼意思時,AI 竟展現了極強的「自我批判」能力,誠實地回答: 「這其中大部分是假的,或者是偽裝成中文迷因海報的半胡言亂語 AI 文字,所以無法完全流暢地翻譯出來。還有一些地方明顯是扭曲的,或是混雜了看起來像日文的字元……這些大多是為了模仿東亞粉絲剪輯文字的感覺而捏造的無意義符號,而不是準確的句子。」 總結來說,ChatGPT Images 2.0 在功能多樣性與英文處理上已展現出強大的實力,無疑為生產力工具帶來了實質的提升。至於全球用戶引頸期盼的「多語系精準生成」,或許仍需等待 OpenAI 在未來版本中透過更龐大的全球數據進行強化了。
数据状态✓ 已抓取全文阅读原文(動區 BlockTempo)
🔍历史类似事件· 关键词 + 标的比对6 则
💡 目前用关键词 + 标的比对(MVP)· 之后会升级为 embedding 语义搜寻
原始信息
ID:b6f0f51663
来源:動區 BlockTempo
发布:2026-04-21 18:29:43
分类:zh_news · 导出分类 zh
标的:未指定
社群投票:+0 /0 · ⭐ 0 重要 · 💬 0 留言