ニュース一覧OpenAI が ChatGPT Images 2.0 を発表:テキストレンダリングが大幅に進化し、複数画像の生成にも対応したが、「中国語生成」は依然として課題が残る
動區 BlockTempo2026-04-21 18:29:43

OpenAI が ChatGPT Images 2.0 を発表:テキストレンダリングが大幅に進化し、複数画像の生成にも対応したが、「中国語生成」は依然として課題が残る

ORIGINALOpenAI 推出 ChatGPT Images 2.0:文字渲染大進化、支援多圖生成,但「中文生成」仍卡關
AI 影響分析Grok が分析中...
📄原文全文· trafilatura により自動抽出Gemini 翻譯1394 文字
AI画像生成がさらに進化!OpenAIは今週火曜日、新しい画像生成モデル「ChatGPT Images 2.0」を正式にリリースした。新モデルは「推論能力」と「文字レンダリング」技術を大幅に強化しており、ユーザーは一度に複数の画像を生成したり、極端なアスペクト比をカスタマイズしたりできるほか、画像内に正確な英単語を生成することも可能になった。ただし、海外メディアの実測によると、中国語などの非英語圏の言語を処理する際には、依然として判読困難な「AIの文字化け」が発生することがわかった。 (前回のあらすじ:寿命はわずか3ヶ月!OpenAIが科学研究用ライティングプラットフォームPrismを予告なしに閉鎖、戦略を大転換し「副業はもうやらない」) (背景補足:ChatGPTの立役者Srinivas NarayananがOpenAIを電撃退社、1週間で3人目の幹部離脱) ChatGPT Images 2.0は、有料サブスクリプションユーザー向けにより強力な演算バージョンを提供する。 画像生成の戦場が再び熱を帯びている。OpenAIは火曜日(21日)、世界中のChatGPTおよびCodexユーザーに向けて新しい画像生成AIモデルをリリースしたと発表した。今回の大型アップデートは、より緻密な画面表現をもたらすだけでなく、これまでAI画像生成において最も頭を悩ませてきた「文字レンダリング(Text rendering)」問題の解決を試みている。 推論能力と結合し、単一のプロンプトで複数画像を生成 過去のモデルと比較して、Images 2.0の最大のブレイクスルーは、ChatGPTの強力な「推論(Reasoning)」能力を統合した点にある。これは、AIが画像を生成する前に、より多くの思考ステップを実行し、インターネットに接続して最新情報を検索できることを意味する(同モデルの基礎知識ベースのカットオフ日は2025年12月)。 新モデルの主なアップグレードは以下の通り: - 複数画像の連続生成:ユーザーはプロンプト(Prompt)を一度入力するだけで、学習マニュアル一冊分のビジュアルコンテンツのような一連の画像を生成できる。 - 高度なサイズカスタマイズ:従来の比率制限を打破し、新モデルは3:1(極端な横長)から1:3(極端な縦長)までのアスペクト比をサポートしており、ユーザーはプロンプト内で直接必要なサイズを指定できる。 - より緻密なインフォグラフィック:海外メディアが「サンフランシスコの明日の天気予報とおすすめアクティビティ」のインフォグラフィック生成をテストした際、AIは天気予報の詳細と現地のランドマーク(フェリービルディング、カストロ・シアター、トランスアメリカ・ピラミッドなど)を一つの画面内に正確に融合させることに成功した。 英単語のスペルは完璧だが、「中国語のポスター」は文字化けの惨状に 過去数年間、主流モデルが画像内に文字を生成しようとすると、歪んだ文字やスペルミスのある単語が出力されることが多かった。実測によると、Images 2.0は英語の文字レンダリングにおいて驚くべき進歩を遂げており、画面内の英単語はより鮮明かつ正確になっている。 しかし、非英語圏の言語に挑戦すると、Images 2.0は依然として力不足が目立つ。海外メディアのテスターがChatGPTに対し、中国のファンを模倣してハリウッド俳優Timothée Chalametの「中国語応援ポスター」を作成するよう要求した。生成されたポスターは視覚的なインパクトが非常に強かったものの(伝統衣装、猫耳、タピオカミルクティー、パンダなどの要素を含む)、画面内に詰め込まれた20箇所以上の文字は、どれも読むことができなかった。 テスターがChatGPTにこれらの文字の意味を問い返すと、AIは非常に強力な「自己批判」能力を発揮し、正直にこう答えた。 「これの大部分は偽物、あるいは中国語のミームポスターを装った、支離滅裂なAI文字であるため、完全に流暢に翻訳することはできません。明らかに歪んでいる箇所や、日本語のように見える文字が混ざっている箇所もあります……これらは正確な文章ではなく、東アジアのファンが編集した文字の雰囲気を模倣するために捏造された無意味な記号です。」 結論として、ChatGPT Images 2.0は機能の多様性と英語処理において強力な実力を示しており、生産性ツールに実質的な向上をもたらしたことは間違いない。世界中のユーザーが待ち望んでいる「多言語
データステータス✓ 全文抽出済み原文を読む(動區 BlockTempo)
🔍過去の類似イベント· キーワード + 銘柄照合6 件
💡 現在はキーワード + 銘柄照合(MVP)を使用しています · 今後 embedding セマンティック検索へアップグレード予定
原始情報
ID:b6f0f51663
ソース:動區 BlockTempo
公開:2026-04-21 18:29:43
カテゴリ:zh_news · エクスポートカテゴリ zh
銘柄:未指定
コミュニティ投票:+0 /0 · ⭐ 0 重要 · 💬 0 コメント