• ニュース
  • HOME
  • ニュース
  • OpenAI、GPT-4oの画像生成機能を強化 ― クリエイティブ分野の実用利用を推進

OpenAI、GPT-4oの画像生成機能を強化 ― クリエイティブ分野の実用利用を推進

(イメージ:OpenAI)OpenAIは、GPT-4oモデルに統合された画像生成機能をアップグレードし、グラフィックデザインや広告分野などにおける実用性の向上を図った。今回の更新は、より詳細かつ正確な画像生成を可能にし、クリエイティブな指示に忠実に応えることを目的としている。

テキストレンダリングの改善と商業利用への対応

新機能の大きな進歩の一つは、テキストレンダリングの品質向上にある。従来のモデルでは、明確な単語や文章を視覚的に再現することが困難で、読みやすい文字ではなく、あいまいな近似形を生成する傾向があった。しかし、新たに導入されたGPT-4oでは、パッケージデザインやブランドロゴ、看板など、視認性が重要な用途に対しても、はるかに高い精度でテキスト表現が可能となっている。

テキストレンダリングの改善例。 (オープンAI)

この進化は、当初テキスト生成に特化していたモデルが、画像、音声、動画といったマルチモーダル機能へと統合されていく、AI技術の広範な流れを反映するものである。OpenAIは、2022年にChatGPTをテキスト中心のツールとして公開して以降、コード生成、DALL-Eによる画像生成、音声認識・生成と機能を段階的に拡張してきた。今回のGPT-4oは、これらすべてを統合し、単一のモデルで処理できる体制を整えたかたちとなる。

 

新しい画像生成ツールは今週から順次ユーザーに提供が開始され、数週間以内にすべてのChatGPTユーザー層で利用可能となる予定である。また、従来のDALL-Eファン向けに、DALL-E専用のGPTインターフェースからも引き続きアクセス可能となっている。

カール・マルクスのパパラッチ風写真(OpenAI)

複雑なプロンプトへの対応と構成精度の向上

今回のアップデートでは、複数の要素を含む複雑なプロンプトに対しても、より高い精度で応答できるよう改良が加えられた。例えば、オブジェクトの配置やシーン内での相互関係を正しく理解し、表現する能力が強化されている。以前のモデルでは、指定されたオブジェクトが適切な位置に配置されず、視覚的に不自然な出力となるケースも多かったが、最新版では「アイスクリーム」と書かれた看板が、正確にパッケージ上に配置されるなど、構成の整合性が大幅に向上している。

20代前半の多様な4人の友人たちを写したポラロイド風の写真。(OpenAI)

さらに、ユーザーが4コマ漫画をキャラクターやセリフ、場面転換を含めて記述した際にも、一貫性ある視覚出力を提供するなど、広告、マーケティング、イラストレーション、コンテンツ制作といった分野における商業利用の可能性が広がっている。

編集用途としての画像アップロード機能も追加されており、OpenAIのビデオ生成モデル「Sora」との連携や、将来的なマルチモーダルコンテンツ制作への拡張も視野に入れられている。

 

広告・デザイン業界への影響と活用可能性

新モデルの導入により、広告制作の初期段階でのアイデア出しやキャンペーンビジュアルの試作、複数案の比較といった作業が大幅に効率化される。コンセプトの反復検討にかかる手間が削減されることで、チーム間でのやり取りも簡素化され、クリエイティブのスピードが格段に向上する。これらすべてが、会話形式のインターフェース一つで可能となる。

OpenAIは、「たとえばビデオゲームのキャラクターをデザインする場合、その外見はユーザーの試行錯誤を経て、一貫性のある形で維持される」と述べており、生成内容の一貫性と制御性が飛躍的に向上していることを強調している。

提供スケジュールとユーザーへの展開

GPT-4oの新しい画像生成機能は、すでにPlus、Pro、Team、Freeプランのユーザーに対して展開が始まっており、今後はEnterpriseおよびEduユーザー向けにも順次アクセスが提供される見込みである。

今回のアップデートは、OpenAIの生成AIツールが、単なるクリエイティブ遊びの域を超え、プロフェッショナルな制作現場で活用されるフェーズに入ったことを示すものである。実用性、精度、再現性を備えたこの新モデルは、ビジュアルコンテンツ制作における新たなスタンダードとなる可能性を秘めている。(出典:Open AI, Branding in Asia)

最近のお知らせお知らせ一覧