OpenAIは12月1日、画像生成AIの最新版「ChatGPT Images 1.5」をリリースしました。


このモデルは、画像生成の速度が従来に比べて最大4倍も高速化され、操作性や表現力が大きく進化しています。
リリースと同時にAPIでの提供も開始され、ユーザーはゼロからの画像作成や写真の編集など、より直感的で便利な機能を体験できるようになりました。
今回のバージョンアップでは、指示に従う精度や編集能力が大幅に向上しています。
たとえば、アップロードした画像に対して「もう少し明るく」「髪型だけ変えて」など細かい編集依頼を出すと、意図を忠実に汲み取りつつ、ライティングや構図、人物の見た目といった重要な要素も一貫して維持してくれます。
信憑性の高い写真編集や、バーチャル試着・ヘアスタイルシミュレーションもスムーズにこなせるのが魅力ですね。
元画像の要素をしっかり保持したまま、概念的な変換まで可能な点は実に興味深いです。
操作面でも工夫がされていて、ChatGPTのサイドバーに「画像」専用メニューが新設され、プリセットフィルターやトレンドプロンプトが表示されたり、プロンプトを書いてすぐ画像を生成したりできるようになりました。
しかも、画像生成中に並行してさらに新しい画像を作り続けることもでき、ものすごく快適です。
コスト面でも進化していて、Image 1.5のAPI利用料は従来モデルより20%も安価になったとのこと。
初日からグローバルに無料・有料問わず展開され、活用の幅が一気に広がった印象です。
OpenAIのサム・アルトマンCEOも、生成したマッチョな消防士姿の自分の画像をXで公開して話題を集めていました。
AIとテキストでやり取りしながら自由に画像を作り、編集できる——この体験は「自分の頭の中と実現の間の距離を縮める」ものだと説明されています。
ライバルのGoogleも「Nano Banana」という高速画像生成AIを8月にリリースしていますが、ChatGPT Images 1.5の登場で勢力図も大きく動きそうです。



リリース後わずか10日間で7億枚以上も画像が生成された数字には素直に驚きました。
画像生成AIの進化は今後も止まりそうにありません。
個人的には、ここまで指示通りに画像を変換したり、ユーザーの細かな要望に応えられる技術の裏側がどうなっているのか実際に触りながら確かめてみたくなりました。
APIドキュメントにも新しいパラメータが増えていそうで、色々実験したいです。
早くAdobe税からおさらばしたい。

