OpenAI a lancé lundi GPT-Image-2 alongside du rebrand grand public « ChatGPT Images 2.0 ». Premier modèle d'image OpenAI avec une capacité de raisonnement (« thinking ») native intégrée à l'architecture — il peut décomposer une consigne complexe en étapes avant de générer.
Génération et édition à 1K, 2K et 4K en natif. Acceptation jusqu'à 16 images de référence en entrée. Rendu de texte multilingue parfait dans l'image, y compris pour les caractères chinois, japonais et coréens. En 12 heures, le modèle a pris la première place sur toutes les catégories du leaderboard Image Arena, avec une avance de +242 points.
Tous les utilisateurs ChatGPT et Codex ont accès depuis le 22 avril ; l'API ouvre aux développeurs début mai. Pour les freelances qui produisent des visuels social media, c'est un upgrade gratuit qui rend obsolète la moitié des prompts Midjourney du quotidien.