Après avoir renforcé ses modèles de raisonnement avec GPT 5.2, OpenAI accélère sur un autre terrain stratégique: la génération d'images. L'entreprise a annoncé le déploiement de GPT Image 1.5, une évolution majeure de son modèle intégré à ChatGPT, désormais commercialisé sous l'appellation ChatGPT Images. Objectif affiché: proposer des créations visuelles plus précises, plus rapides et mieux alignées avec les intentions de l'utilisateur, dans un contexte de concurrence accrue menée par Google et ses modèles Nano Banana.
Basé sur l'architecture de GPT-4o, GPT Image 1.5 ne constitue pas une rupture technologique radicale, mais marque une montée en maturité significative. OpenAI met en avant un suivi des instructions nettement renforcé, une capacité d'édition fine et surtout une vitesse de génération jusqu'à quatre fois plus rapide que la version précédente. Cette amélioration vise à réduire les allers-retours souvent nécessaires pour obtenir un rendu fidèle à la demande initiale.
L'un des points forts du nouveau modèle réside dans sa capacité à modifier uniquement les éléments demandés, sans altérer l'équilibre général d'une image. Éclairage, composition, couleurs ou traits du visage sont mieux préservés d'une version à l'autre, y compris lors d'éditions successives. Cette cohérence ouvre la voie à des usages plus crédibles, comme l'essayage virtuel de vêtements, la retouche de photos produits ou la création de visuels marketing cohérents.
GPT Image 1.5 se distingue également par ses progrès en rendu de texte, un point longtemps problématique pour les modèles de génération d'images. Il est désormais capable de produire des textes denses, des infographies lisibles ou des mises en page complexes de type « article de journal », avec moins d'erreurs visuelles ou de caractères incohérents.
Pour accompagner cette évolution technologique, OpenAI introduit une interface dédiée aux images directement dans ChatGPT. Accessible via une barre latérale, cet espace permet aux utilisateurs de s'appuyer sur des styles prédéfinis, des filtres et des idées tendances, sans nécessairement formuler un prompt détaillé. L'ambition est claire: transformer ChatGPT en un véritable studio créatif, capable aussi bien de retouches pratiques que de transformations artistiques plus poussées.
Autre nouveauté notable: la possibilité d'enregistrer une apparence ou un visage une seule fois, afin de le réutiliser dans des créations ultérieures, sans avoir à réimporter systématiquement des photos. Un gain de temps qui renforce l'usage régulier du service.
Le lancement de GPT Image 1.5 intervient dans un contexte de rivalité directe avec Google, dont les modèles Nano Banana misent sur la rapidité et la qualité visuelle. OpenAI assume cette confrontation, tout en cherchant à séduire les professionnels. Le modèle est disponible via l'API à un coût inférieur de 20 % à la version précédente, facilitant son intégration dans des outils tiers déjà populaires comme Wix, Canva, Figma ou encore Adobe.
Disponible dès aujourd'hui pour tous les utilisateurs de ChatGPT, GPT Image 1.5 marque une étape supplémentaire dans la stratégie d'OpenAI: faire de son chatbot une plateforme polyvalente, capable de répondre aussi bien aux besoins créatifs grand public qu'aux exigences des entreprises. Si Google conserve une avance sur certains aspects, OpenAI prépare déjà la suite, avec l'arrivée attendue de GPT-5o, qui pourrait rebattre les cartes en 2026.
Commentaires
Enregistrer un commentaire