« C'est super amusant de voir les gens adorer les images dans ChatGPT. Mais nos GPU fondent. » Patron d'OpenAI, Sam Atlman indique que pour faire face à cette « surchauffe », une limite sur les demandes de génération d'images va être introduite.
La restriction n'est pas davantage détaillée, mais elle sera temporaire pendant qu'OpenAI travaille à améliorer son efficacité dans la gestion des trop nombreuses requêtes mettant à mal ses serveurs. Sam Altman dit simplement espérer que cela ne sera pas long.
La nouvelle génération d'images tire parti du modèle GPT-4o avec ses capacités multimodales et permet une génération native d'images directement dans ChatGPT. Auparavant, ChatGPT faisait appel à DALL-E3.
Un carton avec l'inspiration du studio Ghibli
En la matière, la nouveauté constitue une grosse mise à niveau, notamment pour le rendu précis du texte au sein des images et le suivi des instructions des utilisateurs. GPT-4o peut traiter entre 10 et 20 objets différents.
Le contexte des conversations est pris en compte et la vaste base de connaissances de GPT-4o est à disposition. Des images soumises peuvent également être transformées dans une multitude de styles. À ce titre, la transformation de photos dans le style du studio d'animation japonais Studio Ghibli est devenue virale. Elle pose des questions sur le droit d'auteur avec en filigrane l'entraînement du modèle.
ChatGPT image generation enables so much creativity! https://t.co/u0pvelLJKu
— Greg Brockman (@gdb) March 26, 2025
En raison de la surcharge, Sam Altman avait déjà annoncé un report du déploiement de la nouvelle génération d'images pour les utilisateurs gratuits de ChatGPT, même si elle doit pourtant être cantonnée à trois images par jour au maximum.
Un modèle GPT-4o avec des améliorations
Pour les utilisateurs payants de ChatGPT, une mise à jour GTP-4o apporte par ailleurs une meilleure aptitude à suivre les instructions détaillées, en particulier avec des prompts contenant des requêtes multiples.
Il est également mis en avant une meilleure capacité à résoudre des problèmes techniques et de codage complexes, ainsi qu'une amélioration de l'intuition et de la créativité.
Sur Chatbot Arena, la version amendée de GPT-4o est mieux classée que GPT-4.5 (preview). Elle occupe une deuxième position derrière Gemini 2.5 Pro (Experimental) de Google. La disponibilité concerne tous les abonnés payants. Elle arrivera au cours des prochaines semaines pour les utilisateurs gratuits (avec les limitations habituelles sur la fréquence d'usage).