
Modèle de génération d'images Sora amélioré lancé : non seulement utilisable directement dans ChatGPT, mais menace aussi les créateurs de memes
TechFlow SélectionTechFlow Sélection

Modèle de génération d'images Sora amélioré lancé : non seulement utilisable directement dans ChatGPT, mais menace aussi les créateurs de memes
La direction officielle lance la création de mèmes.
Alors que DeepSeek avait lancé il y a seulement 24 heures une mise à jour de son modèle V3 (version 0324), OpenAI semble véritablement vouloir « en remettre une couche », annonçant dans la nuit du 26 mars, heure de Pékin, un événement dédié à une nouvelle annonce.

Bien qu’avant le lancement officiel, certaines rumeurs évoquaient la possible sortie de GPT-5, selon les habitudes passées d’OpenAI en matière de rythme de publication, cette annonce ne constituait pas une mise à jour majeure. Toutefois, l’intégration de la nouvelle version de Sora directement dans ChatGPT, présentée lors du livestream, a produit un effet inattendu et spectaculaire.
Pour l’instant, la version de Sora intégrée à ChatGPT se limite temporairement à la génération d’images, contrairement à l’application autonome. Mais selon OpenAI, ce nouveau modèle représente un saut qualitatif par rapport aux précédents.
Comme présenté lors de la démonstration, l’équipe de développement s’est appuyée sur les capacités « multimodales » de GPT-4o — c’est-à-dire capables de produire tout type de données, texte, image, audio ou vidéo — pour construire cette version de Sora. Ainsi, les utilisateurs peuvent simplement exprimer verbalement leurs besoins, voire envoyer ou prendre une photo servant de prompt.
Lors de la démonstration en direct, ils ont ainsi pris un selfie avec leur téléphone, incluant Sam Altman et deux autres personnes, puis demandé à Sora de générer une « version dans un style manga ».

Mais ce n’était pas tout : les trois participants ont également fait une démonstration en direct où Sora a ajouté du texte sur l’image : « Feel The AGI » (ressentez l’intelligence artificielle générale). Une première création humoristique en temps réel avec cette nouvelle version de Sora.
Cette image générée en direct présente non seulement un texte clair et précis, mais comprend aussi parfaitement les éléments essentiels des memes modernes populaires, comme l’utilisation de caractères gras, au point d’être immédiatement partageable dans n’importe quel groupe.

Étant donné qu’OpenAI a elle-même initié ce jeu, de nombreux utilisateurs dans les commentaires se sont enthousiasmés, testant le même prompt avec Grok, en utilisant la même photo et les mêmes instructions pour produire un contenu similaire — mais les résultats étaient nettement inférieurs à ceux de la nouvelle version de Sora, créant involontairement un effet encore plus comique.

En plus de créer des memes, OpenAI a montré les améliorations apportées par la nouvelle version de Sora en matière de rendu textuel, permettant désormais de générer du texte cohérent sans fautes d’orthographe avec un taux de réussite nettement accru.
Dans un autre scénario de démonstration, l’équipe OpenAI a demandé à Sora de générer une vignette de bande dessinée illustrant la théorie de la relativité.
Contrairement aux modèles classiques de génération d’images, dont le texte est souvent chaotique, voire composé de « caractères inventés par l’IA », la nouvelle version de Sora produit désormais un texte intégré parfaitement lisible, sans aucune erreur apparente, allant jusqu’à générer un japonais naturel et fluide dans la bande dessinée, provoquant une vive réaction positive au sein de la communauté japonaise.

Pour les modèles de génération d’images, rendre correctement le texte a longtemps été un défi majeur. Une faute d’orthographe ou une erreur dans un titre ou un élément textuel pouvait rendre toute l’image inutilisable.
De plus, dans ce cas précis, OpenAI a également démontré la capacité du modèle à faire référence avec justesse à des connaissances existantes dans le monde réel.

« Si je dessine une image, je suis limité par mes propres compétences… ainsi que par mes connaissances accumulées du monde », explique Jackie Shannon, responsable produit multimodal chez ChatGPT, soulignant la nécessité de cette fonctionnalité lors d’un entretien avec la presse.
« Le modèle intègre ces connaissances du monde ; ainsi, lorsque vous demandez une image de l’expérience du prisme de Newton, vous n’avez pas besoin d’expliquer ce qu’est cette expérience pour obtenir une représentation précise. »

Au-delà de ces améliorations perçues par l’utilisateur, un détail supplémentaire : OpenAI a confirmé que la génération d’images par la nouvelle version de Sora prend désormais plus de temps, mais juge ce compromis acceptable.
« Certes, nous avons encore de la marge d’amélioration en termes de latence… mais (nous pensons que) la qualité, les fonctionnalités et les connaissances du monde intégrées dans ces images compensent largement les quelques secondes supplémentaires d’attente », affirme Shannon.
Concernant les problèmes de sécurité dans la génération d’images — notamment la multiplication, depuis l’année dernière, d’images truquées mettant en scène des célébrités, de fausses images liées à des faits d’actualité, ou encore le retrait des filigranes originaux sur les photos par Google Gemini — l’équipe OpenAI insiste sur le fait que la nouvelle version de Sora est capable de supprimer les filigranes photographiques, bloque la création d’images deepfake génératives, et refuse catégoriquement les requêtes associées. Toutes les images générées contiendront désormais des métadonnées C2PA standard, indiquant clairement qu’elles ont été créées par OpenAI.
Actuellement, la fonctionnalité de génération d’images via Sora intégré à ChatGPT est accessible aux abonnés aux formules Pro et Plus. OpenAI promet que cette nouvelle version de Sora sera bientôt proposée gratuitement ainsi qu’en API.
La première chose que j’ai envie de faire maintenant, c’est lui demander de créer un meme avec moi.
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News










