ByteDance va lancer Seedance 2.1, affrontant Veo 4 ?

Dans la course à la génération vidéo IA de 2026, Seedance 2.0 est devenu la référence pour presque tous les nouveaux modèles publiés. Que ce soit la série Veo de Google ou Sora d’OpenAI, chaque nouvelle sortie est comparée à Seedance 2.0. Ce type de “être la norme” est en soi une forme de reconnaissance.

Mais la concurrence ne s’arrête jamais. Récemment, Google, qui était resté relativement silencieux, semble préparer quelque chose de grand. Gemini Omni, un modèle de génération vidéo entièrement nouveau, est apparu accidentellement dans l’interface de chat Gemini.

Gemini Omni émerge

Ce matin tôt, un utilisateur a accidentellement déclenché cette nouvelle fonctionnalité de génération vidéo dans Gemini. L’interface affichait directement :

“Créez avec Gemini Omni : découvrez notre nouveau modèle de génération vidéo. Remixez vos vidéos, modifiez directement en conversation, essayez des modèles riches et plus encore.”

Bien que la fonctionnalité ait disparu lorsque l’utilisateur a rouvert l’application, les vidéos de test fuitées ont suffi à causer un tollé dans la communauté.

Défi au tableau mathématique : percée dans le rendu de texte

Le premier cas de test fui était une vidéo de 10 secondes : un professeur écrivant des preuves mathématiques d’identités trigonométriques sur un tableau traditionnel tout en expliquant les étapes.

Le prompt n’était qu’une seule phrase : “Un professeur écrit la preuve mathématique d’identités trigonométriques sur un tableau traditionnel, expliquant l’étape qu’il effectue actuellement dans l’équation.”

Bien que certains artefacts générés par IA puissent encore être trouvés dans les images, le traitement du contenu textuel sur le tableau était assez précis, un bug majeur qui affligeait de nombreux modèles vidéo précédents. Le réalisme global de la vidéo était également impressionnant.

Un hommage classique : Will Smith mangeant des spaghettis

Le deuxième cas de test a continué avec cette tradition classique : “Will Smith mangeant des spaghettis” est devenu l’un des prompts obligatoires pour pratiquement tous les modèles de génération vidéo.

En raison des restrictions de contenu, l’évaluateur a décrit deux hommes ressemblant à Will Smith dînant dans un restaurant élégant. Dans la vidéo générée par Gemini Omni, l’ensemble du processus, depuis que les hommes s’approchent de la table et échangent des politesses jusqu’à commencer à manger les spaghettis, était fluide et naturel.

Comparaison directe : Gemini Omni vs Seedance 2.0

Que se passe-t-il lorsque les mêmes prompts sont soumis aux deux modèles ?

Capacité de rendu de texte

Dans le test du tableau mathématique, Gemini Omni a géré le texte du tableau de manière significativement meilleure. Le contenu généré par Seedance 2.0 avait peu de lien avec les identités trigonométriques, et il y avait encore des problèmes de rendu de texte sur le tableau.

Gestion de la logique physique

Dans la scène où ils mangent des spaghettis, Seedance 2.0 s’est comporté de manière plus naturelle. Gemini Omni a montré quelques problèmes mineurs de physique : lorsque les personnages étaient debout, il n’y avait pas de spaghettis dans l’assiette, mais ils sont soudainement apparus après s’être assis, et pendant le repas, les spaghettis ont disparu sans être vraiment consommés.

Évaluation globale

Gemini Omni est certainement impressionnant en matière de cohérence de texte, mais Seedance 2.0 conserve toujours l’avantage en termes de logique physique de génération vidéo. Les deux produits ont leurs forces, et les performances réelles dépendent du cas d’utilisation spécifique.

Pas seulement la génération : capacités d’édition vidéo de Gemini Omni

Cette fuite a également mis en lumière un autre point fort : Gemini Omni a démontré de puissantes capacités d’édition vidéo.

Les utilisateurs peuvent remplacer directement des objets dans les vidéos dans la conversation. Par exemple, les spaghettis dans la vidéo originale peuvent être remplacés par un bol de soupe tom yum. Plus utilement, il peut également supprimer les filigranes générés par d’autres outils d’IA : le test a supprimé avec succès le filigrane Sora en mouvement continu tout en maintenant la cohérence de base de la vidéo originale.

Vidéo IA : devenir un média principal

La concurrence entre ces deux produits n’est que la partie visible de l’iceberg. Récemment, une vague de vidéos de haute qualité générées par IA a explosé sur Internet.

Marko Slavnic, artiste technique chez Runway, a créé une vidéo de pigeon générée par IA qui a recueilli un million de vues. Le clip de 47 secondes n’a montré aucun trace d’IA ; peut-être que l’équipe d’animation Disney devrait s’inquiéter.

En Chine, le contenu sous le sujet Weibo “Courts métrages IA : Production de masse de Love, Death, and Robots” est devenu viral internationalement, atteignant 12 millions de vues après avoir été partagé à l’étranger. Le créateur a révélé que le court métrage a été réalisé avec Seedance 2.0 en 10 jours et s’est déjà associé à une société de production cinématographique pour une sortie en salle.

Ces cas démontrent que la vidéo IA évolue d’un “jouet de laboratoire” vers un médium créatif principal.

Seedance 2.1 arrive-t-il ?

La fuite de Gemini Omni par Google pourrait être en train de créer l’anticipation pour la conférence Google I/O de la semaine prochaine. Si Gemini Omni est officiellement lancé lors de la conférence, la deuxième moitié de la concurrence de génération vidéo IA commencera officiellement.

Pendant ce temps, ByteDance se prépare également activement. Des sources indiquent que Seedance 2.1 est déjà en développement et pourrait être lancé en même temps que Veo 4.

Quel que soit le résultat final, pour les créateurs de contenu, c’est le meilleur des temps : les outils évoluent, les barrières diminuent et les possibilités s’étendent à l’infini.

Commencez avec Seedance 2.0

Vous voulez expérimenter la puissance de Seedance 2.0 par vous-même ? Cliquez sur le bouton ci-dessous pour commencer à créer maintenant.

Commencez avec Seedance 2.0