ByteDance dévoile le modèle IA OmniHuman-1 pour la génération de vidéos hyperréalistes

ByteDance, la société à l’origine de TikTok, a présenté OmniHuman-1, un modèle d’intelligence artificielle capable de transformer des photos et des fichiers audio en vidéos ultra-réalistes, illustrant les progrès rapides de la Chine en matière d’IA. Ce modèle multimodal génère des vidéos de personnes parlant, chantant et bougeant avec un réalisme qui surpasse largement les méthodes actuelles de synthèse vidéo humaine par IA, selon les chercheurs de ByteDance.

Avancées majeures dans la génération de vidéos par IA

La synthèse d’images, de vidéos et d’audio par IA—souvent associée aux deepfakes—suscite un vif débat entre ses applications dans le divertissement et ses risques de fraude. La division IA de ByteDance s’est imposée comme un leader dans ce domaine, notamment grâce à son application Doubao, devenue le produit IA grand public le plus populaire en Chine.

Bien que OmniHuman-1 ne soit pas encore accessible au public, des exemples de vidéos ont déjà fait le buzz, révélant ses capacités impressionnantes. L’une des démonstrations les plus marquantes présente un clip de 23 secondes d’Albert Einstein prononçant un discours. Kyle Wiggers de TechCrunch a qualifié ce rendu de « terriblement réaliste », suggérant qu’il pourrait s’agir des deepfakes les plus convaincants jamais réalisés.

>>> Q901 pour Aurora Q901 Q902 Q903

Le lancement de OmniHuman-1 intervient alors que les États-Unis cherchent à restreindre le développement de l’IA en Chine, mais les entreprises chinoises poursuivent leurs avancées en technologies de génération vidéo. La plateforme Jimeng AI de ByteDance, qui intègre les modèles PixelDance et Seaweed, bénéficie de mises à jour fréquentes, améliorant sa capacité à produire des vidéos cohérentes et ultra-réalistes.

D’autres entreprises technologiques chinoises se positionnent également sur ce marché, notamment Kuaishou Technology, avec son application Kling, ainsi que plusieurs startups IA comme Zhipu AI, Shengshu Tech et MiniMax.

Avec des avancées comme OmniHuman-1, ByteDance se positionne comme un acteur majeur de la vidéo générée par IA, rivalisant potentiellement avec des outils comme Sora d’OpenAI, dont la disponibilité a été élargie en décembre 2024. À mesure que ces technologies évoluent, leurs applications—dans les secteurs du divertissement, des médias numériques et de la création de contenu—devraient connaître une expansion significative.

Avancées majeures dans la génération de vidéos par IA

Leave a Reply Cancel reply