Lancement de Vidu : Une Révolution dans le Modèle Vidéo en Chine
Introduction à Vidu
Le 30 juillet, Shengshu AI a dévoilé Vidu (www.vidu.studio), le premier modèle vidéo à grande échelle développé en Chine et le premier concurrent mondial de Sora. Cette plateforme se distingue par sa simplicité d’accès, permettant aux utilisateurs de commencer à l’utiliser immédiatement après une simple inscription par e-mail.
Un Pionnier de l’Intelligence Artificielle
Shengshu AI se positionne comme un leader en Chine dans le domaine des modèles multimodaux à usage général. En avril dernier, en partenariat avec l’Université de Tsinghua, ils ont lancé Vidu, un modèle vidéo qui rivalise avec Sora d’OpenAI. Depuis sa présentation initiale, Vidu a suscité un intérêt considérable tant sur le marché national qu’international, grâce à ses capacités impressionnantes de conversion de texte en vidéo longue.
Fonctionnalités Avancées de Vidu
Vidu propose désormais des fonctionnalités de conversion de texte en vidéo et d’image en vidéo, avec des durées de 4 et 8 secondes et une résolution maximale de 1080P. Le modèle se distingue par son dynamisme, son réalisme et sa cohérence, comme l’a démontré sa première présentation. De plus, il a intégré de nouvelles options telles que la cohérence des personnages (Character To Video), un style anime, ainsi que la génération d’images avec texte et effets spéciaux.
Une Expérience Utilisateur Inégalée
En matière d’expérience utilisateur, Vidu établit un nouveau standard dans l’industrie avec sa rapidité d’inférence, générant un clip de 4 secondes en seulement 30 secondes. Cela surpasse de manière significative les outils vidéo AI traditionnels, qui nécessitent généralement entre 1 et 5 minutes, voire plus, pour produire un clip de cette durée. L’efficacité de Vidu garantit une expérience créative presque sans interruption et permet à la plateforme de répondre facilement aux besoins d’une large base d’utilisateurs, en offrant des services personnalisés.
Développement Rapide et Efficace
Le développement rapide de Vidu, de son lancement à sa mise en service en seulement trois mois, est le résultat de l’expertise technique de l’équipe de R&D de Vidu, notamment leur expérience en matière d’entraînement de modèles efficaces. Les tâches d’entraînement intensif et rapide nécessitent non seulement une puissance de calcul considérable, mais aussi une approche globale garantissant la qualité, de la préparation des données à l’inférence du modèle.
Utilisation de la Plateforme AIHC de Baidu
Pour optimiser l’entraînement de son modèle, Vidu utilise la plateforme AI Heterogeneous Computing (AIHC) de Baidu. Conçue autour d’un cœur GPU, AIHC est le fruit de plusieurs années d’expérience de Baidu Intelligent Cloud dans le domaine de l’IA et est particulièrement adaptée à l’entraînement de grands modèles, garantissant à la fois stabilité et efficacité.
Amélioration de l’Efficacité de l’Entraînement
AIHC se distingue par sa capacité à améliorer l’efficacité de l’entraînement des modèles en gérant les ressources informatiques à travers différents emplacements, échelles et clusters. Ses technologies, telles que l’optimisation des performances des puces, la sélection automatique des puces et la co-localisation des marées, augmentent considérablement l’efficacité de la puissance de calcul intelligente. La plateforme atteint un ratio de temps d’entraînement effectif de plus de 98,8 % sur un cluster de dix mille cartes, avec un ratio d’accélération linéaire et une efficacité de bande passante dépassant 95 %.
Stabilité et Fiabilité de l’Entraînement
En plus de l’efficacité, AIHC de Baidu met également l’accent sur la stabilité de l’entraînement des modèles. Elle propose une multitude d’outils d’opération et d’observabilité ainsi que des capacités de tolérance aux pannes. Ces caractéristiques renforcent la stabilité des opérations à long terme des clusters à grande échelle, réduisant ainsi le risque d’interruptions prématurées des tâches d’entraînement et d’inférence dues à des pannes, ce qui minimise les pertes commerciales.
Conclusion
Vidu représente une avancée significative dans le domaine des modèles vidéo, offrant des fonctionnalités innovantes et une expérience utilisateur exceptionnelle. Grâce à des technologies avancées et à une approche axée sur l’efficacité et la stabilité, Vidu est bien positionné pour transformer le paysage de la création vidéo en Chine et au-delà.