Modelos de video con IA Wan 2.2 de Alibaba Wan AI

Wan AI es un modelo avanzado y potente de generación visual desarrollado por Tongyi Lab. Puede generar videos basados en texto, imágenes y otras señales de control. Los modelos de la serie Wan 2.2 ahora son completamente de código abierto después de Wan 2.1.

Wan 2.2

433/1200

No Video Generation History

Enter a prompt and click "Generate Video" to start creating! Your videos will appear here.

Descripción general de Wan AI

Rendimiento SOTA

Wan-2.2-AI Image to Video Example 1

Wan 2.2 supera constantemente los modelos de código abierto existentes y las soluciones comerciales más avanzadas en múltiples benchmarks.

Soporta GPU de consumo

El modelo T2V-1.3B requiere solo 8.19 GB de VRAM, lo que lo hace compatible con casi todas las GPU de consumo. Puede generar un video de 5 segundos en 480P en una RTX 4090 en aproximadamente 4 minutos (sin técnicas de optimización como cuantización). Su rendimiento es incluso comparable a algunos modelos de código cerrado.

Múltiples tareas

Wan-2.2-AI Image to Video Example 2

Wan 2.2 sobresale en Texto a Video, Imagen a Video, Edición de Video, Texto a Imagen y Video a Audio, avanzando en el campo de la generación de video.

Generación de texto visual

Wan 2.2 es el primer modelo de video capaz de generar texto en chino e inglés, con una generación de texto robusta que mejora sus aplicaciones prácticas.

Potente VAE de video de Wan AI

Wan-2.2-AI Image to Video Example 3

Wan-VAE ofrece una eficiencia y rendimiento excepcionales, codificando y decodificando videos 1080P de cualquier longitud mientras preserva la información temporal, lo que lo convierte en una base ideal para la generación de video e imagen.

Características de Wan AI

Movimientos complejos de Wan AI 2.2

Destaca en la generación de videos realistas con movimientos corporales extensos, rotaciones complejas, transiciones dinámicas de escenas y movimientos fluidos de cámara.

Simulación física de Wan AI 2.2

Wan-2.2-AI Video Feature Example 1

Genera videos que simulan con precisión la física del mundo real y las interacciones realistas de objetos.

Calidad cinematográfica de Wan AI 2.2

Ofrece visuales de calidad cinematográfica con texturas ricas y una variedad de efectos estilizados.

Edición controlable de Wan AI 2.2

Wan-2.2-AI Video Feature Example 2

Incluye un modelo de edición universal para ediciones precisas utilizando referencias de imagen o video.

Generación de texto visual de Wan AI 2.2

Crea texto y efectos de texto dinámicos en videos directamente desde indicaciones de texto.

Características del producto

A través de nuestro producto, puede aprovechar nuestros modelos de manera fluida con una experiencia fácil de usar para acceder a contenido de video inspirador.

Wan-2.2-Artany Feature 1

Texto a video

Imagen a video

Wan-2.2-Artany Feature 2

Fotogramas iniciales y finales

Wan AI 2.2 de código abierto

En este repositorio, publicamos el código y los pesos para Wan 2.2, un conjunto completo y abierto de modelos base de video diseñados para ampliar los límites de la generación de video.

Wan2.2-I2V

El modelo I2V-14B supera a los principales modelos de código cerrado y a todos los modelos de código abierto existentes, logrando un rendimiento SOTA. Es capaz de generar videos que demuestran escenas visuales complejas y patrones de movimiento basados en texto e imágenes de entrada, incluyendo modelos de resolución 480P y 720P.

Wan2.2-T2V

480-720P
Wan-2.2-AI Video Analysis Example

El modelo T2V-14B establece un nuevo rendimiento SOTA entre modelos de código abierto y cerrado, mostrando su capacidad para generar visuales de alta calidad con una dinámica de movimiento sustancial. También es el único modelo de video capaz de producir texto en chino e inglés y admite la generación de video en resoluciones 480P y 720P.

Wan2.2-T2V-1.3B

480P
Wan-2.2-AI Video Processing Example

El modelo T2V-1.3B admite la generación de video en casi todas las GPU de consumo, requiriendo solo 8.19 GB de BRAM para producir un video de 5 segundos en 480P, con un tiempo de salida de solo 4 minutos en una GPU RTX 4090. A través de procesos de preentrenamiento y destilación, supera a modelos de código abierto más grandes y logra un rendimiento comparable incluso a algunos modelos de código cerrado avanzados.

Wan2.2-FLF2V-14B-720P

Wan 2.1 First-Last-Frame-to-Video (FLF2V) es una tecnología de generación de video basada en IA que sintetiza fotogramas intermedios entre un fotograma inicial y final dados para producir videos fluidos. Utiliza un modelo de 14B parámetros, admite inferencia acelerada multi-GPU y ofrece puntos de control preentrenados con una demo Gradio para pruebas interactivas. Las aplicaciones incluyen restauración de video, producción de animación y más.

¡Alibaba Wan2.2 – Ya disponible!

Actualización de próxima generación, más allá de los límites

¡El nuevo Wan2.2 ya está aquí, ofreciendo mayor rendimiento, mayor eficiencia y capacidades más inteligentes!

Computación ultrarrápida con Wan2.2

Experimente el máximo rendimiento con la arquitectura optimizada de Wan2.2

Latencia ultra baja

Logre una eficiencia de transmisión de red inigualable con Wan2.2

Amplia compatibilidad

Wan2.2 admite perfectamente diversos escenarios comerciales

Optimización con IA

Disfrute del ajuste automático inteligente con Wan2.2

¡Explore Wan2.2 hoy mismo!

¡Descubra las últimas características y capacidades de Wan2.2!

Preguntas frecuentes

1

¿Qué es Wan2.2 de Wan AI y cómo funciona?

Wan2.2 de Wan AI es el modelo de generación de video más avanzado de Alibaba Cloud que transforma descripciones de texto en videos impresionantes y de alta calidad. Utilizando tecnologías avanzadas como Variational Autoencoders (VAE) y Diffusion Transformers (DiT), garantiza visuales realistas, transiciones fluidas y física precisa para una experiencia verdaderamente inmersiva.

2

¿Necesito experiencia técnica para usar Wan 2.2 de Wan AI?

Wan 2.2 de Wan AI está diseñado pensando en la simplicidad. Su interfaz intuitiva permite a cualquier persona crear videos de calidad profesional sin esfuerzo, incluso sin habilidades técnicas avanzadas. Ya sea que sea un principiante o un profesional, encontrará la plataforma fácil de navegar y usar.

3

¿Qué tipos de videos puedo crear con Wan 2.2 de Wan AI?

Wan 2.2 de Wan AI es versátil y capaz de generar una amplia gama de contenido de video. Desde escenas dinámicas como baile y deportes hasta tutoriales educativos y restauración de videos históricos, le permite dar vida a su visión creativa.

4

¿Cuánto tiempo lleva generar un video?

El tiempo de generación de video depende de la complejidad y duración de su proyecto. Para resultados más rápidos, la versión Pro ofrece velocidades de procesamiento aceleradas, lo que la hace ideal para tareas sensibles al tiempo.

5

¿Puedo personalizar la salida de video?

¡Absolutamente! Wan 2.2 de Wan AI ofrece amplias opciones de personalización, permitiéndole ajustar la resolución, la tasa de fotogramas, la complejidad del movimiento y más. Adapte sus videos a sus necesidades y preferencias específicas.

6

¿Qué formatos de entrada admite Wan 2.2 AI de Wan AI para la generación de video?

Wan 2.2 AI de Wan AI admite principalmente descripciones de texto como entrada para la generación de video. Puede proporcionar indicaciones textuales detalladas que describan la escena, las acciones y los efectos visuales deseados. Además, puede admitir entradas de imágenes para un contexto mejorado en futuras actualizaciones.

7

¿Puede Wan 2.2 AI de Wan AI generar videos en varios idiomas?

Sí, Wan 2.2 AI de Wan AI admite entradas de texto multilingües, lo que le permite generar videos basados en descripciones en varios idiomas. Sin embargo, la calidad de la salida puede variar según el idioma y la complejidad de la descripción.

8

¿Hay un límite en la duración de los videos que Wan 2.2 de Wan AI puede generar?

La duración de los videos generados depende del plan de suscripción. La versión gratuita puede tener limitaciones en la duración del video, mientras que la versión Pro admite una generación de video más larga y compleja. Los límites específicos se pueden encontrar en la documentación de la plataforma.

9

¿Cómo garantiza Wan 2.2 de Wan AI la calidad de los videos generados?

Wan 2.2 AI de Wan AI utiliza tecnologías avanzadas como Variational Autoencoders (VAE) y Diffusion Transformers (DiT) para garantizar salidas de alta calidad. Estas tecnologías permiten visuales realistas, transiciones fluidas y simulaciones físicas precisas.

10

¿Cómo maneja Wan 2.2 de Wan AI escenas complejas con múltiples personajes?

Wan 2.2 de Wan AI está diseñado para manejar escenas complejas con múltiples personajes analizando las relaciones e interacciones descritas en la entrada de texto. Utiliza algoritmos avanzados para garantizar posicionamiento, movimientos e interacciones realistas entre personajes.