Google анонсировала Veo 3: новый ИИ-видеогенератор, который создает видео со звуком
14 мая 2025 года подразделение Google DeepMind представило свою флагманскую модель для генерации видео Veo 3. Это стало главным анонсом в области генеративных медиа на конференции Google I/O.
Ключевой особенностью Veo 3 стала способность генерировать не только видеоряд, но и нативный звук за один шаг. Модель может создавать фоновые шумы, звуковые эффекты и даже диалоги с полной синхронизацией губ (липсинк), что является значительным прорывом в этой сфере.
Veo 3 понимает сложные текстовые запросы и кинематографические стили, такие как «таймлапс» или «аэросъемка». Модель также способна «оживлять» статичные картинки, создавая из них видеоклипы, при этом точно сохраняя стилистику и детали исходного изображения.
Новая модель будет интегрирована в сервисы Google, включая Vertex AI для разработчиков, Google Photos и YouTube Shorts. Также доступ к Veo 3 получат сторонние платформы, например, сервис Canva.