Google DeepMind показали генератор видео Veo 2 — длительность до двух минут и поддержка 4k | Hi-Tech

Google DeepMind представила Veo 2 — продвинутый ИИ-генератор видео, способный создавать ролики в 4K-разрешении (4096 × 2160) длиной до двух минут. Это в четыре раза выше по качеству и в шесть раз дольше, чем предлагает OpenAI Sora. Однако пока возможности Veo 2 сильно урезаны: тестировать модель можно только на экспериментальной платформе VideoFX, где максимальное разрешение ограничено 720p, а видео — всего восемью секундами. Для сравнения, OpenAI Sora уже позволяет создавать 20-секундные ролики в 1080p. Желающим опробовать Veo 2 придётся записаться в лист ожидания, хотя Google обещает вскоре расширить доступ и запустить модель на бизнес-платформе Vertex AI.

Veo 2 по-прежнему генерирует видео на основе текстовых подсказок, дополненных изображениями. В отличие от предыдущей версии, новый генератор значительно улучшил физику движений и освещение: ролики выглядят реалистичнее благодаря проработанным теням, отражениям и кинематографическим эффектам. Например, Veo 2 уже умеет показывать, как наливается кофе или меняется свет в кадре. Улучшены и виртуальные камеры: движение стало плавным, а работа с разными линзами — более достоверной.

Тем не менее, от «детских болезней» модель пока не избавилась полностью. Например, в видео с автомобилем идеально ровная дорога выглядит ненатурально, а пешеходы могут сливаться друг с другом. Также модель иногда сталкивается с эффектом «зловещей долины» — когда что-то в изображении выглядит слишком странно или неестественно.

Для обучения Veo 2 DeepMind использовала огромный объём видеоконтента, хотя конкретные источники не раскрываются. Вероятно, одним из них был YouTube, принадлежащий Google. Чтобы защитить модель от создания дипфейков, в неё встроена система SynthID — специальная незаметная маркировка, которая идентифицирует видео, сгенерированные ИИ.

Помимо Veo 2, команда DeepMind улучшила генератор статичных изображений Imagen 3. Теперь он создаёт более яркие, детализированные картинки, точнее соответствующие текстовому запросу. В интерфейсе ImageFX также появились выпадающие подсказки, которые упрощают создание более точных и качественных изображений.

Таким образом, Google делает уверенный шаг вперёд в области ИИ-контента. Пока Veo 2 остаётся «экспериментом», но уже показывает потенциал, который может изменить представление о создании видео в будущем.