Революція у відеоконтенті: Google створила нейромережу, яка генерує відео з тексту
“Гугл” явив світу нову нейронну мережу під назвою Veo, яка здатна генерувати високоякісні відео. Цей крок компанії став відповіддю на нещодавнє представлення аналогічного продукту від OpenAI, відомого як Sora.
Згідно із заявами розробників, новинка має “ідеальне розуміння природної мови та візуальної семантики”, що дозволяє їй створювати відео формату 1080p тривалістю понад 60 секунд. Нейромережа володіє кінематографічними та візуальними техніками, включно з концепцією покадрової зйомки.
Для демонстрації можливостей свого “дітища”, американський техногігант спільно із земляками зі студії Дональда Гловера створили промо-відео.
За запевненнями гугловців, Veo здатний імітувати реальну фізику набагато краще порівняно з попередниками, забезпечуючи водночас вищу якість результатів.
У найближчому майбутньому новинка стане доступна окремим творцям контенту через інструмент Google VideoFX. Також очікується інтеграція новинки в ютуб-продукти на кшталт Shorts. Це може стати значним кроком уперед для американського сервісу потокового відео в конкурентній боротьбі з китайським “Тік-Током”.
Крім того, “Гугл” потішив фанатів інновацій рішенням під назвою Imagen 3 – фірмовою “якісною” моделлю перетворення текстів на картинки для створення фотореалістичних зображень з відмінною деталізацією і меншою кількістю артефактів.
Американський техногігант також анонсував інструментарій Music AI Sandbox для допомоги у створенні музичних ритмів, композицій і пісень.