Gemini Omni: відео-ІІ від Google став занадто крутим

1

Конференція I/O у вівторок не була про дрібні покращення.
Google презентувала Gemini Omni.

Це не просто інструмент Veo, який вони випустили раніше.
Veo перетворює текст на відео. Нормально. Але ж Omni? Omni приймає все. Текст, зображення, готові відеофрагменти. Він переробляє все поспіль.

Архітектура залишається тією ж – Gemini, але застосування інше. Це справжня мультимодальна система. Введення, висновок, повтор. На старті доступні лише відео. Генерація зображень та тексту з’явиться пізніше. Чекайте на оновлення.

ІІ-контент захоплює наші стрічки. Тим часом, лабораторії створюють симулятори нового рівня.

Саме у цьому зараз напруга. Стрічки переповнені. Технологія удосконалюється.
Google називає це кроком до “моделей світу”. Не просто припущення. Міркування. Фізика має значення. Якщо ви впустите склянку у відео від Omni, він розіб’ється як скло, а не як набір заплутаних пікселів. Висновки прив’язані до дійсності. До тієї, де ми живемо.

Страшна частина — кнопка редагування

Ви створюєте відео.
Воно вам не подобається.
Ви просите виправити.

Omni приймає вихідний ролик як введення. Ви можете замінити елементи. Редагувати фону. Повністю змінити сцену.
Раніше це було практично неможливо.

Вражає. І водночас страшно.
Створення дипфейків стає простіше з кожною хвилиною. З такою міццю змінити зовнішність чи дії людини — справа кількох секунд.
Google про це думали? Так. Обмеження є.
Цифрові водяні знаки SynthID. Кожен ролик має цифровий слід. Це не панацея. Це початок. Маленький цифровий етикетку на потенційно величезної брехні.

Де можна спробувати?

Перероблений додаток Gemini вже оновлено. Шаблони в один клік для фото.
Створіть аватарку із собою. Голос на замовлення, обличчя на замовлення. Помістіть їх у відео. Дивно, правда?
Передплатники одержують ранній доступ. Google Flow. YouTube Shorts.
Розробники отримають API. За кілька тижнів.
Представники підприємств? Та сама тимчасова шкала. Кастомна інтеграція вже у черзі.

Два варіанти на зараз

Поділ моделей – звичайна справа для Gemini.
Omni Flash виходить першим. Добре підходить для швидких та легких завдань.
Omni Pro? Ще у процесі. Більш потужний, дорожчий, вийде пізніше.

Ми спостерігаємо перехід від генерації до симуляції.
Від створення чогось крутого до ідеального копіювання реальності.

Де буде проведено кордон?