Конференция I/O во вторник не была о мелких улучшениях.
Google представила Gemini Omni.
Это не просто инструмент Veo, который они выпустили ранее.
Veo превращает текст в видео. Нормально. Но Omni? Omni принимает всё. Текст, изображения, готовые видеофрагменты. Он перерабатывает всё подряд.
Архитектура остается той же — Gemini, но применение другое. Это настоящая мультимодальная система. Ввод, вывод, повтор. На старте доступны только видео. Генерация изображений и текста появится позже. Ждите обновления.
ИИ-контент захватывает наши ленты. Тем временем лаборатории создают симуляторы нового уровня.
Именно в этом сейчас напряжение. Ленты переполнены. Технология совершенствуется.
Google называет это шагом к «моделям мира». Не просто догадки. Рассуждения. Физика имеет значение. Если вы уроните стакан в видео от Omni, он разобьется как стекло, а не как набор запутанных пикселей. Выводы привязаны к реальности. К той, в которой мы живем.
Страшная часть — кнопка редактирования
Вы создаете видео.
Оно вам не нравится.
Вы просите исправить.
Omni принимает исходный ролик в качестве ввода. Вы можете заменить элементы. Изменить фон. Полностью изменить сцену.
Раньше это было практически невозможно.
Впечатляет. И одновременно страшно.
Создание дипфейков становится проще с каждой минутой. С такой мощью изменить внешность или действия человека — дело пары секунд.
Google об этом думали? Да. Ограничения есть.
Цифровые водяные знаки SynthID. Каждый ролик имеет цифровой след. Это не панацея. Это начало. Маленький цифровой ярлык на потенциально огромной лжи.
Где можно попробовать?
Переработанное приложение Gemini уже обновлено. Шаблоны в один клик для ваших фото.
Создайте аватарку с собой. Голос на заказ, лицо на заказ. Поместите их в видео. Странно, правда?
Подписчики получают ранний доступ. Google Flow. YouTube Shorts.
Разработчики получат API. Через несколько недель.
Представители предприятий? Та же временная шкала. Кастомная интеграция уже в очереди.
Два варианта на сейчас
Разделение моделей — обычное дело для Gemini.
Omni Flash выходит первым. Хорошо подходит для быстрых, легких задач.
Omni Pro? Еще в процессе. Более мощный, более дорогой, выйдет позже.
Мы наблюдаем переход от генерации к симуляции.
От создания чего-то крутого к идеальному копированию реальности.
Где будет проведена граница?






























