Американская компания xAI, основанная Илоном Маском, официально анонсировала расширение функционала искусственного интеллекта Grok. Новая функция под названием Imagine позволит пользователям генерировать видеоролики со звуком на основе текстовых описаний. Релиз ожидается в октябре текущего года и будет доступен в рамках подписки SuperGrok через официальное приложение.
Технологическая основа Imagine — модель Aurora, ранее представленная как инструмент генерации фотореалистичных изображений. Согласно заявлениям разработчиков, Aurora обладает высокой точностью визуализации объектов, включая сложные детали, текст, логотипы и реалистичные портреты. Обновлённая версия позволяет расширить возможности платформы за счёт включения видеосоставляющей с синхронизированной озвучкой.
Сервис ориентирован на креаторов, маркетологов и разработчиков контента, заинтересованных в ускоренной генерации видеоматериалов для цифровых платформ. Предполагается, что Grok сможет генерировать полноценные видеоролики по коротким текстовым подсказкам, включая диалоги, описания сцен и действия персонажей. Возможность генерации видео с аудиодорожкой в режиме реального времени формирует перспективный сегмент в области автоматизированного медиа-контента, особенно в индустрии маркетинга, развлечений и образования.
Функция Imagine станет доступна для пользователей, оформивших подписку SuperGrok. Желающие получить ранний доступ могут зарегистрироваться в предварительном списке уже сейчас. Компания делает акцент на демократизации доступа к мощным инструментам генеративного ИИ, предлагая простые интерфейсы без необходимости загрузки громоздких приложений или перехода в браузер — всё запускается «в один клик».
Платформа Grok в настоящее время обучается на вычислительной инфраструктуре Colossus — одном из крупнейших суперкомпьютеров в мире, в состав которого входят 230 тысяч графических ускорителей, включая 30 тысяч новейших чипов Nvidia GB200. Обработка выводимых данных осуществляется с помощью масштабируемых облачных вычислений, что обеспечивает высокую производительность и доступность сервиса.
Компания xAI позиционирует Grok как интеллектуального собеседника нового поколения с широкой мультимодальной функциональностью. После отказа от унифицированной архитектуры чатбот получил несколько обновлений, нацеленных на улучшение контекстной устойчивости и интеграцию визуальных и звуковых модальностей. Платформа продолжает активно развиваться на фоне растущего глобального интереса к применению ИИ в креативных индустриях, в том числе в рекламе, дизайне, видео- и аудиопродакшене.