Американская компания xAI, основанная Илоном Маском, представила флагманскую языковую модель нового поколения — Grok 4. Впервые за всю историю независимых сравнений языковых моделей, продукт, не входящий в так называемую «большую тройку» разработчиков (OpenAI, Google и Anthropic), занял первую позицию в международных рейтингах производительности. Этот результат может изменить баланс сил на рынке генеративного искусственного интеллекта, где конкуренция переходит из технологической в экономико-политическую плоскость.
Grok 4 стал первой моделью, возглавившей рейтинг Intelligence Index от аналитической платформы Artificial Analysis, набрав 73 балла. Для сравнения, GPT от OpenAI и Gemini от Google — по 70 баллов, Claude Opus от Anthropic — 64. Это достижение означает не просто технологический успех xAI, но и формирует предпосылки для появления «четвёртого центра силы» в области искусственного интеллекта.
Модель продемонстрировала высокие результаты в ключевых бенчмарках. В частности, в математическом тесте AIME 2024 Grok 4 набрал 94%, а в сложнейшем GPQA Diamond, оценивающем глубину логических рассуждений, — 88%. Подчеркнуто, что модель способна не только к генерации текста, но и к мультимодальной обработке, включая интерпретацию изображений и выполнение программных функций. При этом в компании признают, что мультимодальный режим пока далёк от полной реализации, и в будущих версиях ожидаются существенные доработки.
Особое внимание вызвал результат Grok 4 в тесте ARC-AGI-2 — одном из немногих бенчмарков, претендующих на объективную оценку гибкого интеллекта, приближенного к человеческому. Модель установила абсолютный рекорд, набрав 15.9%, превзойдя порог статистического шума (10%) и существенно обойдя предыдущего лидера — Claude Opus 4 с 8%. Это событие стало важным индикатором возможного движения в сторону систем общего искусственного интеллекта, хотя по абсолютным значениям результаты пока далеки от человеческого уровня.
Вместе с Grok 4 была представлена экспериментальная версия Grok 4 Heavy. Она использует мультиагентную архитектуру — несколько агентов работают параллельно, а затем сравнивают свои гипотезы и приходят к коллективному выводу. Именно эта модификация показала наивысший результат в тесте Humanity’s Last Exam, преодолев 44.4% при использовании инструментов. Для сравнения, Gemini 2.5 Pro показал 26.9%, а OpenAI o3 — лишь 21%. Появление мультиагентных моделей в коммерческом пространстве может означать сдвиг от линейной генерации к симуляции более сложных форм когнитивной обработки, приближённой к групповой работе человеческих экспертов.
Несмотря на научные достижения, запуск Grok 4 сопровождался кризисом в управлении. Одновременно с анонсом модели произошло увольнение генерального директора соцсети X Линды Яккарино. Кроме того, официальный аккаунт Grok в X оказался в центре скандала после публикации материалов с антисемитскими высказываниями. В ответ на общественное давление, xAI пересмотрела «системный промпт» — внутренние установки, управляющие тоном и допустимыми формулировками модели, удалив оттуда инструкцию, разрешающую «политически некорректные» ответы.
Несмотря на репутационные риски, компания делает ставку на коммерческую монетизацию. Grok 4 доступен по модели pay-as-you-go: 3 доллара за миллион входящих и 15 долларов за миллион исходящих токенов. Это соответствует стоимости Claude Sonnet, но дороже, чем у Gemini и OpenAI o3. Скорость генерации — 75 токенов в секунду — выше, чем у Claude Opus, но уступает флагманам Google. Контекстное окно модели составляет 256 тысяч токенов — меньше, чем у Gemini 2.5 Pro (1 миллион), но существенно больше по сравнению с большинством конкурентов на рынке.
Для пользователей социальной сети X предложен премиум-тариф SuperGrok Heavy за 300 долларов в месяц. Это направление предполагает углубленную интеграцию модели в медиаплатформу, управляемую тем же владельцем — Илоном Маском. Аналитики отмечают, что подобный подход может быть началом создания вертикально интегрированной экосистемы, в которой AI, соцсети и вычислительная инфраструктура сосуществуют под единым управлением.
Стратегия xAI демонстрирует уверенное движение к разрушению монополии лидеров отрасли. При этом компания делает ставку не столько на общедоступность, сколько на технологическое лидерство в области архитектур, ближе всего стоящих к общему искусственному интеллекту. Учитывая, что xAI уже использует вычислительные ресурсы на кластерах xCloud и активно наращивает партнёрскую сеть, её потенциал как независимого игрока в высококонкурентной среде глобального AI-рынка оценивается как стремительно растущий.