Ilon Mask tomonidan asos solingan Amerikaning xAI kompaniyasi yangi avlod flagman til modeli — Grok 4 ni taqdim etdi. Til modellarini mustaqil taqqoslash tarixida birinchi marta "katta uchlik" (OpenAI, Google va Anthropic) deb nomlanmagan mahsulot xalqaro ishlash reytinglarida birinchi o'rinni egalladi. Ushbu natija generativ sun'iy intellekt bozoridagi kuchlar muvozanatini o'zgartirishi mumkin, bu erda raqobat texnologik va iqtisodiy-siyosiy tekislikka o'tadi.
Grok 4 73 ball to'plagan holda Artificial Analysis tahliliy platformasidan Intelligence Index reytingini boshqargan birinchi model bo'ldi. Taqqoslash uchun, OpenAI — dan GPT va Google — dan Gemini-70 ball, Anthropic-dan Claude Opus-64. Ushbu yutuq nafaqat xAI texnologik muvaffaqiyatini anglatadi, balki sun'iy intellekt sohasida "to'rtinchi kuch markazi" paydo bo'lishi uchun zamin yaratadi.
Model asosiy ko'rsatkichlarda yuqori natijalarni ko'rsatdi. Xususan, aime 2024 matematik testida Grok 4 94%, mantiqiy fikrlashning chuqurligini baholaydigan eng murakkab Gpqa Diamond esa 88% ni tashkil etdi. Ta'kidlanishicha, model nafaqat matn yaratish, balki multimodal ishlov berish, shu jumladan tasvirlarni talqin qilish va dasturiy ta'minot funktsiyalarini bajarishga qodir. Shu bilan birga, kompaniya multimodal rejim hali to'liq amalga oshirilmaganligini tan oladi va kelajakdagi versiyalarda sezilarli o'zgarishlar kutilmoqda.
Grok 4 ning arc-AGI-2 testidagi natijasi alohida e'tiborga sazovor bo'ldi — bu insonga yaqin bo'lgan moslashuvchan intellektni ob'ektiv baholashga da'vo qiladigan kam sonli ko'rsatkichlardan biri. Model mutlaq rekord o'rnatdi, 15.9% ball to'pladi, statistik shovqin chegarasidan (10%) oshib ketdi va oldingi yetakchi Claude Opus 4 ni 8% bilan sezilarli darajada ortda qoldirdi. Ushbu hodisa umumiy sun'iy intellekt tizimlari tomon harakatlanishning muhim ko'rsatkichi bo'ldi, garchi mutlaq qiymatlarda natijalar inson darajasidan uzoq bo'lsa ham.
Grok 4 bilan birgalikda Grok 4 Heavy-ning eksperimental versiyasi taqdim etildi. U ko'p agentli arxitekturadan foydalanadi-bir nechta agentlar parallel ravishda ishlaydi, so'ngra o'z farazlarini taqqoslaydi va jamoaviy xulosaga keladi. Aynan shu modifikatsiya humanity's Last Exam testida eng yuqori ko'rsatkichni qo'lga kiritdi va asboblardan foydalanganda 44.4% ni yengdi. Taqqoslash uchun, Gemini 2.5 Pro 26.9% ni, OpenAI o3 esa atigi 21% ni tashkil etdi. Tijorat makonida ko'p agentli modellarning paydo bo'lishi chiziqli avloddan kognitiv ishlov berishning yanada murakkab shakllarini simulyatsiya qilishga o'tishni anglatishi mumkin, bu esa inson mutaxassislarining guruh ishlariga yaqinlashadi.
Ilmiy yutuqlarga qaramay, Grok 4-ning ishga tushirilishi boshqaruv inqirozi bilan birga keldi. Model e'lon qilinishi bilan bir vaqtda x ijtimoiy tarmog'ining bosh direktori Linda Yakkarino ishdan bo'shatildi. Bundan tashqari, Grokning x-dagi rasmiy akkaunti antisemitizm bayonotlari bilan materiallar nashr etilgandan so'ng janjalning markazida bo'ldi. Jamoatchilik bosimiga javoban, xAI "tizim prompt" ni qayta ko'rib chiqdi — ohang va modelning ruxsat etilgan formulalarini boshqaradigan ichki qurilmalar, u erdan "siyosiy jihatdan noto'g'ri" javoblarni hal qiluvchi ko'rsatmalarni olib tashladi.
Nufuzli xatarlarga qaramay, kompaniya tijorat monetizatsiyasiga pul tikmoqda. Grok 4 pay-as-you-go modelida mavjud: million kiruvchi uchun 3 dollar va million chiquvchi token uchun 15 dollar. Bu Claude Sonnet narxiga mos keladi, ammo Gemini va OpenAI o3-ga qaraganda qimmatroq. Ishlab chiqarish tezligi — sekundiga 75 token — Claude Opus-dan yuqori, ammo Google flagmanlaridan past. Modelning kontekst oynasi 256 ming Tokenni tashkil etadi — bu Gemini 2.5 Pro (1 million) dan kam, ammo bozordagi aksariyat raqobatchilarga nisbatan ancha katta.
X ijtimoiy tarmog'i foydalanuvchilari uchun supergrok Heavy premium tarifi oyiga 300 dollarga taklif etiladi. Ushbu yo'nalish modelni xuddi shu egasi — elon Mask tomonidan boshqariladigan media platformasiga chuqur integratsiya qilishni o'z ichiga oladi. Tahlilchilarning ta'kidlashicha, bunday yondashuv Ai, ijtimoiy tarmoqlar va hisoblash infratuzilmasi yagona boshqaruv ostida birga yashaydigan vertikal integratsiyalashgan ekotizimni yaratishning boshlanishi bo'lishi mumkin.
XAI strategiyasi sanoat rahbarlarining monopoliyasini yo'q qilish uchun ishonchli harakatni namoyish etadi. Shu bilan birga, kompaniya umumiy sun'iy intellektga eng yaqin bo'lgan arxitektura sohasidagi texnologik etakchilikka emas, balki jamoatchilikka ko'proq pul tikadi. XAI allaqachon xcloud klasterlarida hisoblash resurslaridan foydalanayotganini va hamkorlik tarmog'ini faol ravishda kengaytirayotganini hisobga olsak, uning yuqori raqobatbardosh global AI bozori muhitida mustaqil o'yinchi sifatidagi salohiyati tez sur'atlar bilan o'sib bormoqda.