Американская технологическая компания представила новую версию своей мультимодальной ИИ-модели под названием Genie 3. В отличие от предыдущей версии, Genie 3 способна создавать полноценные трехмерные виртуальные среды на основе текстового описания. Более того, модель “запоминает” расположение объектов, даже если они временно не попадают в поле зрения пользователя, что позволяет сохранять целостность сцены при перемещении взгляда.
Качество визуализации в Genie 3 значительно улучшено. Виртуальные сцены теперь могут существовать в течение нескольких минут и отображаются с разрешением 720p при 24 кадрах в секунду, что приближает результат к базовому уровню реального времени. Это делает модель пригодной не только для индустрии видеоигр, но и для более широких сфер применения.
Потенциал применения Genie 3 выходит за рамки развлечений. Технология может использоваться в образовательных и научных целях, например, при визуализации физических процессов или реконструкции исторических событий. Кроме того, трехмерные миры, созданные моделью, применимы для тренировки ИИ-агентов и роботов в контролируемых цифровых средах, что важно для исследований в области автономных систем и искусственного интеллекта.
Разработчики рассматривают запуск Genie 3 как один из шагов к построению AGI (Artificial General Intelligence) — универсального искусственного интеллекта, обладающего когнитивными возможностями человека. Хотя модель пока доступна лишь ограниченному кругу исследователей, эксперты отмечают, что подобные технологические прорывы постепенно формируют фундамент будущих систем общего ИИ.
Запуск Genie 3 — свидетельство продолжающегося прогресса в области генеративных моделей и интеграции машинного обучения с пространственным восприятием. Это направление в ближайшие годы обещает повлиять не только на высокотехнологичные индустрии, но и на сферу образования, научных симуляций и систем принятия решений.