Сбер представил обновление модели Kandinsky Image, расширив её функциональность за счёт корректной генерации надписей на кириллице. Речь идёт не о наложении текста поверх картинки, а об органичном включении букв в сцену — на фасадах зданий, текстурах дерева и металла, тканях и предметах интерьера. По данным разработчиков, дообучение проводилось на массиве свыше 10 миллионов изображений с русскоязычными надписями, что позволяет модели различать печатные и рукописные шрифты и воспроизводить их в различных художественных стилях.
Практический эффект от обновления ощутим для маркетинга, e-commerce и креативных индустрий: бренды получают инструмент для быстрой подготовки визуалов с русскими слоганами и персонализированными надписями без ручной дорисовки. Для малого бизнеса это сокращение цикла производства баннеров, витринной графики и упаковки, для дизайнеров — возможность быстрых итераций, в том числе с «вшитым» текстом на сложных поверхностях. Сферы применения простираются от визуальных концептов и сторителлинга до прототипирования наружной рекламы и контента для социальных сетей.
Модель доступна для тестирования в телеграм-ботах и веб-версии. Команда анонсировала дальнейшее повышение стабильности при формировании длинных фраз и смешанных надписей, где кириллица сочетается с латиницей, а также улучшения при работе с детальными промптами. На уровне индустрии это усиливает тренд на локализацию генеративных моделей под конкретные языки и алфавиты, снижая зависимость от постобработки и повышая качество «из коробки» для русскоязычной аудитории.