«Сбер» сообщил о запуске обновлённой версии своей нейросети для работы с изображениями — Kandinsky 6 Image. Как следует из пресс-релиза банка, новая модель ориентирована на создание и редактирование визуального контента с повышенной скоростью и улучшенным качеством детализации.
Обновлённая версия интегрирована в ИИ-помощник GigaChat и предоставляется пользователям бесплатно без ограничений по количеству запросов. В компании отмечают, что алгоритмы стали лучше понимать сложные текстовые описания, что позволило повысить точность генерации и снизить количество ошибок при создании изображений.
Kandinsky относится к классу генеративных нейросетей, которые формируют изображения на основе текстовых запросов. Подобные технологии также используются в других популярных системах, включая DALL·E, Stable Diffusion и MidJourney, однако каждая из них имеет собственные особенности обработки данных и генерации визуального контента.
В новой версии разработчики расширили функциональность сервиса. Теперь пользователям доступны инструменты для восстановления старых фотографий, изменения стиля изображений, создания нейрофотосессий, а также замены фона и элементов одежды. Кроме того, появились улучшенные функции ретуши и автоматического нанесения макияжа. В «Сбере» подчёркивают, что модель стала точнее работать с локальными изменениями на изображениях и реже допускает визуальные искажения.
Отдельное нововведение — встроенный поиск по изображениям, который позволяет системе учитывать актуальные визуальные референсы при генерации контента, делая результат более реалистичным и соответствующим запросу пользователя.

















