Москва люди Сбербанк общество нео Москва

"Сбер" представил нейросеть Kandinsky 2.1, умеющую преобразовывать текст в изображение

Добавлен комментарий эксперта (последние три абзаца). МОСКВА, 4 апр - РИА Новости/Прайм. "Сбер" представил новую версию своей нейросети Kandinsky - Kandinsky 2​​​.1, российского аналога популярной Midjourney, которая способна создавать высококачественные изображения по текстовому описанию, генерировать изображения, похожие на заданные и дорисовывать картинки, рассказали в компании. "Новая генеративная модель "Сбера" - Kandinsky 2.1 - способна всего за несколько секунд создавать высококачественные изображения по их текстовому описанию на естественном языке.Она также может смешивать несколько рисунков, изменять их по текстовому описанию, генерировать изображения, похожие на заданное, дорисовывать недостающие части картинки и формировать изображения в режиме бесконечного полотна (inpainting/outpainting)", - говорится в сообщении.При этом модель понимает запросы на 101 языке и умеет рисовать в различных стилях.

Предыдущая версия этой нейросети - Kandinsky 2.0 - была представлена 23 ноября 2022 года. "Новая модель Kandinsky 2.1 унаследовала веса предыдущей версии, обученной на 1 миллиарде пар "текст - изображение", и была дополнительно обучена на 170 миллионах пар "текст - изображение" высокого разрешения.Затем она дообучалась на отдельно собранном датасете из 2 миллионов пар качественных изображений", - добавляют в компании, отмечая, что в последний датасет попали картинки с описаниями в таких традиционно сложных для нейросетей областях, как тексты и лица людей. "Нейросеть также была усовершенствована за счет новой обученной модели автоэнкодера, которая используется в том числе в качестве декодера векторных представлений изображений.

DMCA