Генерация по нескольким фотографиям
Функция позволяет загрузить до трех изображений и одним запросом собрать из них новое. Модель извлекает из каждого фото нужный элемент, например, стиль, персонажа, фон или объект, и собирает финальный результат. Нейросеть понимает роль каждого загруженного изображения, гармонично объединяет элементы, сохраняя их внешний вид и уникальные черты. Пользователь сам управляет логикой: например, можно один раз задать персонажа или образ и воспроизводить его в любых сценах и окружении.
Детальное редактирования для удаления и замены объектов
С помощью детального редактирования можно вручную обвести кистью нужную область на изображении и указать, что с ней сделать: отредактировать, удалить объект или заменить его на другой. Инструмент позволяет достраивать изображения - добавлять недостающие фрагменты или точечно вписывать новые элементы в готовую сцену. Ключевое преимущество - точность. Ручное выделение позволяет не описывать словами, где находится объект, и его границы. Результат более предсказуем и требует меньше правок. С помощью функции удобно редактировать фотографии: убирать лишних людей, заменять случайно попавший в кадр предмет или нежелательный элемент на фоне. Отредактированные изображения выглядят естественно, без следов изменений. Детальное редактирование пригодится, когда сложно описать словами, где и как добавить, убрать или изменить деталь.
Автоподбор формата
Модель сама определяет оптимальное соотношение сторон на основе содержания запроса: например, портрет человека дает вертикальный кадр, панорама города - горизонтальный, обложка альбома - квадрат. Пользователь может также указать назначение изображения «пост для блога», «баннер» или «аватар» - и формат подтянется автоматически. Это сокращает количество правок: модель сама подстраивает композицию под нужный формат.
Денис Димитров, CTO Kandinsky, управляющий директор по исследованию данных Сбера:
«Мы строим ИИ-помощника, который берет на себя рутину - освобождает время человека для того, что действительно важно. ГигаЧат должен давать уверенность, что любая задача решаема, вне зависимости от того, есть ли у человека специальные навыки или нет. Чем меньше технических барьеров стоит между идеей и результатом, тем больше людей могут реализовывать свои замыслы. Визуальный контент сегодня - это и личное творчество, и рабочий инструмент. Мы хотим, чтобы ГигаЧат одинаково хорошо справлялся с любыми задачами: будь то иллюстрация для личного проекта или баннер для рекламной кампании».
Кому пригодятся новые инструменты
Обновление будет полезно всем, кто работает с визуальным контентом - в профессиональных и личных проектах:
- Дизайн интерьера и архитектура: загрузить фото интерьера, образец ткани и мебель из каталога - получить готовую визуализацию с нужными материалами и объектами, убрать лишние элементы с фото.
- Мода и ретейл: собрать готовую съемку для карточки товара из фото модели, одежды и фона; примерить товар до покупки; убрать нежелательную тень или отражение с продуктового фото.
- Брендинг и маркетинг: генерировать визуалы в едином фирменном стиле без фотосессии; обновлять баннеры точечно - менять фон или реквизит под новый сезон.
- Создание контента: один раз создать ИИ-персонажа и использовать его во всех новых сценах; переодеть героя или изменить деталь на иллюстрации, выделив именно нужный элемент.