Создавать карточки для маркетплейсов и изображения для рекламы сложно и дорого — это связано с большими объемами работы. Искусственный интеллект может упростить этот процесс. В статье собрали нейросети для генерации изображений по фото или тексту. А в конце объясняем, как написать правильный промт.
Как работают нейросети для генерации изображений
Нейросети для генерации картинок работают на основе технологии Deep Learning — глубокого обучения. Это часть машинного обучения, которую используют для сложных задач — чтобы распознавать речь, обрабатывать текстовые и голосовые запросы.
Такие сети состоят из нескольких слоев нейронов, которые усложняются на каждом уровне. Самый первый уровень — обучение. На этом этапе искусственный интеллект учится на массиве данных отличать объекты и формы. После этого он готов генерировать собственные картинки.
AI работает в два этапа: создание изображения и оценка качества. За это отвечают генеративные состязательные сети — GANs. Они состоят из двух частей: генератора и дискриминатора. Первая обрабатывает промт и выдает изображение, а вторая оценивает, насколько оно соответствует запросу.
В итоге получается такая схема:
- Входной слой. Изображение или текст передается в нейросеть в форме числовых значений — пикселей. Каждое значение указывает на яркость или цвет.
- Скрытые слои. Сеть обрабатывает данные, преобразует и выделяет важные признаки изображения: формы, текстуры и цвета. Каждый слой отвечает за различные аспекты изображения.
- Выходной слой. Нейросеть генерирует новое изображение после обработки данных на предыдущих слоях. Выходной слой содержит всю техническую информацию об объекте: количество пикселей, цвета, объем.
Генератор создает изображение, потом накладывает на него шумы и текстуры, а дискриминатор смотрит, соответствует ли это запросу. Если есть ошибки, генератор должен заново создавать картинку. В итоге мы получаем изображение без лишних деталей.
1. Playground — нейросеть для генерации изображений по фото
Бесплатная нейросеть для создания изображений на основе фотографий. В сутки можно сделать 1000 генераций, но после 50 автоматически ограничивается детализация. Картинки будут менее четкими.
Сервис доступен онлайн и только на английском языке, авторизация через аккаунт Google. Управление интуитивно понятное: нужно выбрать стиль и загрузить фотографию. На генерацию уходит до 20 секунд — в зависимости от сложности стиля. Из стокового изображения можно получить такой результат:
Стоимость и язык: бесплатно, тариф PRO — 12 долларов в месяц. Английский.
2. Starryai — нейросеть для генерации изображений по текстовому описанию
Нейросеть для генерации картинок на основе промта — текстового запроса. Создать картинку по запросу могут только зарегистрированные пользователи: для этого нужно авторизоваться через учетную запись Google или Apple. После вы получите пять бесплатных кредитов, которых хватит на три — пять генераций в зависимости от сложности.
Удачными получаются генерации без реальных людей — аниме, комиксы, машины, архитектура. В других стилях встречаются артефакты — лишние и не соответствующие реальности детали: смазанные лица, неестественные волосы, неверное количество пальцев, неправильные эмоции. Например, по запросу «girl works in office, she is happy» «девушка работает в офисе, она счастлива» получается следующий результат:
Стоимость и язык: бесплатно пять кредитов в день, подписка — 4,99 доллара в неделю, есть пакеты на год. Английский.
3. Vance AI — нейросеть для улучшения качества изображения
Vance AI помогает превратить размытую фотографию в изображение стандартного качества. Нейросеть может улучшить качество до 4K, устранить размытие, убрать фон. А также восстановить старые фотографии — убрать заломы и трещины, изменить размер фото и уменьшить шумы.
Сервис может обработать не все изображения: если фотография размыта более чем на 50%, то искусственный интеллект может додумать детали.
Стоимость и язык: бесплатно пять изображений, подписка — 4,95 доллара за 100 фотографий. Английский.
4. Runway — нейросеть для анимации картинки
Чтобы создать анимацию, можно использовать Runway. Сервис помогает оживить изображение по текстовому запросу. Например, по промту «the girl writes on paper, the camera smoothly goes around her in a circle» «девушка пишет на бумаге, камера медленно объезжает ее по кругу» получается такой результат:
В бесплатной версии доступно 105 секунд, одна генерация длится четыре секунды. Если вы генерируете анимацию с нуля, в запросе нужно прописать, какое освещение и какой ракурс нужно использовать, например широкий угол или крупный план. Если же вы создаете анимацию на основе картинки, то нейросеть проанализирует ее самостоятельно, вам нужно прописать лишь движение камеры.
Стоимость и язык: одна секунда — пять кредитов, при регистрации начисляется 500. Подписка — 12 долларов в месяц. Английский.
5. AI Image Enlarger — нейросеть для редактирования изображений
AI Image Enlarger подойдет, если фотографию нужно проработать детально, например точечно убрать элементы на фоне или изменить контур. Дополнительно нейросеть улучшит качество и резкость.
Сервис заботится о конфиденциальности пользователей — удаляет загруженные фотографии через 24 часа после обработки.
Стоимость и язык: восемь улучшений бесплатно, подписка — 4,9 доллара в месяц. Русский.
6. Cocoon AI — нейросеть для генерации изображений для маркетплейсов
Приложение создает уникальные и реалистичные изображения одежды без моделей и профессиональных фотографов. Принцип работы такой: вы загружаете фото товара, выбираете пол модели, фон и детализацию.
Нейросеть генерирует человека на однотонном или дизайнерском фоне. Чтобы добавить информацию о преимуществах, размерах, составе, нужно использовать сторонние приложения. Например, Wondercard: инструмент позволяет добавить текст, рамку и эффекты. Таким образом можно использовать нейросети в бизнесе, чтобы сэкономить финансы и время.
Стоимость и язык: две генерации бесплатно, подписка — 2490 рублей в месяц за 50 генераций. Русский.
Как составить хороший промт для генерации изображений
Самое важное в составлении промта — детальное описание. Не бойтесь писать много и указывайте все, что важно для итогового изображения. Запрос можно построить по такой схеме:
- Тема или концепция. Пропишите объект, сцену, концепт изображения.
- Детали визуального описания. Укажите цвета, формы, текстуры, композиции.
- Настроение. Определите стиль изображения: реалистичный, абстрактный, фантазийный, романтический, футуристический.
- Дополнительные требования. При необходимости можно прописать композицию, ракурс, освещение.
Если не получается создать запрос самостоятельно, можно использовать Битрикс CoPilot. Дополнительно AI может забрать на себя часть рабочих задач: написать или отредактировать текст, придумать идеи, выделить главное в большой статье и др.
Частые вопросы о нейросетях для генерации изображений
Большинство нейросетей дают бесплатный пробный период, чтобы вы могли протестировать функции. Однако если вы хотите регулярно их использовать и получать изображения быстро и в хорошем качестве, то лучше оплатить подписку.
Зависит от того, какую нейросеть вы выбрали для генерации. Перед тем как использовать изображения в коммерческих целях, посмотрите правила инструмента.