Если вы интересуетесь генерацией изображений с помощью нейросети, то скорее всего, слышали о вышедшей во второй половине 2022 года нейросети Stable diffusion.
Что это такое
Stable diffusion многие пользователи считают самой продвинутой нейросетью на данный момент. Причин тому несколько:
- создание высококачественных изображений на основе текстового запроса;
- бесплатный доступ;
- открытый код, что позволяет без проблем установить нейросеть на свой ПК.
Разумеется у нейросети есть и ряд недостатков (например, достаточно высокие требования к характеристикам ПК, наличие хотя бы начальных навыков программирования для работы с полной версией программы)
Stable diffusion нейросеть как установить
Для пользователей, которые хотят только ознакомиться с возможностями нейросети, доступна онлайн версия программы. Но если вы хотите использовать больше возможностей, то программу нужно скачать и установить на ПК.
Обратите внимание! Установить Stable diffusion на любой ПК не выйдет, поскольку для инсталляции требуются определенные минимальные характеристики. Так для корректной работы на Windows или Linux потребуется видеокарта с объемом памяти от 4 Гб и не менее 25 Гб свободного места на жестком диске.
Нужно учитывать, что чем мощнее исходные данные машины, тем меньше времени потребуется нейросети для генерации изображений.
Для инсталляции Stable diffusion нужно скачать программу-установщик от NMKD и установить ее на ПК. В процессе скачивания, разработчики предлагают поддержать их донатом, но вы можете отказаться от этого предложения.
Далее нужно распаковать архив и настроить путь к месту хранения. Разработчики рекомендуют не прятать корневой каталог слишком глубоко, поскольку в коде прописано ограничение на длину пути к файлу.
Как пользоваться
У Stable diffusion довольно много настроек, которые, что логично, влияют на качество итогового изображения. С ходу не всегда ясно, какие настройки за что отвечают.
Вот основные из них:
- количество изображений. Будьте готовы к тому, что с увеличением количеств итоговых изображений времени на их отрисовку будет потрачено довольно много;
- steps. Здесь настраивается количество шагов, за которое нейросеть попытается выполнить ваш запрос. Обычно рекомендуют не выходить за пределы 30-50 шагов;
- creativeness. Этот параметр настраивать интерпретацию нейросети вашего запроса. Если нужно жестко следовать текстовому описанию, ставьте 16. Для реализации большей части запроса выбирайте диапазон от 12 до 15. Если выставить параметр в диапазоне от 7 до 11, то примерно половину запроса нейросеть выполнит по собственному усмотрению. В диапазоне от 2 до 6 нейросеть использует ваш запрос только как отправную точку для изображения;
- resolution. Разрешение итогового изображения. Помним, что чем больше разрешение, тем больше видеопамяти требуется ПК.
Формулируем текстовый запрос
Если у вас есть опыт работы с другими нейросетями, например Midjourney, то проблем с формулировкам запросов в Stable diffusion не должно возникать.
Если же навыков нет, а творить хочется, самый простой способ изучить запросы других пользователей и ознакомиться с результатами. Примеры можно найти на сайте lexica.art.
Еще несколько моментов:
- запрос должен быть достаточно подробным, но не должен превышать 75 слов;
- порядок слов в запросе. Чем ближе к началу запроса, тем большее значение слову придает нейросеть;
- не расстраивайтесь, если с первого раза у вас не вышло. Требуется определенный навык в генерации запроса и отладке настроек. Облегчить задачу на первых порах поможет модификация готового изображения. За основу можно взять уже имеющееся изображения и откорректировать его с помощью нейросети.