Железо, софт и установка

Обновлено: 16.05.2025


Всё не так уж
и страшно,
как на самом деле

А если серьёзно, то на самом деле всё проще, чем кажется.
Сейчас я познакомлю вас с основными требованиями к оборудованию, вы скачаете необходимые компоненты софта, установите, чуть поднастроите, и готово — можно приступать к машинному творчеству.

«Глаза боятся, а руки ...»
Выберите ваш вариант:
  • тянут кота за хвост
  • золотые
  • уже наделали дел
  • из ж***
  • делают ноги
  • шагнули вперёд

Как было сказано в предыдущем разделе, для старта вам понадобится подходящее железо и кое-какой софт, предлагаю такой для начала:

  • WebUI
    Stable Diffusion Forge;
  • Модели
    Flux.1 D — для мощных компов;
    Flux.1-Dev Hyper NF4 — версия попроще и побыстрее;
    DreamShaper — подойдёт для слабого железа;
  • Улучшалки
    скачаем для начала одну LoRA и пару апскейлеров.

Далее вы сами решите, что вам больше подходит и в каком направлении двигаться

Железо

Вам понадобится комп с приличным железом
и Windows 10+:

1. Производительная видеокарта на базе Nvidia

Чем мощнее — тем быстрее генерируются изображения. Скажем, от RTX 2060 Ti или 1080 Ti и выше.

Хотя на 1070 или 1650 тоже можно на самом деле, если использовать модели попроще и разрешение картинки поменьше.
Минимум 4 ГБ видеопамяти, но лучше от 8 ГБ и выше.

Для более продвинутых моделей, например Flux и её производных, для комфортной работы потребуется карта на 12 ГБ и выше, например от 3060, но лучше помощнее.

Для видеокарт AMD ищите информацию самостоятельно, сори. )


Также пишут, что Stable Diffusion может работать на компьютерах с Linux и на устройствах Mac с процессорами M1 или M2.
Но это тоже не сюда

2. Оперативка

8 ГБ минимум. Лучше от 16 ГБ и выше.

3. Свободное место на диске

10 ГБ минимум, на самом деле от 30 ГБ — некоторые файлы моделей весят под пару десятков ГБ сами по себе, а ещё должно остаться место для данных, формируемых в процессе работы.

Есть мнение, что нужно не менее 100 ГБ — зависит от интенсивности вашей работы и склонности качать и использовать множество разнообразных моделей

4. Быстрый интернет

Для скачивания всех необходимых файлов. Как было сказано выше — некоторые файлы моделей весят полтора-два десятка ГБ.

Кроме того, в процессе работы Stable Diffusion будет докачивать необходимые компоненты

Аренда удалённой системы

Если железо не тянет, но есть желание поработать с тяжёлой моделью или натренировать собственную LoRA, то существует возможность аренды облачных рабочих станций.

Это не так уж и дорого.
По состоянию на 2025 год можно арендовать пригодный GPU-сервер в районе 50 руб./час, а то и дешевле.

Вот пара возможных вариантов

  • gpudc.ru — предоставляют услуги аренды GPU-серверов, рабочих станций с GPU и игровых ригов для высокопроизводительных вычислений в различных сферах науки, техники, творчества и досуга.
  • immers.cloud — облачный GPU-сервис, предоставляющий доступ к мощным видеокартам для самых различных задач: от рендеринга и 3D-моделирования до обучения ИИ и гейминга.

Пошаговую инструкцию, как арендовать систему на gpudc.ru, установить все необходимые компоненты и начать работу, можно посмотреть в видео «Установка и настройка Stable Diffusion Forge в 2025 + FLUX»
(Максим Афанасьев,VK-видео, март 2025)


С сервисом immers.cloud предлагаю разобраться самостоятельно

Качаем софт

Тут оставил только ссылки на скачивание, чтобы избежать ненужной путаницы.

Если хотите уточнить какие-то термины — ищите их в Глоссарии

1. Браузер

Настоятельно рекомендуют Google Chrome, но и Яндекс Браузер тоже вполне рабочий вариант — у меня проблем не возникало

2. WebUI (графический интерфейс)

Мы будем устанавливать Forge.

Вообще, для установки, работы и обновления Stable Diffusion на компьютере должны быть так же установлены Python 3.10 и git.
Но по ссылке ниже доступен единый пакет, который установит всё необходимое в один клик — что приятно.

Python 3.10 — версия языка программирования Python, выпущенная в 2021 году.

Git — программа, позволяющая отслеживать изменения в файлах.

Скачайте его с Гитхаба с этой страницы.
Проскрольте вниз до заголовка «Installing Forge» и кликните на ссылку под ним.

Скачается архив в формате *.7z (webui_forge_cu121_torch231.7z), объёмом 1,74 ГБ


3. Чекпоинты (они же checkpoints, они же модели)

Будем качать три чекпоинта с сайта Civitai.com.

Очень рекомендуют зарегистрировать там аккаунт и авторизоваться.
Хотя вроде бы скачивание доступно и без авторизации.

Самая навороченная модель из доступных на середину 2025 года. Для мощных компов.
Потребуется видеокарта от 12 ГБ памяти. Скажем, 3080 Ti, 3090, 4070 и мощнее.

3060, возможно, тоже потянет

Для скачивания доступны 2 версии: на 16 и на 22 ГБ.
Версии на 16 ГБ обычно достаточно. Если нет, качайте на 22 ГБ.

Скачается файл в формате *.safetensors (flux_dev.safetensors), объёмом 15,9 ГБ


Это оптимизированный гибрид из разных производных от базовых Flux.1 D и Flux.1 S (Flux.1 Schnell (нем. schnell — быстрый)) — упрощённой и самой быстрой модели из базовой линейки Flux.

Скачается файл в формате *.safetensors (flux1DevHyperNF4Flux1De... .safetensors), объёмом 11,5 ГБ


Судя по названию, основательно оптимизирована для ускорения процесса генерации и работы с видеокартами попроще.
Способна выдавать достойный результат всего за 8 шагов, однако вам ни кто не мешает заряжать его и на больше.
«BNB NF4» в названии указывает, что это самая «лёгкая» версия модели Flux.1 D из доступных.

Подойдёт для видеокарт с 8-12 ГБ памяти (RTX 3060, RTX 3070), возможно и попроще, типа RTX 2080 Ti, RTX 3050.

Про «BNB NF4», читайте в Глоссарии

 !!!  Модели NF4 не работают на видеокартах серий 1000 и большинстве карт серии 2000.
Есть неподтверждённая информация, что RTX 2060 Super, 2070 Super, 2080 Super и их Ti версии способны работать с NF4 и FLUX

Подойдёт для слабого железа — натренирована на основе базовой модели первого поколения SD 1.5

Скачается файл в формате *.safetensors (dreamshaper_8.safetensors),
объёмом 2 ГБ


4. LoRA (минимодели-модификаторы)

LoRA (Low-Rank Adaptation) — модифицируют или дополняют знания основной модели

Сейчас мы скачаем одну LoRA для модели DreamShaper.
LoRA для Flux и прочих моделей (а также сами прочие модели) докачаете потом самостоятельно по мере энтузиазма и необходимости.

Как и следует из названия, позволяет регулировать степень детализации генерируемых изображений.

Процесс скачивания абсолютно такой же, как и у моделей выше.

Скачается файл в формате *.safetensors (more_details.safetensors),
объёмом 9,1 МБ


 !!!  Обратите внимание, что LoRA, так же как и чекпоинты, тренируются на основе базовых моделей и в дальнейшем могут работать только с теми чекпоинтами, у которых аналогичная база.

В нашем случае как модель DreamShaper, так и эта LoRA натренированы на базе модели SD 1.5, следовательно, они могут работать вместе.

Базовую модель как для чекпоинта, так и для LoRA можно узнать на странице загрузки. Там же можно увидеть и тип — чекпоинт это или LoRA (показал ниже зелёными стрелками):


5. ESRGAN (апскейлеры)

Во время обучения ESRGAN изучает изображения с высоким разрешением и потом использует полученные знания, чтобы помогать основной модели увеличивать разрешение генерируемых картинок.

Не знаю, где приличные люди массово добывают апскейлеры. Я качнул в одном из уроков и передаю вам как есть — качайте тут

Скачается архив в формате *.7z (ESRGAN.7z), объёмом 174 МБ

В архиве 3 файла:

  • 4x_foolhardy_Remacri.pth — для природы и артов
  • 4x_NMKD-Siax_200k.pth — для реалистичных фото
  • 4x-AnimeSharp.pth — для аниме, судя по названию


Распаковка
и размещение файлов

1. Создайте папку «Stable» в корне любого диска, но лучше на диске «C» (C:\Stable)

 !!!  Главное, чтобы путь к папке не содержал посторонних и кириллических символов.

В целом выбор диска не критичен, но во избежание, так сказать

2. Распакуйте в созданную папку архив с WebUI (webui_forge_cu121_torch231.7z)

Должно получиться как-то так:


3. Скопируйте файлы скаченных моделей в папку по адресу: C:\Stable\webui\models\Stable-diffusion

Ну или куда вы там в итоге решили установить

Их можно закинуть туда всей кучей и вообще все новые модели закидывать прямо туда.

Но я рекомендую сразу сделать там подпапки по типам базовых моделей и распределить чекпоинты по ним. Потом это поможет проще ориентироваться.

Например как-то так:

Как узнать тип базовой модели
смотрите выше


Позже, когда вы приступите к работе, название папки, в которой хранится модель, будет отображаться перед названием файла — это удобно:

Модель отображается в интерфейсе по названию файла, в котором она поставляется. А так сразу будет видно, к какому типу относится модель


4. Скопируйте файлы из архива «ESRGAN.7z» в папку по адресу: C:\Stable\webui\models\ESRGAN

5. Файл LoRA мы разместим позже, после установки Stable Diffusion.

Вот на этом шаге

Установка Stable Diffusion

1. Обновите драйвера на видеокарту. Настоятельно рекомендуют — и в целом не помешает.

2. Установите Google Chrome и назначьте его браузером по умолчанию.
Сделать это можно либо при установке (он сам предложит назначить его браузером по умолчанию), либо Пуск > Параметры > Приложения > Приложения по умолчанию > Веб браузер.

Stable Diffusion будет открываться в нём.

Ну или останьтесь с тем браузером, который вам привычен. Просто помните, что существует рекомендация работать со Stable Diffusion именно в Хроме

3.  !!!  В ОБЯЗАТЕЛЬНОМ порядке запустите апдейт WebUI.
Для этого перейдите в папку C:\Stable и запустите файл «update.bat» кликнув на него дважды.


Откроется командное окно Windows, отображающее процесс обновления.

Обычно апдейт занимает несколько секунд.
По окончании процедуры внизу окна появится строчка: «Для продолжения нажмите любую клавишу . . .»:


Не отказывайте — нажмите.

Окно закроется

 4. И вот теперь сама установка 

В той же папке C:\Stable запустите файл «run.bat».

Опять откроется командное окно Windows.
Строчки, символы, какие-то процессы...

Эта процедура может занимать 5–20 минут.

Самое время выпить кофе

. . .

. . .

. . .


иииии... 

. . .


 па-бам!!! 

По окончании установки, Stable Diffusion автоматически запускается в браузере — это и есть его интерфейс, с которым вы будете взаимодействовать:


Ну или в белом варианте:

Зависит от настроек вашей системы


Если интерфейс не открылся по окончании установки, вы можете запустить его самостоятельно, введя в адресную строку браузера вот этот адрес: «http://127.0.0.1:7860/».

Как переключиться на тёмную тему и запускать Stable Diffusion с ярлыка (например, с рабочего стола), читайте в разделе Советы

 !!!  А, и вот ещё что!
Вы уже заметили, что помимо закладки в браузере с интерфейсом Stable Diffusion, открывается ещё и окно с командной строкой Windows, в котором постоянно отображаются какие-то процессы. Во время работы Stable Diffusion закрывать его НЕЛЬЗЯ. А при выходе и перезагрузке, наоборот, нужно — сначала в браузере закладку с WebUI, затем это окно.

Оно будет тихонечко пыхтеть, спрятанное где-то под окнами остальных программ — не мешайте ему.

Ядро нейросети работает именно в этом окне, а в браузере находится только удобная для работы оболочка

. . .


В принципе вы уже можете начинать развлекаться, но я предлагаю ещё немного пошаманить.


Установка LoRA

После полной установки Stable Diffusion появится новая папка «Lora» внутри папки «models» по адресу «C:\Stable\webui\models»:


Туда и закиньте файл/файлы LoRA либо одной общей кучей, либо по подпапкам, по аналогии с тем, как вы делали ранее при размещении файлов моделей.

Размещение фалов моделей подробно описано на этой странице чуть выше

После перезапуска Stable Diffusion, ваши LoRA должны появиться в одноимённой вкладке, которая находится ниже полей для промптов и правее закладки «Generation», вот тут:


Обратите внимание на 2 следующих замечания:

1.Над обложками слева (подчеркнул красным) имеется ряд кнопок, позволяющих отфильтровывать LoRA по типам базовых моделей.

Эти кнопки появятся, если вы распределите файлы LoRA по подпапкам, как я рекомендовал выше

2. У вас пока не должны отображаться красивые картинки с обложками LoRA, как на скриншоте выше, — они будут доступны после установки дополнения «Stable Diffusion WebUI Civitai Helper».

Это дополнение мы установим чуть позже, вот на этом шаге


Первые настройки
и улучшалки

Отключаем лишнее

1. Перейдите во вкладку «Extensions» > «Installed»:


2. Отключите следующие чекбоксы с ненужными (пока) функциями:

  1. forge_space_example
  2. sd_forge_dynamic_thresholding
  3. sd_forge_freeu
  4. sd_forge_multidiffusion
  5. sd_forge_perturbed_attention
  6. sd_forge_sag
  7. sd_forge_stylealign

Это спрячет лишние элементы интерфейса. Один фиг вы пока понятия не имеете, что это. Потом включите обратно, если возникнет такая необходимость


3.  !!!  Ещё раз убедитесь, что не отключили лишнего.

4. Нажмите на кнопку «Apply and restart UI» наверху:


Перезапуск интерфейса займёт 10–20 секунд.

Готово!


Догружаем полезное

Сейчас мы установим пару полезных дополнений:
«Stable Diffusion WebUI Civitai Helper» и «ADetailer».

Подробнее об этих дополнениях
читайте тут:

1. Перейдите во вкладку «Extensions» > «Available»:


2. Нажмите кнопку «Load from:»

3. Введите в поисковую строку «civitai»:

Это отфильтрует лишние дополнения
из списка


4. Найдите в списке дополнение «Stable Diffusion WebUI Civitai Helper» и нажмите кнопку «Install» справа:


5. Установите дополнение «ADetailer» аналогичным образом:

  • введите в поисковую строку «adetailer»;
  • найдите приложение в списке и нажмите кнопку «Install».

6. Перейдите во вкладку «Extensions» > «Installed»:


7. Нажмите на кнопку «Apply and restart UI» наверху:


Перезапуск интерфейса также займёт 10–20 секунд.


Ну что же...