Модели

Обновлено: 18.05.2025


Что такое модель

Модель (модель искусственного интеллекта), она же чекпоинт — ключевое понятие в технологиях искусственного интеллекта (ИИ) в целом и в Stable Diffusion в частности.

Это и есть и «сердце», и «мозг» Stable Diffusion, именно модель совершает всю магию, создавая изображение.

Более подробное описание смотрите
в Глоссарии

Существует множество моделей для Stable Diffusion. Какие-то более требовательны к железу, какие-то менее. Есть базовые (изначальные) и есть дообученные на основе базовых. Есть универсальные, а есть специализированные для каких-то узких задач — для интерьеров, для фото людей, для аниме, для 3D-персонажей, для промдизайна и т. д.

В Stable Diffusion вы можете выбирать, с помощью какой модели генерировать изображение.
В зависимости от выбора модели, на один и тот же запрос с одними и теми же настройками можно получить как похожие изображения, выполненные в разных стилях, так и совершенно разные картинки.

Модели поставляются в виде массивных файлов (в среднем 5-7 ГБ, но встречаются отдельные экземпляры как по 2, так и больше 20 ГБ), как правило с расширением *.safetensors. Это специальный формат для хранения весов модели. Веса — настройки, которые модель формирует во время обучения и использует для генерации.

Существуют файлы и с другими расширениями, но рекомендуется выбирать именно *.safetensors, так как в него нельзя встраивать произвольный код, который будет выполняться при загрузке.

Поколения моделей для SD

Термин «поколения» тут скорее условный, но тем не менее. Stable Diffusion с момента своего появления в 2022 году стремительно развивался. Каждый год появлялись новые базовые модели, которые становились с каждым разом мощнее, предлагая более высокое качество генерируемых изображений, более требовательные к железу и становились основой для создания целых семейств пользовательских моделей.

Эта тема для отдельного подробного разбора. Когда-нибудь разверну её детальнее, а пока упомяну вскользь — просто это важно знать уже на старте для общего понимания

В общем, коротенько по основным вехам и с известной долей неточностей и упущений:

SD 1.x — ранние версии
Первые модели (1.4, 1.5) заложили основу для нейрогенерации. Они обеспечивали хорошую детализацию, но имели ограниченную стилизацию и иногда странно интерпретировали сложные запросы.

SD 2.x
Версия 2.0 и 2.1 принесла улучшенную работу с текстом и поддержку высоких разрешений (768x768), но потеряла часть гибкости.

SDXL
SDXL 1.0 стал прорывом: лучшее понимание запросов, детализация, поддержка 1024x1024 и сложных стилей. Менее зависим от дополнений, но требователен к видеопамяти.

FLUX
Наиболее продвинутое и требовательное семейство на середину 2025. Позволяет генерировать крайне реалистичные изображения.


Где брать модели

Самый большой склад — на сайте Civitai.com.
И всё это сокровище доступно абсолютно бесплатно!

Очень рекомендуют зарегистрировать там аккаунт и авторизоваться.
Хотя вроде бы скачивание доступно и так — проверьте

Итак, ищем

1. Зайдите на сайт Civitai.com.

2.перейдите в раздел «Models»:


3. Далее «Filters»:


4. В открывшемся окне выберите фильтры:

  • Model types (тип модели) > Checkpoint (это основные модели, которые непосредственно генерируют картинку);
  • Checkpoint type (тип чекпоинта) > All (все доступные типы);
  • File format (формат файла) > SafeTensor (файлы в формате*.safetensors — наиболее рекомендуемый формат);
  • Base model (базовая модель) > на ваше усмотрение (в моём примере SDXL 1.0 и Flux.1D):

Базовая модель — это исходная модель, на основе которой были дообучены те чекпоинты, которые покажет фильтр.


Выбирайте, исходя из ваших потребностей и доступного железа. Например, SD 1.5 и SDXL 1.0 менее требовательны к железу, 
но качество зачастую такое себе. Flux.1 D — самая навороченная на середину 2025-го и требует производительную видеокарту.

 !!!  Когда вы выбираете чекпоинт и LoRA для генерации своего изображения, необходимо убедиться, что они обучены на основе одной и той же базовой модели, иначе не сработаются


5. Сверните фильтры и выбирайте понравившиеся чекпоинты, кликая по картинкам, не забывая пользоваться поиском и сортировкой:

Обратите внимание, что на обложках, помимо указания автора, названия и прочих лайков, указан тип «Checkpoint» (верхний-левый угол обложки) и рядом два-три знака, указывающих на базовую модель (XL = SDXL 1.0, F1 = Flux .1 D)


6. По клику будет открываться страница, откуда можно скачать эту модель, а также ознакомиться с описанием, рекомендациями и прочей информацией, а также образцами изображений, сгенерированных этим чекпоинтом.

Скачивание и установка

Процесс скачивания и установки подробно описан в разделе «Установка»:

На этом пока всё

Раздел будет наполняться далее, но пока руки не дошли.

В планах:

  • Обзор и сравнение базовых моделей и чекпоинтов;
  • разные упражнения с чекпоинтами;
  • список особенно интересных чекпоинтов на мой субъективный взгляд.

А пока можете ознакомиться с теми списками, которые я начал составлять, когда работал над первой версией конспекта.
Они доступны в виде пачки Гугл докуметов:
SD 1.5
SDXL 1.0
Flux.1 D