Промпты

Обновлено: 20.05.2025


Что такое промпт
в Stable Diffusion?

Промпт (prompt) — это текстовое описание, на основе которого нейросеть генерирует изображение. Это может быть простая фраза («кошка в шляпе») или сложный набор ключевых слов с уточнениями по стилю, композиции и деталям.

SD принимает на вход два промпта — позитивный и негативный:


Как следует из названия, один будет усиливать появление тех или иных вещей в генерации, а второй будет ослаблять. Но надо понимать, что со 100% вероятностью исключить что-то из изображения или заставить SD что-то сгенерить — не получится. Это скорее подсказки, которые настоятельно советуют что-то делать или не делать.

Обратите внимание
В некоторых моделях, например семейства FLUX, использование негативного промпта не поддерживается и не рекомендуется. Авторы считают, что модель и так настроена как нужно. Соответствующее поле будет неактивно.

Существуют сторонние костыли, которые позволяют писать негативный промпт и там, однако их применение остаётся на ваше усмотрение и ответственность

Промпт из текста преобразуется в набор чисел (токенов), который затем поступает на вход алгоритма генерации SD. Из этого следует, что SD не особо понимает «смысл» того, что вы пишете, сколько ищет соответствие набору ваших токенов в своём гиперпространстве. И затем создаёт на их основе изображение.


Написание эффективных промптов — отдельное искусство, требующее целенаправленного изучения и обширного опыта. В дальнейшем я планирую развивать этот раздел, но пока ограничусь общими рекомендациями.

На каком языке пишут промпты

Сразу расставим точки: русский язык как бы да, но нет. Пишите на английском.

Промпты для Stable Diffusion, теоретически, можно писать на любом языке, но английский — основной. Потому что большинство моделей обучено на англоязычных датасетах. Другие языки, в том числе и русский, вроде бы возможны, но модель может путать смысл, некоторые слова и формулировки переводить буквально, например «красная площадь» → «красный квадрат».

По моим личным наблюдениям, русский промпт более-менее понял только FLUX, в то время как SD 1.5 и SDXL генерировали вообще посторонние изображения.

Вроде бы как существуют локализованные модели, но мне они пока не встречались. Попробуйте поискать самостоятельно

Кроме того, ключевые термины типа художественных стилей (anime, cyberpunk, baroque), технических терминов (bokeh, 8K, ultra-detailed), композиции (close-up, low angle, rule of thirds) — лучше оставлять на английском.

Так что да — пишите на английском.

Если с английским туго, ищите готовые промты, пользуйтесь Гугл и Яндекс переводчиками или просите помощи у текстовых нейросетей, например, китайский DeepSeek — вообще чума. У него на русском языке, в свободной форме, можно попросить написать промпт для Stable Diffusion, описав желаемый результат и описав пожелания по композиции, стилистике и т. д. И он сформирует вам грамотный готовый промпт на английском и даже порекомендует настройки. Огонь, в общем.

Что стоит добавлять
в промпт

Конкретные понятия

  • (имя) персонажа: Shrek, King Arthur, Pope of Rome,Brad Pitt, ... ;
  • возраст + пол: young, adult, mature, girl, girlfriend, woman, wife, grandma, ... ;
  • цвета;
  • элементы окружения;
  • одежду;
  • ...

Действие
dancing, jumpint, fighting, sitting on sofa, …

Стили
cyberpunk, engraving, ...

Художников / Фотографов
  • by SamDoesArt;
  • by Simon Stalenhag;
  • by Tim Walker;
  • ...

В подавляющем большинстве случаев стоит использовать какой-то простой базовый промпт, в качестве негативного, чтобы в среднем улучшить генерации и сделать их более красивыми.

Некоторые рекомендуют использовать следующий вариант:
«[deformed | disfigured], poorly drawn, [bad : wrong] anatomy, [extra | missing | floating | disconnected] limb, (mutated hands and fingers), blurry»

Чего не стоит добавлять

Попытки объяснить «как человеку». Не нужно пытаться написать понятное человеку правильно построенное предложение. Просто пишите через запятую набор понятий. Вес токенов, получающихся на основе предлогов, пунктуации и прочих вспомогательных лингвистических конструкций, стремится к нулю.

Огромные списки бестолковых токенов:
«highly detailed, majestic, Baugh's brushwork infuses the painting with a unique combination of realism and abstraction, greg rutkowski, surreal gold filigree, broken glass, (masterpiece, sidelighting, finely detailed beautiful eyes: 1.2), hdr, realistic painting, natural skin, textured skin, Baugh's distinctive style captures the essence of the girl's enigmatic nature, inviting viewers to explore the depths of her soul, award winning art, artstation».


«Asian» в негативном промпте — глаза и черты изменятся, но это будет неестественно. Лучше найдите и исключите/измените то понятие, которое склоняет модель к генерации азиатской внешности, либо выберете другой Checkpoint. А еще лучше дописать в позитивном промпте «European», это сработает гораздо лучше.

Это ничего не даст, скорее наоборот, ваши собственные токены будут размыты этим мусором

Усилители токенов

Любое слово/понятие в промпте можно усиливать или ослаблять. Для этого слово нужно взять в скобки и добавить через двоеточие степень усиления, например:

  • «green cat» > «(green: 0.6) cat» слово «green» ослаблено до 60%;
  • «thick woman» > «(thick woman: 1.3)» понятие усилено до 130%.

Это можно делать быстро:
Выделите слово/фразу и с помощью Ctrl+Up или Ctrl+Down отрегулируйте нужное усилении/ослабление

Вот пример промпта с усиленными токенами:
«e-commerce poster banner, Indoor small fresh style e-commerce background, front view, empty countertops, (best quality: 1.2), photography, (photorealistic: 1.4), decorative painting, clean, smooth»

Стили

Если вы часто добавляете набор понятий, имеет смысл превратить их в стиль.

Стили в Stable Diffusion - это наборы слов или фраз, которые определяют визуальные характеристики генерируемого изображения. Они могут влиять на цветовую палитру, композицию, детализацию и общую атмосферу.

Эта тема стоит тщательного разбора и изучения.
Я обязательно этим займусь, но позже. А пока обратитесь к поиску или читайте статью:
Что такое быстрые стили в Forge Web Ui / Automatic1111 и как их использовать, в том числе и на моделях FLUX
(Дмитрий Невский, boosty, 13.10.2024)

Где брать готовые промпты

1. Civitai.com — всякие разные на любой вкус.

Открыв любое изображение, вы почти всегда найдёте там промпты, как позитивный, так и негативный. Над ними указаны использованные модели и иногда LoRA. Под ними — некоторые применённые при генерации настройки:

Платные сервисы по генерации промптов я не рассматриваю


2. Генерировать промпты с помощью текстовых нейросетей, например DeepSeek — бесплатный, не требует установки, свободно владеет русским, справляется на отлично: