Текст для создания фото в ИИ: как писать промпты, которые реально работают
Вы вводите «красивая девушка на закате» — и получаете безликий стоковый кадр с пластиковой кожей. Вводите тот же запрос, но чуть иначе, — и нейросеть выдаёт снимок, который хочется распечатать и повесить на стену. Разница не в модели. Разница в тексте.
Текст для создания фото в ИИ — это не просто описание картинки. Это язык, которым вы разговариваете с нейросетью. И как в любом языке, здесь есть грамматика, нюансы и слова, которые работают лучше остальных. В этом руководстве я разберу всё: от базовой структуры промпта до конкретных примеров для машин, пар, портретов и обработки фото.
🧠 Почему текст решает всё: анатомия промпта
Нейросети для генерации изображений — Midjourney, Stable Diffusion, DALL·E, Leonardo AI — работают по одному принципу: они переводят текстовое описание в визуальный образ через латентное пространство. Чем точнее вы описываете желаемый результат, тем меньше нейросеть «фантазирует» от себя.
Хороший промпт состоит из нескольких слоёв:
- Субъект — что или кто изображён
- Среда и фон — где происходит действие
- Освещение — тип, направление, температура света
- Стиль и эстетика — фотореализм, живопись, кинематографичность
- Технические параметры — камера, объектив, выдержка, глубина резкости
- Настроение — эмоциональный тон сцены
- Негативные подсказки — что исключить из результата
💡 Совет: Думайте о промпте как о техническом задании для фотографа. Чем конкретнее ТЗ — тем ближе результат к задуманному.
📋 Структура эффективного промпта: формула
[Субъект] + [действие/поза] + [среда] + [освещение] + [стиль] + [камера/технические детали] + [настроение]
Пример:
Portrait of a 30-year-old woman with dark curly hair,
smiling gently, sitting in a Parisian café,
warm morning light streaming through the window,
film photography style, shot on Kodak Portra 400,
85mm lens, shallow depth of field,
cozy and nostalgic atmosphere
Если вы работаете с русскоязычными интерфейсами, тот же принцип работает на русском, но большинство топовых генераторов лучше «понимают» английский. Ниже я дам примеры для обоих языков.
🚗 Текст для ИИ для фото машины: примеры и нюансы
Автомобильная фотография — один из самых технически сложных жанров даже для людей. Нейросеть нужно буквально «вести за руку».
Что обязательно указывать для авто:
- Марка и модель (BMW M3, Ford Mustang Shelby GT500)
- Год выпуска или эра дизайна (vintage 1967, modern 2023)
- Угол съёмки (front 3/4 view, low angle, aerial)
- Среда (desert highway, urban night, mountain road)
- Эффекты движения или статика (motion blur, parked)
A 1969 Ford Mustang Fastback, deep burgundy metallic paint,
parked on Route 66 at golden hour,
low angle front 3/4 view,
long shadows, dramatic sky with orange clouds,
commercial automotive photography,
shot with Canon EF 24-70mm f/2.8,
ultra-detailed reflections on hood
Black Lamborghini Huracán on wet night city street,
neon reflections on bodywork,
motion blur on background, car in sharp focus,
cinematic lighting, rain puddles on asphalt,
top-tier automotive editorial photography,
lens flare effect
⚠️ Важно: Без указания конкретной модели нейросеть придумает «условный автомобиль» — гибрид из нескольких марок с неправильными пропорциями. Всегда называйте точную модель.
| Параметр | Плохой промпт | Хороший промпт |
|---|---|---|
| Субъект | красивая машина | BMW M3 Competition 2023, Alpine White |
| Фон | дорога | mountain pass in Swiss Alps, morning fog |
| Освещение | хорошее освещение | golden hour, rim lighting from behind |
| Стиль | фото | automotive editorial, Canon 1DX Mark III |
| Угол | сбоку | low angle rear 3/4 view |
💑 Текст для ИИ для фото пары: романтика через слова
Фото пары — деликатная задача. Нейросеть нужно научить передавать не просто двух людей рядом, а эмоциональную связь между ними.
Ключевые элементы для промптов пары:
- Взаимодействие — что именно делают персонажи (forehead kiss, laughing together, holding hands)
- Близость — физическая дистанция между людьми
- Контекст — почему они здесь, какой это момент
- Симметрия взгляда — куда смотрят персонажи
Young couple in their late 20s,
woman resting her head on man's shoulder,
both laughing naturally,
sitting on wooden pier over calm lake at sunset,
golden hour soft light,
lifestyle photography, candid moment,
shot on 35mm film, warm vintage tones,
f/1.8 aperture, dreamy bokeh background
Couple dancing in a sunlit wheat field,
woman in white summer dress, man in linen shirt,
spin movement with motion blur on fabric,
overhead sun creating rim light,
happy and carefree atmosphere,
Vogue editorial style, medium format photography
💡 Совет: Добавляйте слово candid (непостановочный) — оно магически делает портреты пар живее и естественнее, убирая «студийную» скованность.
🎭 Текст для ИИ для обработки фото: стиль-трансфер и пресеты
Помимо генерации с нуля, нейросети умеют переосмыслять существующие фотографии. Здесь текст работает иначе — вы описываете не создание, а трансформацию.
Популярные стили для обработки:
Кинематографические пресеты:
Convert to cinematic film photography style,
Kodak Vision3 500T color grading,
teal and orange color palette,
film grain overlay, slight vignette,
cinematic aspect ratio 2.39:1
Аниме и иллюстрация:
Transform into Studio Ghibli animation style,
soft watercolor textures,
pastel color palette,
hand-drawn feel,
detailed background in Miyazaki's style
Масляная живопись:
Reinterpret as oil painting in the style of Rembrandt,
dramatic chiaroscuro lighting,
rich earth tones, visible brushstrokes,
Classical Dutch Golden Age portrait style
📊 Факт: По данным исследований рынка ИИ-инструментов, более 60% пользователей платформ для генерации изображений используют стиль-трансфер именно для обработки личных фотографий — портретов и семейных снимков.
🤳 AI-портреты: как писать текст для реалистичных лиц
Портрет — это самый требовательный жанр для нейросети. Мозг человека мгновенно замечает малейшие искажения в лице, поэтому промпт должен быть максимально точным.
Формула идеального портретного промпта:
[возраст и пол] + [этнические черты/тип внешности] +
[конкретные черты лица] + [выражение] +
[освещение] + [технические параметры камеры]
Пример бьюти-портрета:
Close-up portrait of a 25-year-old East Asian woman,
high cheekbones, almond-shaped brown eyes,
natural makeup, slight smile,
soft studio lighting with large octabox,
white seamless background,
shot on Phase One IQ4 150MP,
110mm portrait lens, f/4,
photorealistic, ultra-high detail,
editorial beauty photography
Пример мужского портрета:
Moody portrait of a 40-year-old man,
short salt-and-pepper beard, deep-set blue eyes,
serious contemplative expression,
Dramatic Rembrandt lighting, single light source from left,
dark background,
leather jacket,
Hasselblad medium format film look,
high contrast black and white
Face Swap и персонализация
Многие платформы предлагают функцию face swap — замену лица на сгенерированном изображении. Здесь текст играет роль задания стиля и сцены, а лицо «вставляется» отдельно. Важно писать промпт так, чтобы освещение в сцене совпадало с освещением на исходном фото — это ключ к реалистичному результату.
Person standing on rooftop in Tokyo at night,
city lights bokeh background,
cool blue ambient light with warm window light from right side,
editorial fashion photography,
natural skin tones, sharp facial features
⚙️ Технические параметры, которые меняют всё
Многие пользователи пишут красивые описания сцены и забывают о технических деталях. А именно они определяют качество и стиль итогового изображения.
| Параметр | Примеры значений | Эффект |
|---|---|---|
| Камера | Canon EOS R5, Hasselblad X2D, Leica M11 | Определяет «характер» изображения |
| Объектив | 35mm, 85mm portrait lens, 14mm wide | Влияет на перспективу и сжатие |
| Диафрагма | f/1.4 (боке), f/8 (резко всё) | Глубина резкости |
| Плёнка | Kodak Portra 400, Fuji Velvia, Ilford HP5 | Цветовой характер |
| Разрешение | 8K, ultra-detailed, hyperrealistic | Детализация |
| Соотношение | 16:9, 4:5, square 1:1 | Кадрирование |
💡 Совет: Упоминание конкретной камеры — не просто деталь. Нейросеть «знает» характер съёмки на Leica или Hasselblad и воспроизводит соответствующую эстетику.
❌ Негативные промпты: чего говорить нельзя
Негативные промпты — отдельный инструмент, который работает параллельно с основным текстом. Вы указываете, что не должно появиться на изображении.
Негативный промпт (universal):
blurry, out of focus, low quality, pixelated,
distorted face, extra fingers, deformed hands,
watermark, text overlay, overexposed,
unnatural skin, plastic skin, uncanny valley effect,
low resolution, jpeg artifacts, oversaturated
Для портретов особенно важно добавить:
asymmetrical eyes, crossed eyes, double chin (если не нужен),
unnatural teeth, floating limbs, merged fingers
🌐 Русскоязычные промпты: работают ли они?
Ответ: да, но с оговорками. Современные модели всё лучше понимают русский язык, однако английский по-прежнему даёт более предсказуемый результат — особенно для технических параметров и имён собственных (марки камер, плёнок, художников).
Рабочая тактика: основное описание на русском, технические параметры и стилистические ссылки — на английском.
Пример смешанного промпта:
Молодая женщина в белом платье на цветочном лугу,
лето, ветер развевает волосы,
shot on Canon 5D Mark IV, 85mm lens,
golden hour, Kodak Portra 400 film grain,
bokeh background, dreamy romantic atmosphere
Платформы вроде Creatorry адаптированы для русскоязычных пользователей и позволяют создавать фото, музыку и видео с интерфейсом на родном языке — это снижает порог входа для тех, кто только начинает работу с AI-генерацией.
🎨 10 готовых промптов: скопируй и используй
- Городской портрет:
Street portrait of a young man in New York City,
Brooklyn Bridge in background, blue hour,
film grain, Leica Q2, 28mm, candid expression
- Осенняя пара:
Couple walking through autumn forest,
holding hands, falling leaves, warm amber light,
lifestyle photography, 50mm lens, soft focus background
- Спорткар ночью:
Red Ferrari SF90 on Tokyo highway at night,
neon light reflections, rain-wet asphalt,
motion blur, low angle, cinematic grade
- Ретро-портрет:
Woman in 1950s dress, victory rolls hairstyle,
red lipstick, black and white studio portrait,
Hollywood glamour lighting, George Hurrell style
- Пейзаж с человеком:
Solitary figure standing on cliff edge,
Icelandic landscape, Northern Lights above,
long exposure photography, tiny person vs vast nature
- Детский портрет:
Happy little girl, 5 years old, playing in rain puddles,
yellow raincoat and boots, rainy day in Paris,
candid moment, natural light, joyful expression
- Натюрморт с кофе:
Aerial flat lay of morning coffee setup,
latte art in white ceramic cup, croissant, newspaper,
soft natural window light, minimal Scandinavian style,
food photography
- Фэшн-портрет:
High fashion editorial portrait, model in avant-garde outfit,
studio with colored gel lighting, teal and magenta,
Vogue Italia aesthetic, dramatic shadows
- Свадебное фото:
Wedding couple first dance, outdoor garden venue,
string lights bokeh background, golden hour,
emotional candid moment, photojournalism style
- Фото в стиле кино:
Cinematic frame from neo-noir film,
detective in trench coat under street lamp,
rainy night, film grain, 2.35:1 aspect ratio,
David Fincher visual style
🏁 Что важно запомнить
- Конкретность побеждает красивость — «BMW M3 2023» работает лучше, чем «крутая машина»
- Технические параметры (камера, объектив, плёнка) кардинально меняют эстетику
- Негативные промпты — обязательная часть, особенно для портретов
- Освещение — самый мощный инструмент создания настроения
- Слово «candid» делает постановочные кадры живыми
- Смешивайте русский и английский в промптах — это практично и эффективно
- Промпт — это навык, который оттачивается итерациями: меняйте одно слово, смотрите на результат, учитесь
Самое главное: относитесь к написанию промптов как к творческому процессу, а не к техническому заданию. Лучшие результаты получаются тогда, когда вы точно знаете, какую эмоцию должна вызывать картинка — и строите весь текст вокруг этой эмоции.
❓ Часто задаваемые вопросы
Q: На каком языке лучше писать промпты для нейросети — на русском или английском?
A: Большинство ведущих моделей (Midjourney, Stable Diffusion, DALL·E) обучены преимущественно на англоязычных данных, поэтому английские промпты дают более предсказуемый и детализированный результат. Однако современные модели неплохо справляются и с русским языком. Оптимальная стратегия — писать основное описание на том языке, который вам удобнее, а технические параметры (названия камер, объективов, плёнок, стилей) указывать на английском. Например: «Портрет девушки в летнем платье на набережной, shot on Leica M11, Kodak Portra 400, golden hour».
Q: Почему нейросеть генерирует уродливые руки и как это исправить?
A: Это классическая проблема большинства диффузионных моделей — руки исторически были слабым местом из-за недостаточного количества обучающих данных с чёткими изображениями рук. Чтобы минимизировать дефекты: 1) добавьте в негативный промпт «extra fingers, deformed hands, merged fingers, unnatural hands»; 2) избегайте поз, где руки находятся на переднем плане и хорошо видны; 3) используйте актуальные версии моделей — SDXL и Midjourney v6 справляются с руками значительно лучше предшественников; 4) если руки важны для сцены, сделайте несколько итераций и выберите лучший вариант.
Q: Можно ли с помощью промпта воссоздать конкретного человека (например, себя) на сгенерированном фото?
A: Только текстом — нет. Промпт позволяет описать тип внешности, но не конкретное лицо. Для добавления реального лица используются технологии face swap и personalization — вы загружаете своё фото, и модель «встраивает» ваши черты в сгенерированный образ. В промпте при этом важно описать освещение и стиль сцены так, чтобы они совпадали с характеристиками исходного портретного фото — это ключ к органичному и реалистичному результату.
Q: Как написать промпт для обработки уже существующей фотографии в определённом стиле?
A: При работе с img2img (изображение-в-изображение) промпт описывает желаемый результат, а не исходное фото. Укажите: целевой художественный стиль («Studio Ghibli animation», «oil painting, Rembrandt style», «Kodak film photography»), желаемый колорит («warm tones», «teal and orange grade»), текстуры («film grain», «watercolor paper texture», «visible brushstrokes») и настроение. Параметр «strength» или «denoising strength» контролирует, насколько сильно изменится исходное изображение — чем он выше, тем радикальнее трансформация.
Q: Сколько слов должен содержать идеальный промпт?
A: Нет универсального ответа, но практика показывает: для Midjourney оптимальны промпты от 20 до 70 слов. Очень короткие (3–5 слов) дают интересные, но непредсказуемые результаты. Очень длинные (150+ слов) иногда «перегружают» модель, и она начинает игнорировать часть описания. Золотая середина — чёткое, структурированное описание на 30–60 слов, где каждое слово несёт смысловую нагрузку. Убирайте «воду» и общие слова вроде «beautiful», «amazing», «stunning» — они практически не влияют на результат и занимают место более конкретных инструкций.