Midjourney — это нейросеть, которая создаёт иллюстрации по ключевым словам, которые даёт ей пользователь. С помощью неё можно создавать красивые арты и практически фотореалистичные изображения. Правда, для этого нужно понять логику работы нейросети. О том, как создать реалистичные картинки с помощью Midjourney, читайте в этом материале.

Midjourney (Миджорни) — очень многогранный и интересный инструмент, по которому можно написать не только серию текстов, но и целый учебник. Не будем пытаться объять необъятное, в этом тексте сосредоточимся только на основных функциях и тех, которые помогают создавать реалистичные изображения.
Как пользоваться Midjourney
Как получить фотореалистичное изображение с помощью Midjourney
Фотореалистичный портрет в Midjourney
Бесплатные аналоги Midjourney
Как пользоваться Midjourney
Midjourney работает на базе бесплатного мессенджера Discord. Чтобы начать ей пользоваться, нужно сначала зарегистрироваться в мессенджере (понадобится адрес электронной почты и номер телефона). После регистрации нужно получить приглашение на сайте нейросети.
Раньше демо-версия Midjourney была доступна бесплатно. У неё было ограничение по количеству картинок, которые можно сгенерировать, и по доступу к некоторым продвинутым функциям. Все картинки для этого текста сделаны в рамках бесплатной демо-версии. Для профессиональной работы было предусмотрено несколько тарифов, которые обойдутся пользователю от 10 до 60 долларов.
30 марта 2023 года создатель Midjourney Дэвид Хольц сообщил о закрытии бесплатной версии нейросети. По его словам, причиной стало злоупотребление инструментом: пользователи создавали с её помощью фейковые изображения. Теперь для пользователей доступны только платные варианты. Проблема в том, что российскими картами Midjourney можно оплатить, только прибегая к ряду ухищрений.
Итак, вы зарегистрировались в мессенджере, оплатили доступ к нейросети и получили приглашение. По ссылке вы попадаете на страницу Midjourney в Discord. Здесь нужно выбрать один из чатов в левой колонке.

Таким образом мы попадаем в основное рабочее поле. Снизу находится строка, в которую мы будем вбивать запросы. Сам тред можно поскролить и посмотреть запросы других пользователей и графические ответы нейросети. Да, всё это делается в публичном поле, скрыть, что вы рисуете, не получится.

Сам принцип работы с Midjourney очень прост: нужно ввести в поле для нейросети текстовое описание того, что вы хотите нарисовать. Единственная сложность: писать придётся на английском, другие языки нейросеть в принципе понимает, но через раз и как попало. Если с английским не очень хорошо, можно воспользоваться одним из онлайн-переводчиков.
Чтобы начать работу с нейросетью, нужно ввести в нижнее поле команду /imagine. Любой запрос всегда начинается с неё. После этого вводим описание того, что будем рисовать. О том, как правильно составлять описания, мы подробно поговорим ниже, пока возьмём что-нибудь максимально простое, чтобы разобраться с интерфейсом.

После этого нейросеть начнёт работать, ей может понадобиться на рисование от пары секунд до нескольких минут. Самое сложное для пользователя на этом этапе — не проворонить свою картинку и откопать её из кучи чужих. Поскольку чат общественный, у вас перед глазами будут постоянно мелькать чужие работы.
Через какое-то время нейросеть выдаст вот такое сообщение.

Дальше работаем с кнопками:
- U — сокращение от Upscale (увеличить);
- V — сокращение от Variations (вариации).
Цифра означает номер картинки. Если, например, вам понравилось то, что сделала нейросеть, скажем, на второй картинке, выбирайте U2. Если вам в целом нравится композиция третьей, но хотелось бы больше вариантов по форме стакана или количеству апельсинов на столе, нажимайте V3. Так и поступим. Через несколько секунд нейросеть выдаст нам такое сообщение:

Дальше можно продолжать рисовать вариации, а можно выбрать картинку, увеличить её и сохранить. Возьмём третью, поэтому выбираем команду U3.

Как получить фотореалистичное изображение с помощью Midjourney
Наш финальный арт, полученный на запрос «pizza and orange juice», выглядит вот так:

Дело в том, что запрос, который мы дали нейросети, был достаточно широк: пиццу и сок можно нарисовать и в мультяшной стилизации, и в виде карандашного рисунка, и как эскиз для татуировки, и как фотореалистичное изображение. Всё это нейросеть умеет, но ей нужно дать понять, что именно нужно.
Чтобы получить конкретный результат, стоит давать максимально подробную задачу. Скормим нейросети такой запрос:
И посмотрим на формулировку запроса очень внимательно:
– слова photorealistic (фотореалистичный), ultrarealistic (ультрареалистичный), detailed (детализированный) — дают нейросети понять, в каком стиле нужно рисовать;
– promotional photo (рекламное фото), food photo, food styling — указывают на то, что нам нужна не просто фотка чьего-то завтрака, а рекламное фото;
– RTX, studio lighting — указывают на то, каким должен быть свет на картинке;
– shot on Sony 7R (снято на конкретную модель камеры), bokeh (боке) — помогает выстраивать нужную нам перспективу и уровень размытия фона;
– —ar 3:2 (aspect ratio) — указывает на соотношение сторон готового изображения, его можно делать любым, меняя цифры в пропорции. По умолчанию нейросеть генерирует квадратные изображения.
По такому описанию нейросеть выдаёт такие варианты готового натюрморта:

И к слову о Дали. Если добавить в описание слова «by Salvadore Dali», можно получить вот такое сюрреалистичное нечто:

И вместо Дали можно подставлять имя любого художника и фотографа, главное, чтобы интернет о нём что-то знал. Нейросеть будет вдохновляться его работами и пытаться стилизовать изображение.
Однако вернёмся к нашему реализму.
Дальше работа идёт также, как мы делали раньше: можно порисовать вариации на приглянувшийся сюжет, можно сразу увеличить понравившееся изображение. Обратите внимание, что при увеличении нейросеть не просто делает картинку больше, она перерисовывает её заново в большем размере. Поэтому часть деталей может немного измениться.

Предположим, что странный зелёный предмет — это солонка необычной формы, и пойдём дальше. Вот что получилось при увеличении натюрморта с левитирующей пиццей.

По пути к фотореалистичной пицце мы потеряли стакан с соком, и на это есть причина. По описанию «photorealistic pizza and orange juice (дальнейшая часть такая же, как раньше)» нейросеть упорно рисовала пиццу с кусочками апельсина.

Что ещё раз доказывает, что наши запросы для нейросети — просто набор слов. Ей всё равно, что класть на нашу воображаемую пиццу. Придётся делать запрос ещё более конкретным, чтобы развести помидоры и апельсины.
Мы прописываем, какая начинка должна быть в пицце, и уточняем, что пицца лежит на тарелке, а стакан сока стоит рядом. И получаем вот такой результат.

Мне больше всего понравился правый нижний вариант, хотя тут уже дело вкуса. После нескольких вариаций и увеличения он выглядит так:

Понятно, что полностью заменить работу фудфотографа нейросеть не может. Во-первых, она всё же не полностью управляемая, и в её работу вмешивается элемент случайности. Во-вторых, создание действительно серьёзных и продуманных иллюстраций требует опыта, насмотренности, терпения и занимает много времени.
Картинка выше выглядит неплохо, но всё же сделана на коленке. Ей можно проиллюстрировать пост в соцсети или напечатать на обложке меню недорогой кафешки, но если пристально всматриваться в детали, легко найти недочёты.
Фотореалистичный портрет в Midjourney
Нейросеть отлично работает не только с натюрмортами, но и с портретами. Причём с людьми она справляется даже лучше. Дело в том, что нейросеть — самообучающаяся система, и чем больше она рисует что-либо, тем лучше она это рисует. А людей рисуют чаще всего.
Кстати, учитывайте эту особенность при работе: в том плане, что пиццу рисовать легко, а скажем, какую-нибудь редкую разновидность кактуса, которая растёт в трёх местах на земле, уже сложнее.
Предложим Midjourney нарисовать портрет шефа, который испёк нашу пиццу. Описание будет таким:
Обратите внимание на детали:
– waist portrait (поясной потрет) — задаём крупность портрета;
– volumetric light (свет, создающий объём) — даём подсказку по свету;
– shot on sony A7R with 1.2 lens — указываем на конкретную камеру, объектив и значение диафрагмы.
Вот что у нас получилось по этому описанию:

Увеличим одно из изображений и посмотрим, как у него с детализацией.

Кстати, руки — самое слабое место нейросети. Она часто ошибается с количеством пальцев, выгибает их странным образом. Но здесь повезло.
Ещё одна интересная особенность: нейросеть может рисовать не только абстрактных людей, но и портреты известных личностей. Так что, пускай пиццу на подаёт Эмма Уотсон. Добавим её имя в описание.

Бесплатные аналоги Midjourney
Сейчас многие программы, соцсети и разработчики интересуются нейросетями и активно внедряют их элементы в работу. Например, голосовой помощник «Яндекса» Алиса умеет рисовать простые картинки, хотя у неё не всегда хорошо получается. Существуют DALL-E Mini, российские «Малевич» и «Кандинский», но все они не заточены под создание фотореалистичных изображений.
Единственным близким по возможности аналогом Midjourney можно назвать разве что Stable Diffusion от Stability AI. Он работает по схожему принципу и пока позволяет использовать себя бесплатно. Главное отличие — Stable Diffusion работает локально: его нужно установить на свой компьютер.
