Написать

Главная
Статьи
Как пользоваться Midjourney: создаём реалистичные фото

Как пользоваться Midjourney: создаём реалистичные фото

31 мар. 2023

52533

Midjourney — это нейросеть, которая создаёт иллюстрации по ключевым словам, которые даёт ей пользователь. С помощью неё можно создавать красивые арты и практически фотореалистичные изображения. Правда, для этого нужно понять логику работы нейросети. О том, как создать реалистичные картинки с помощью Midjourney, читайте в этом материале.

Это снимок или работа нейросети? Сможете определить за 1 секунду? / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт

Midjourney (Миджорни) — очень многогранный и интересный инструмент, по которому можно написать не только серию текстов, но и целый учебник. Не будем пытаться объять необъятное, в этом тексте сосредоточимся только на основных функциях и тех, которые помогают создавать реалистичные изображения.

Как пользоваться Midjourney
Как получить фотореалистичное изображение с помощью Midjourney
Фотореалистичный портрет в Midjourney
Бесплатные аналоги Midjourney

Как пользоваться Midjourney

Midjourney работает на базе бесплатного мессенджера Discord. Чтобы начать ей пользоваться, нужно сначала зарегистрироваться в мессенджере (понадобится адрес электронной почты и номер телефона). После регистрации нужно получить приглашение на сайте нейросети.

Раньше демо-версия Midjourney была доступна бесплатно. У неё было ограничение по количеству картинок, которые можно сгенерировать, и по доступу к некоторым продвинутым функциям. Все картинки для этого текста сделаны в рамках бесплатной демо-версии. Для профессиональной работы было предусмотрено несколько тарифов, которые обойдутся пользователю от 10 до 60 долларов.

30 марта 2023 года создатель Midjourney Дэвид Хольц сообщил о закрытии бесплатной версии нейросети. По его словам, причиной стало злоупотребление инструментом: пользователи создавали с её помощью фейковые изображения. Теперь для пользователей доступны только платные варианты. Проблема в том, что российскими картами Midjourney можно оплатить, только прибегая к ряду ухищрений.

Итак, вы зарегистрировались в мессенджере, оплатили доступ к нейросети и получили приглашение. По ссылке вы попадаете на страницу Midjourney в Discord. Здесь нужно выбрать один из чатов в левой колонке.

Можно заходить в любой, это совершенно ни на что не повлияет / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт

Таким образом мы попадаем в основное рабочее поле. Снизу находится строка, в которую мы будем вбивать запросы. Сам тред можно поскролить и посмотреть запросы других пользователей и графические ответы нейросети. Да, всё это делается в публичном поле, скрыть, что вы рисуете, не получится.

Сюда будем вводить команды для нейросети / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт

Сам принцип работы с Midjourney очень прост: нужно ввести в поле для нейросети текстовое описание того, что вы хотите нарисовать. Единственная сложность: писать придётся на английском, другие языки нейросеть в принципе понимает, но через раз и как попало. Если с английским не очень хорошо, можно воспользоваться одним из онлайн-переводчиков.

Чтобы начать работу с нейросетью, нужно ввести в нижнее поле команду /imagine. Любой запрос всегда начинается с неё. После этого вводим описание того, что будем рисовать. О том, как правильно составлять описания, мы подробно поговорим ниже, пока возьмём что-нибудь максимально простое, чтобы разобраться с интерфейсом.

Будем рисовать натюрморт с пиццей и апельсиновым соком. Лошадь выше — это чей-то чужой арт / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт

После этого нейросеть начнёт работать, ей может понадобиться на рисование от пары секунд до нескольких минут. Самое сложное для пользователя на этом этапе — не проворонить свою картинку и откопать её из кучи чужих. Поскольку чат общественный, у вас перед глазами будут постоянно мелькать чужие работы.

Через какое-то время нейросеть выдаст вот такое сообщение.

Midjourney нарисовала четыре разных эскиза. Выбрать и доработать их можно при помощи кнопок внизу сообщения / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт

Дальше работаем с кнопками:

U — сокращение от Upscale (увеличить);
V — сокращение от Variations (вариации).

Цифра означает номер картинки. Если, например, вам понравилось то, что сделала нейросеть, скажем, на второй картинке, выбирайте U2. Если вам в целом нравится композиция третьей, но хотелось бы больше вариантов по форме стакана или количеству апельсинов на столе, нажимайте V3. Так и поступим. Через несколько секунд нейросеть выдаст нам такое сообщение:

Midjourney создала четыре вариации третьего сюжета — у всех картинок схожая композиция и условия освещения, но есть разница в деталях / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт

Дальше можно продолжать рисовать вариации, а можно выбрать картинку, увеличить её и сохранить. Возьмём третью, поэтому выбираем команду U3.

После того, как появится такое сообщение, нужно кликнуть по картинке и нажать на кнопку Open in Browser. Это позволит сохранить изображение в полном размере / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт

Как получить фотореалистичное изображение с помощью Midjourney

Наш финальный арт, полученный на запрос «pizza and orange juice», выглядит вот так:

В принципе, ничего так, но капли на столе и помидорчики какие-то странные. Пока не фотореализм / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт

Дело в том, что запрос, который мы дали нейросети, был достаточно широк: пиццу и сок можно нарисовать и в мультяшной стилизации, и в виде карандашного рисунка, и как эскиз для татуировки, и как фотореалистичное изображение. Всё это нейросеть умеет, но ей нужно дать понять, что именно нужно.

Чтобы получить конкретный результат, стоит давать максимально подробную задачу. Скормим нейросети такой запрос:

photorealistic pizza, promotional photo, food photo, food styling, ultrarealistic, detailed, RTX, shot on Sony 7R, bokeh, —ar 3:2

И посмотрим на формулировку запроса очень внимательно:

– слова photorealistic (фотореалистичный), ultrarealistic (ультрареалистичный), detailed (детализированный) — дают нейросети понять, в каком стиле нужно рисовать;

– promotional photo (рекламное фото), food photo, food styling — указывают на то, что нам нужна не просто фотка чьего-то завтрака, а рекламное фото;

– RTX, studio lighting — указывают на то, каким должен быть свет на картинке;

– shot on Sony 7R (снято на конкретную модель камеры), bokeh (боке) — помогает выстраивать нужную нам перспективу и уровень размытия фона;

– —ar 3:2 (aspect ratio) — указывает на соотношение сторон готового изображения, его можно делать любым, меняя цифры в пропорции. По умолчанию нейросеть генерирует квадратные изображения.

По такому описанию нейросеть выдаёт такие варианты готового натюрморта:

Верхний правый явно рисовал лично Сальвадор Дали, остальные три выглядят очень и очень неплохо / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт

И к слову о Дали. Если добавить в описание слова «by Salvadore Dali», можно получить вот такое сюрреалистичное нечто:

По версии Midjourney, если бы мастер взялся бы за рекламу пиццы, это выглядело бы так / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт

И вместо Дали можно подставлять имя любого художника и фотографа, главное, чтобы интернет о нём что-то знал. Нейросеть будет вдохновляться его работами и пытаться стилизовать изображение.

Однако вернёмся к нашему реализму.

Дальше работа идёт также, как мы делали раньше: можно порисовать вариации на приглянувшийся сюжет, можно сразу увеличить понравившееся изображение. Обратите внимание, что при увеличении нейросеть не просто делает картинку больше, она перерисовывает её заново в большем размере. Поэтому часть деталей может немного измениться.

Обратите внимание на зелёный предмет в левом нижнем углу. На исходной картинке казалось, что это перец чили, после увеличения он стал выглядеть иначе / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт

Предположим, что странный зелёный предмет — это солонка необычной формы, и пойдём дальше. Вот что получилось при увеличении натюрморта с левитирующей пиццей.

Оливки немного напоминают чёрный виноград, но это уже если совсем придираться / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт

По пути к фотореалистичной пицце мы потеряли стакан с соком, и на это есть причина. По описанию «photorealistic pizza and orange juice (дальнейшая часть такая же, как раньше)» нейросеть упорно рисовала пиццу с кусочками апельсина.

Хм, аппетитно. Но немного не то, что мы заказывали / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт

Что ещё раз доказывает, что наши запросы для нейросети — просто набор слов. Ей всё равно, что класть на нашу воображаемую пиццу. Придётся делать запрос ещё более конкретным, чтобы развести помидоры и апельсины.

photorealistic pizza with tomatoes and pepperoni and basil on the plate standing next to a glass of orange juice, promotional photo, food photo, food styling, ultrarealistic, detailed, RTX, shot on Sony 7R, bokeh, --ar 3:2

Мы прописываем, какая начинка должна быть в пицце, и уточняем, что пицца лежит на тарелке, а стакан сока стоит рядом. И получаем вот такой результат.

Очень и очень неплохо. Апельсины отдельно, пицца отдельно. Кроме первой картинки / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт

Мне больше всего понравился правый нижний вариант, хотя тут уже дело вкуса. После нескольких вариаций и увеличения он выглядит так:

Пиццу захотелось, правда же? / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт

Понятно, что полностью заменить работу фудфотографа нейросеть не может. Во-первых, она всё же не полностью управляемая, и в её работу вмешивается элемент случайности. Во-вторых, создание действительно серьёзных и продуманных иллюстраций требует опыта, насмотренности, терпения и занимает много времени.

Картинка выше выглядит неплохо, но всё же сделана на коленке. Ей можно проиллюстрировать пост в соцсети или напечатать на обложке меню недорогой кафешки, но если пристально всматриваться в детали, легко найти недочёты.

Фотореалистичный портрет в Midjourney

Нейросеть отлично работает не только с натюрмортами, но и с портретами. Причём с людьми она справляется даже лучше. Дело в том, что нейросеть — самообучающаяся система, и чем больше она рисует что-либо, тем лучше она это рисует. А людей рисуют чаще всего.

Кстати, учитывайте эту особенность при работе: в том плане, что пиццу рисовать легко, а скажем, какую-нибудь редкую разновидность кактуса, которая растёт в трёх местах на земле, уже сложнее.

Предложим Midjourney нарисовать портрет шефа, который испёк нашу пиццу. Описание будет таким:

studio portrait of old iltalian chef with grey moustache, wearing chef 's hat on his head, dish with pizza in his hands, blurry interior of kitchen at the background, waist portrait, shot on sony A7R with 1.2 lens, ultrarealistic, 4k ultrahd, RTX, photorealistic, volumetric light, studio light, —ar 16:10 (студийный портрет старого итальянского шеф-повара с седыми усами в поварском колпаке с блюдом с пиццей на фоне размытого интерьера кухни)

Обратите внимание на детали:

– waist portrait (поясной потрет) — задаём крупность портрета;

– volumetric light (свет, создающий объём) — даём подсказку по свету;

– shot on sony A7R with 1.2 lens — указываем на конкретную камеру, объектив и значение диафрагмы.

Вот что у нас получилось по этому описанию:

Не на всех хорошо видна пицца, но получилось атмосферно / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт

Увеличим одно из изображений и посмотрим, как у него с детализацией.

Глаза, ресницы, волосы — всё на месте. Немного странно выглядит левая рука, но не сильно / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт

Кстати, руки — самое слабое место нейросети. Она часто ошибается с количеством пальцев, выгибает их странным образом. Но здесь повезло.

Ещё одна интересная особенность: нейросеть может рисовать не только абстрактных людей, но и портреты известных личностей. Так что, пускай пиццу на подаёт Эмма Уотсон. Добавим её имя в описание.

Не идеально, но что-то общее определённо есть. Если покрутить вариации, можно добиться и лучшего результата / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт

Бесплатные аналоги Midjourney

Сейчас многие программы, соцсети и разработчики интересуются нейросетями и активно внедряют их элементы в работу. Например, голосовой помощник «Яндекса» Алиса умеет рисовать простые картинки, хотя у неё не всегда хорошо получается. Существуют DALL-E Mini, российские «Малевич» и «Кандинский», но все они не заточены под создание фотореалистичных изображений.

Единственным близким по возможности аналогом Midjourney можно назвать разве что Stable Diffusion от Stability AI. Он работает по схожему принципу и пока позволяет использовать себя бесплатно. Главное отличие — Stable Diffusion работает локально: его нужно установить на свой компьютер.

Пицца от Stable Diffusion. С описанием, возможно, стоит ещё поработать / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт

31 мар. 2023

52533

Самые новые

Самые читаемые