Искусственный интеллект
August 20, 2023

О прекрасном

Единожды начав, опыты по вовлечению ИИ в повседневную жизнь не прекращаются :).

Взять графику. Многое с одной стороны упростилось в плане быстро раздобыть картинку для поста. Но и тут необходимо применить пресловутый промпт-инжиниринг. Важно создавать правильные инструкции для ИИ, чтобы получать более ожидаемый результат.

Для эксперимента задействуем бесплатный сборник графических нейросетей zoo.replicate.dev, для перевода промпта с русского на английский Deepl (промпты для большинства графических нейронок нужно задавать на английском языке).

1. Попробуем незамысловатый промпт, которые используются во множестве

Молодая симпатичная девушка с бокалом коктейля (Young pretty girl with a glass of cocktail in her hand)

2. Какие общие рекомендации дают опытные пользователи графических нейросетей (что необходимо указать в качественном промпте):

Verb (Глагол): Что делает субъект, например, стоит, сидит, ест
Subject (Тема): Человек, животное, пейзаж
Adjectives (Прилагательные): красивый, реалистичный, большой, красочный.
Environment/Context (Окружающая среда/контекст): на открытом воздухе, под водой, в небе, ночью
Lighting (Освещение): Мягкое, окружающее, неоновое, туманное
Emotions (Эмоции): Уютно, энергично, романтично, мрачно, одиночество, страх
Artist inspiration (Вдохновение художников): Пабло Пикассо, Ван Гог, Да Винчи, Хокусай
Art medium (Художественная техника): холст, масло, акварель, эскиз, фотография.
Photography style (Стиль фотографии): Polaroid, длинная выдержка, монохромный, GoPro, «рыбий глаз», боке
Art style (Стиль): Манга, фэнтези, минимализм, абстракция, граффити
Material (Материал): ткань, дерево, глина
Colour scheme (Цветовая схема): пастельные тона, яркое динамическое освещение
Computer graphics (Компьютерная графика): 3D, октан, циклы
Illustrations (Иллюстрации): изометрические, пиксаровские, научные, комические
Quality Качество: высокое разрешение, 4K, 8K, 64K

Часто не только важен этот набор, но и данная последовательность. Разумеется, в любой конкретной ситуации нужно учитывать детали, которые включать в промпт.

3. Улучшим наш пример

Молодая красивая стильная женщина в приталенном длинном черном вечернем платье. Женщина изображена в полный рост от ступней до головы, обувь на ступнях чёрные туфли на длинном каблуке. Цвет волос женщины - черный, короткая стрижка. Стиль изображения - реалистичный, фотосессия в клубной обстановке. В руке женщина держит бокал с коктейлем. Освещение в помещении яркое. Разрешение: 4K (Young beautiful stylish woman in fitted long black evening dress. The woman is depicted in full height from the feet to the head, shoes on the feet black shoes on a long heel. The color of the woman's hair is black, short haircut. The style of the image - realistic, a photo shoot in a club setting. in the hand of the woman holds a glass with a cocktail. The lighting in the room is bright. Resolution: 4K)

Можно также добавить отрицательные подсказки, чтобы указать нейрографическому ИИ, что он не должен показывать. Эта функция часто удаляет из изначально созданного изображения ненужные элементы.

Кстати, в данном примере из довольно большого набора были использованы нейросети SDXL и Kandinsky версии 2.2. Они показали лучшие результаты (причём, Кандинский - самые лучшие). Но никто не мешает пробовать и другие :).