Как создавать изображения и визуальные эффекты с помощью генеративного ИИ

В процессе создания сообщения в блоге или новостной статьи есть один момент, которого боится каждый мелкий издатель:

«Что я использую в качестве избранного изображения?»

У агентств и медиакомпаний есть креативные директора, фотографы и художники, которые готовы создать для них этот образ. А как насчет остальных из нас?

Некоторые из нас, несмотря на здравый смысл, перейдут на Google Картинки. Другие перейдут на бесплатный сайт, такой как Pexels или Unsplash. Некоторые заходят на такие сайты, как Adobe Stock, iStock или Shutterstock, чтобы заплатить за изображение.

Надеюсь, все, кто читает это, знают, почему воровать изображения из Интернета — не лучшая идея. Если вы не используете общедоступное изображение, загружаемые вами изображения принадлежат кому-то.

Если вы планируете развивать свой бизнес или бренд, вы не хотите, чтобы ваш сайт был заполнен нелицензионными изображениями, которые однажды могут вас преследовать.

Что касается стоковых фотографий, каждый, кто пользовался сайтом стоковых фотографий, сталкивался с разочарованием, просматривая результаты поиска страницу за страницей и так и не находя нужного. Многие стоковые фотографии повторяются, обыденны или банальны, что стали буквально шуткой.

А если вам удастся найти приличную стоковую фотографию, скорее всего, ее использовали снова и снова.

Например, это фото разноплановой группы коллег на Pexels было скачано более 75 000 раз и появилось в Google Картинках на 175 сайтах. Что, по иронии судьбы, является противоположностью понятия «разнообразие».

Генератор изображений AI

Помните, я говорил, что у крупных компаний есть креативные директора, фотографы и художники, которые всегда готовы помочь? Благодаря генераторам изображений с искусственным интеллектом вы теперь можете получить все это.

В настоящее время для создания изображений из текста широко используются два типа сайтов.

Первые – это сайты, ориентированные только на изображения. Самый популярный — Midjourney. Следующими по популярности являются сайты, основанные на модели Stable Diffusion с открытым исходным кодом, такие как собственная DreamStudio Stability.Ai. 

Креативисты и дизайнеры, как правило, отдают предпочтение этим платформам, поскольку они ориентированы исключительно на искусство искусственного интеллекта; они находятся на переднем крае качества изображения и предоставляют художникам множество возможностей индивидуальной настройки и тонкой настройки.

В этой статье я собираюсь сосредоточиться на чат-ботах с искусственным интеллектом, которые более доступны для маркетологов и нехудожников.

На момент написания этой статьи Claude от Anthropic не поддерживает текст. -to-image и Google Gemini, на мой вкус, слишком противоречивы. (Большинство запросов, которые я тестирую, приводят к сообщению об ошибке или изображению, которое не соответствует тому, что я запрашивал.)

С другой стороны, ChatGPT от OpenAI (с генерацией изображений на базе DALL-E) и Grok от X (с генерацией изображений на базе FLUX.1) становятся потрясающе хорошими. 

На момент написания этой статьи ChatGPT Plus стоит 20 долларов в месяц. Он включает в себя создание изображений DALL-E и доступ к чат-боту ChatGPT.

ChatGPT — это то, что я имел в виду, когда писал свою статью еще в апреле, предсказывая, что люди будут меньше использовать Google, когда привыкнут к использованию чат-ботов с искусственным интеллектом. С тех пор я бы сказал, что 80 % поисковых запросов, которые я раньше выполнял в Google, теперь выполняю в ChatGPT.

Grok входит в премиум-уровень платформы социальных сетей X и стоит 8 долларов США в месяц. За эту цену вы получаете доступ к созданию изображений FLUX.1, а также к чат-боту Grok и премиум-функциям на X.

Что касается того, что вам следует выбрать, я бы предложил оба варианта.

На данный момент я считаю, что ChatGPT по-прежнему опережает Грока по своей полезности в качестве чат-бота, а Грок, возможно, превосходит Грока в создании изображений.

Как вы вскоре увидите, 28 долларов в месяц — это гроши по сравнению с той ценностью, которую вы получаете от создания изображений, не говоря уже обо всех других способах, с помощью которых чат-боты с искусственным интеллектом могут повысить вашу производительность.

Генеративный ИИ в качестве вашего личного креативного директора, фотографа и художника h2>

Для тех из вас, кто никогда раньше не использовал чат-бота с искусственным интеллектом для преобразования текста в изображение, я кратко расскажу, как это работает.

Предположим, вы пишете сообщение в блоге или статью о том, как купить матрас, и приходите к моменту, когда вам нужно выбрать избранное изображение.

Вместо того, чтобы искать изображение, просто введите его в свой чат-бот.

«Нарисуй мне коробчатый матрас в магазине».

Вот результаты, которые я получаю:

ChatGPT

Грок

Вы можете видеть, что Грок понял, что я имел в виду, а ChatGPT подумал, что я говорю о «матрасе в коробке». Оцените Грока один балл.

Хотя это хорошее фотореалистичное изображение, на самом деле его нет ни на одном фотостоке. И давайте посмотрим правде в глаза: это так же скучно, однообразно и неоригинально, как и большинство «стоковых фотографий матрасов». 

Давайте изменим это.

Уточнение деталей в подсказке

Допустим, в своей статье вы сослались на историю «Принцесса на горошине». И вас осенило, что красивым изображением может быть принцесса, спящая на стопке матрасов. 

Введите этот запрос в свой чат-бот:

«Создайте изображение принцессы, спящей на стопке матрасов».

Вот что мне дал ChatGPT:

И что мне дал Грок:

Вы можете начать видеть разницу в том, как ChatGPT и Grok подходят к «искусству».

ChatGPT предпочитает иллюстрации, а Грок предпочитает фотореализм. Но вы, конечно, можете «попросить» попробовать нарисовать в любом стиле, который вам нравится.

Должен сказать, что эти изображения я получил не сразу от обоих ИИ. Фактически, первые изображения, которые я получил от обоих, совсем не соответствовали тому, что я хотел. Но я «общался» с чат-ботом так же, как с креативным директором.

Вот мой «разговор» с Гроком, чтобы прийти к этому окончательному изображению:

«Нарисуй мне стопку матрасов, на которых спящая принцесса».

«Они не похожи на матрасы, они больше похожи на одеяла. Можете ли вы нарисовать мне такой матрас, который можно найти в магазине?»

«Мне нужно, чтобы они были сложены вместе со спящей принцессой сверху».

«Больше матрасов!»

«Больше матрасов!»

«Нет-нет, нарисуйте мне хотя бы 10 матрасов, сложенных друг на друга, со спящей принцессой сверху».

«Это хорошо, но сделайте так, чтобы на всех матрасах был разный рисунок».

Это заняло некоторое время, но наконец я получил тот, которым остался доволен.

Обратите внимание: все, что мне нужно было сделать, это «поговорить» с Гроком, как если бы я это сделал с креативным директором. И в отличие от настоящего креативного директора, Грок не хотел выбрасывать меня в окно после седьмого раунда изменений.

Теперь найдите на любом фотостоке слова «принцесса на горошине» или «сложенные матрасы»; Скорее всего, вы не найдете ничего столь же хорошего, как вы видите здесь.

Девушка, которую вы видите спящей на матрасе? Ее не существует. Никакого разрешения модели не требуется, потому что на этой фотографии нет настоящего человека. 

Как вы понимаете, это меняет все. Вместо того, чтобы тратить тысячи долларов на фотосессию или 200 долларов на подписку на стоковые фотографии, я просто потратил 8 долларов и около 2 минут своего времени. 

Как вообще работает генерация ИИ? 

Представьте, что вы хотите научиться рисовать золотистого ретривера. Первым шагом будет изучение основных художественных приемов, таких как рисование основных форм, добавление текстуры и деталей, а также добавление теней и глубины.

Вам придется изучить множество фотографий золотистых ретриверов, чтобы понять их строение, форму и движения. И вам понадобится много практики и повторений, прежде чем ваш рисунок начнет выглядеть как настоящий.

По сути, это то же самое, что и модели ИИ, за исключением того, что в мире ИИ этот процесс носит такие названия, как «Генераторно-состязательные сети» и «Диффузионные модели».

Разница в том, что, хотя на обучение и практику у вас, вероятно, есть всего несколько часов в неделю, модели ИИ могут «обучаться и практиковаться» мгновенно и непрерывно.

Кроме того, у них есть доступ к миллиардам и миллиардам изображений для их обучения, в том числе изображениям, являющимся общественным достоянием, изображениям Creative Commons и данным изображений, лицензированным для них компаниями, занимающимися стоковыми фотографиями.

Копайте глубже: необходимые элементы визуальной оптимизации для поиска с помощью искусственного интеллекта

Анонсы наших новых статей в Телеграме

Read More

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Капча загружается...