Як користуватися нейромережею DALL-E 2, яка генерує зображення

Як користуватися нейромережею DALL-E 2, яка генерує зображення

Розбираємось, у чому плюси та мінуси системи та що вказувати у запитах.

Що таке DALL-E

Що таке DALL-E

DALL-E – це нейромережа від компанії OpenAI, яка генерує картинки за текстовими запитами, а також вміє створювати варіації зображень, орієнтуючись на запропоновані користувачем приклади.

Інструмент розроблений на основі моделі GPT-3 , яка була додатково навчена створювати графічно людей, тварин, а також велику кількість інших предметів. Ще сервіс здатний поєднувати не пов’язані між собою концепції на формування нових ідей.

Першу версію, DALL-E, випустили в 2021 році, а через рік розробники представили покращений варіант – DALL-E 2, який підтримує більш високу якість зображень і розширені можливості перетворення готових картинок.

Система визначає запити на сотні мов. Але основною мовою для ефективних команд є англійська. Спочатку нейромережа розпізнає введений користувачем текст і генерує по ньому простий малюнок. Далі перетворює його на фінальний варіант невеликого дозволу і потім масштабує, додаючи деталі.

Що вміє нейромережа DALL-E 2

Що вміє нейромережа DALL-E 2

Як уже згадали вище, модель від OpenAI може не тільки генерувати картинки на запит, але й створювати проєкти, змішуючи різні концепції. Нейромережа поєднує два кадри і формує з них ще один.

Читайте також:  Meta представила AudioCraft - генератор музики та звуків за текстовим описом

За допомогою функції Outpainting можна малювати фон зображення. Цікаво доповнювати готові картини чи фотографії, розвиваючи нові сюжети. Також є можливість змінювати композицію, редагувати тіні та текстуру картинки, додавати та видаляти об’єкти у кадрі.

Нейросітка DALL-E 2 дозволяє працювати із завантаженими файлами

Однією з можливостей DALL-E 2 є робота із завантаженими файлами. За допомогою зручного мінімалістичного інтерфейсу легко додавати елементи на фотографії, генерувати фантастичні краєвиди чи підвищувати деталізацію картинок.

У чому недоліки DALL-E 2

Нейросітка часто помиляється при генерації зображень

На цей момент DALL-E 2 не можна назвати ідеальним інструментом. Для отримання хороших результатів потрібно експериментувати, пробувати різні запити та підправляти параметри. Нейромережа періодично видає кумедні або навіть жахливі кадри з спотворенням об’єктів і неправильним розташуванням елементів.

Система особливо часто помиляється, якщо давати їй довгі запити та вказувати надто багато специфічних деталей. Вона не дуже добре визначає професійні терміни, а також збивається, якщо використовувати заперечення чи винятки замість прямих вказівок на те, що має бути у кадрі.

Як користуватись DALL‑E 2

Як користуватись DALL-E 2

Почати користуватися системою можна на сайті OpenAI, у розділі DALL·E 2 , натиснувши кнопку Try DALL‑E 2. Якщо у вас ще немає облікового запису на сайті, його можна отримати через адресу електронної пошти або існуючі профілі Google або Microsoft.

Читайте також:  ШІ знайшов найпотужнішу молекулу проти старіння

Після авторизації у вас має бути 35 безкоштовних кредитів для створення зображень на місяць. Кожного наступного місяця дається по 15 спроб. Поповнити баланс у власному кабінеті можна кнопкою Buy credits. Мінімум доведеться заплатити 15 доларів за 115 запитів. 

Є кілька варіантів вирішення проблеми: попросити друга з відповідним доступом до платіжної системи внести кошти на рахунок або надати на час обліковий запис, знайти та купити готовий профіль OpenAI через торгові онлайн-майданчики або використовувати інші сервіси на базі DALL-E.

Найзручніша альтернатива – Microsoft Image generator . Цей інструмент працює на алгоритмах DALL-E 2 і видає майже такі ж результати безкоштовно. Але в ньому немає режиму редагування картинок, добудовування кадру та інших корисних фішок. Аналог можна використовувати тільки для генерування зображень, а потім підправляти результат іншими програмами . Для використання потрібно обліковий запис Microsoft і VPN.

Microsoft Image generator

Робити запит для генерації як на сайті DALL-E 2, так і в Image generator краще англійською мовою. Кнопка Surprise me («Здивуйте мене»), що знаходиться поруч із рядком введення, автоматично видасть незвичайний запит для тестування нейромережі.

Читайте також:  Vivo X200 Pro може отримати повільнішу дротову зарядку порівняно з попередниками

Щоб отримати якісний результат, використовуйте запити, які чітко описуватимуть бажаний кадр, але без зайвих деталей. У рядку введення слід вписати тип зображення. Це може бути портрет, картинка аквареллю, олівцевий малюнок тощо.

Також вкажіть варіант освітлення у кадрі та стиль. Допустимо, реалістичне відображення, як у коміксі чи конкретну манеру відомого художника. Доповнити це бажано зразковим рівнем яскравості.

Як користуватись DALL-E 2

Наприкінці рядка можна дописати контекст того, що відбувається. Наприклад, що кадр містить не тільки місяцехід, а й момент, як той рухається на тлі Землі. Або сцену, на якій плюшеві зайці борються з інопланетянами.

Запит не обов’язково повинен включати всі пункти, результат все одно може бути цікавим, але відсоток успіху буде помітно нижче. Скласти вдалу команду допоможуть спеціалізовані інструменти , наприклад Promptomania.