Розбираємось, у чому плюси та мінуси системи та що вказувати у запитах.
Що таке DALL-E
DALL-E – це нейромережа від компанії OpenAI, яка генерує картинки за текстовими запитами, а також вміє створювати варіації зображень, орієнтуючись на запропоновані користувачем приклади.
Інструмент розроблений на основі моделі GPT-3 , яка була додатково навчена створювати графічно людей, тварин, а також велику кількість інших предметів. Ще сервіс здатний поєднувати не пов’язані між собою концепції на формування нових ідей.
Першу версію, DALL-E, випустили в 2021 році, а через рік розробники представили покращений варіант – DALL-E 2, який підтримує більш високу якість зображень і розширені можливості перетворення готових картинок.
Система визначає запити на сотні мов. Але основною мовою для ефективних команд є англійська. Спочатку нейромережа розпізнає введений користувачем текст і генерує по ньому простий малюнок. Далі перетворює його на фінальний варіант невеликого дозволу і потім масштабує, додаючи деталі.
Що вміє нейромережа DALL-E 2
Як уже згадали вище, модель від OpenAI може не тільки генерувати картинки на запит, але й створювати проєкти, змішуючи різні концепції. Нейромережа поєднує два кадри і формує з них ще один.
За допомогою функції Outpainting можна малювати фон зображення. Цікаво доповнювати готові картини чи фотографії, розвиваючи нові сюжети. Також є можливість змінювати композицію, редагувати тіні та текстуру картинки, додавати та видаляти об’єкти у кадрі.
Однією з можливостей DALL-E 2 є робота із завантаженими файлами. За допомогою зручного мінімалістичного інтерфейсу легко додавати елементи на фотографії, генерувати фантастичні краєвиди чи підвищувати деталізацію картинок.
У чому недоліки DALL-E 2
На цей момент DALL-E 2 не можна назвати ідеальним інструментом. Для отримання хороших результатів потрібно експериментувати, пробувати різні запити та підправляти параметри. Нейромережа періодично видає кумедні або навіть жахливі кадри з спотворенням об’єктів і неправильним розташуванням елементів.
Система особливо часто помиляється, якщо давати їй довгі запити та вказувати надто багато специфічних деталей. Вона не дуже добре визначає професійні терміни, а також збивається, якщо використовувати заперечення чи винятки замість прямих вказівок на те, що має бути у кадрі.
Як користуватись DALL‑E 2
Почати користуватися системою можна на сайті OpenAI, у розділі DALL·E 2 , натиснувши кнопку Try DALL‑E 2. Якщо у вас ще немає облікового запису на сайті, його можна отримати через адресу електронної пошти або існуючі профілі Google або Microsoft.
Після авторизації у вас має бути 35 безкоштовних кредитів для створення зображень на місяць. Кожного наступного місяця дається по 15 спроб. Поповнити баланс у власному кабінеті можна кнопкою Buy credits. Мінімум доведеться заплатити 15 доларів за 115 запитів.
Є кілька варіантів вирішення проблеми: попросити друга з відповідним доступом до платіжної системи внести кошти на рахунок або надати на час обліковий запис, знайти та купити готовий профіль OpenAI через торгові онлайн-майданчики або використовувати інші сервіси на базі DALL-E.
Найзручніша альтернатива – Microsoft Image generator . Цей інструмент працює на алгоритмах DALL-E 2 і видає майже такі ж результати безкоштовно. Але в ньому немає режиму редагування картинок, добудовування кадру та інших корисних фішок. Аналог можна використовувати тільки для генерування зображень, а потім підправляти результат іншими програмами . Для використання потрібно обліковий запис Microsoft і VPN.
Робити запит для генерації як на сайті DALL-E 2, так і в Image generator краще англійською мовою. Кнопка Surprise me («Здивуйте мене»), що знаходиться поруч із рядком введення, автоматично видасть незвичайний запит для тестування нейромережі.
Щоб отримати якісний результат, використовуйте запити, які чітко описуватимуть бажаний кадр, але без зайвих деталей. У рядку введення слід вписати тип зображення. Це може бути портрет, картинка аквареллю, олівцевий малюнок тощо.
Також вкажіть варіант освітлення у кадрі та стиль. Допустимо, реалістичне відображення, як у коміксі чи конкретну манеру відомого художника. Доповнити це бажано зразковим рівнем яскравості.
Наприкінці рядка можна дописати контекст того, що відбувається. Наприклад, що кадр містить не тільки місяцехід, а й момент, як той рухається на тлі Землі. Або сцену, на якій плюшеві зайці борються з інопланетянами.
Запит не обов’язково повинен включати всі пункти, результат все одно може бути цікавим, але відсоток успіху буде помітно нижче. Скласти вдалу команду допоможуть спеціалізовані інструменти , наприклад Promptomania.