OpenAI представила генерацію зображень у моделі GPT-4o з покращеною якістю тексту

Модель штучного інтелекту GPT-4o, яка була випущена рік тому, отримала нові функції, включаючи можливість генерувати зображення за текстовими інструкціями. Тепер користувачі можуть створювати детальні зображення, які можна коригувати до досягнення бажаного результату. Процес починається з запиту, після чого можна вносити уточнення, поки результат не стане ідеальним.

GPT-4o працює таким чином, що кожен крок дозволяє доповнювати або змінювати зображення відповідно до потреб користувача. OpenAI вибирала кращі зображення, серед яких були навіть такі, що отримали титул «найкращі з 2» або «найкращі з 8». Інтерфейс роботи з моделлю простий, а результати вражаючі.

GPT-4o здатна створювати зображення з нуля або змінювати вже існуючі. Наприклад, якщо користувач завантажує фото кота і хоче додати капелюх детектива та монокль, модель здатна уточнити кожен елемент і створити фінальну сцену, комбінуючи кілька зображень для кращого результату. Вона також успішно працює з 10–20 об’єктами на сцені без помилок, що важко дається іншим моделям.

Читайте також: Денна сонливість може свідчити про ризик деменції: нове дослідження

Хоча GPT-4o має багато переваг, вона не позбавлена недоліків. Іноді виникають проблеми з обрізкою зображень, галюцинаціями, а робота з понад 20 об’єктами стає складною. Також малювання тексту не на латиниці потребує додаткового коригування.

Джерело: itechua.com