Ця безкоштовна модель ШІ може генерувати аудіо-зразки на основі текстових підказок

Ця безкоштовна модель ШІ може генерувати аудіо-зразки на основі текстових підказок

Тепер штучний інтелект може генерувати музичні семпли з текстових підказок за допомогою нейронних мереж. Це чудово підходить для створення композицій на основі наданих описів, таких як настрій або стиль. Ці моделі ШІ можна використовувати для створення саундтреків до відеоігор або просто для подолання творчої кризи, покладаючись на якісні дані та постійний розвиток ШІ. Інноваційна технологічна команда Samplab представила TextToSample, плагін для VST3 (Virtual Studio Technology), який дозволяє користувачам перетворювати текстові підказки на згенеровані аудіо-зразки. Інструмент, доступний безкоштовно, працює як самостійно, так і в складі DAW (Digital Audio Workstation), і може стати відповіддю на питання, як створити унікальну “мелодію” прямо з ваших думок. Уявіть собі можливості.

Плагін використовує багато ресурсів при створенні навіть кліпу середнього розміру

Спираючись на потенціал MusicGen з відкритим вихідним кодом від Meta, пакету для створення звуку на основі штучного інтелекту, TextToSample був розроблений з використанням даних, що надходять від цього передового алгоритму. Окрім обробки текстових інструкцій, плагін може приймати завантажені звуки, аналізувати їх і генерувати відповідні аудіо-зразки, а також обробляти текстові інструкції.

Читайте також:  Samsung шокував: Функції штучного інтелекту Galaxy безкоштовні лише до 2025 року

Маючи дуже мінімалістичний інтерфейс, TextToSample, однак, має деякі проблеми. Відповіді не завжди точні, і вам доводиться боротися з численними підказками, щоб потрапити туди, куди вам потрібно. Отже, досконалість може бути не миттєвою, але є шанс, що ви зможете її досягти.

Незважаючи на ці обмеження, TextToSample може бути дуже цікавим. Це чудовий приклад можливостей генеративного ШІ, особливо щодо створення музики у 2023 році, хоча він не позбавлений помилок. Деякі користувачі стикалися з небажаними доповненнями, такими як барабани, коли вони спеціально відмовлялися від перкусії. Особисто я використовував додаток, і він витратив величезну кількість ресурсів на створення 10-секундного аудіокліпу, який був у кращому випадку посередньої якості, а також сповільнював роботу мого комп’ютера в процесі роботи.

Читайте також:  Google відкрила ранній доступ до чатбота Bard