Meta представила AudioCraft - генератор музики та звуків за текстовим описом

Нейросинтезатор для будь-яких завдань від простого шуму до складних мелодій.

Meta випустила новий інструмент із відкритим вихідним кодом під назвою AudioCraft. Він дозволяє користувачам створювати музику та звуки повністю за допомогою генеративного ШІ.

AudioCraft складається із трьох моделей, кожна з яких займається різними областями генерації звуку:

MusicGen дозволяє створювати мелодії за текстовими підказками. Вона була навчена «20 000 годин музики, що належить Meta* або ліцензованої спеціально для цієї мети».
AudioGen створює певні звуки з текстових підказок, імітуючи, наприклад, гавкіт собак чи кроки людини.
EnCodec дозволяє обробляти звуки, зменшуючи кількість артефактів.

Компанія дозволила представникам ЗМІ прослухати деякі зразки аудіозаписів, створених за допомогою AudioCraft. Генерований свист і шум сирен звучав досить природно, а от звучання гітарних струн все ж таки здавалося штучними, зазначили в The Verge.

Читайте також: Casio випустила лимітований G-Shock із сакурою та прихованим написом

Розробка Meta не єдина у своєму роді. Google раніше вже представила MusicLM, велику мовну модель, яка також генерує звуки на основі текстових підказок.

Звукозаписні лейбли та артисти такі інновації не оцінили. Багато хто з них уже висловився про небезпеку ШІ, оскільки деякі моделі можуть використовувати для навчання матеріали, захищені авторським правом.

AudioCraft на GitHub →