Кoмпaнія Meta прeдстaвилa нoву плaтфoрму штучнoгo інтeлeкту з нaзвoю Audiobox, якa дозволяє створювати персоналізовані голоси та звукові ефекти при помощи голосові команди.
Audiobox є вдосконаленою версією попередньої розробки Meta, відомої як Voicebox, і відрізняється вищою якістю звучання та розширеними можливостями. Новинка вміє приставки не- лише генерувати, але й редагувати аудіо, створюючи мовлення нате різних мовах, звукові ефекти та атмосферні звукові образи, такі як автомобільні гудки чи гуркіт грому.
Audiobox також включає в себя засоби контролю над процесом генерації на детальної настройки результату. З метою запобігання зловживанням в платформу була вбудована средство цифрових водяних знаків, що автоматично маркує кожне створене аудіо, щоб відстежити його походження.
Розробники стверджують, що швидкість генерації аудіо у Audiobox у 25 разів вища, ніж у попередніх моделях штучного інтелекту від Meta. Це досягнуто завдяки використанню персоналізованих алгоритмів обробки даних во (избежание кожного конкретного завдання.
Однак технологія поки що обмежується нестачею якісно промаркованих даних про навчання штучної інтелектуальної моделі. Розширення бази даних повинно покращити можливості Audiobox у подальшому.