Sesame презентувала нову ШІ-модель з голосовим асистентом
Компанія Sesame, відомий розробник штучного інтелекту, презентувала свою базову модель CSM-1B, що забезпечує роботу голосового асистента Maya. З близько 1 мільярдом параметрів вона діє під ліцензією Apache 2.0, дозволяючи її комерційне застосування з мінімальними обмеженнями.
Особливості та можливості CSM-1B
Ця модель генерує аудіокоди RVQ з текстових і звукових входів, використовуючи залишкове векторне квантування. CSM-1B поєднує можливості моделі Llama від Meta із звуковим декодером, що робить її відкритою для різних аудіотехнологій, як-от SoundStream від Google та Encodec від Meta.
Незважаючи на свій потенціал, CSM-1B не гарантує належного функціонування з неанглійськими мовами та не має визначеності щодо даних, використовуваних для навчання.
Попередження щодо використання
Компанія Sesame наголошує на етичному використанні моделі, застерігаючи від імітацій людського голосу без згоди та виробництва оманливого контенту. Власні експерименти показали, що модель здатна швидко створити клон голосу та генерувати промови на суперечливі теми.
Відомо, що Sesame отримала інвестиції від таких компаній, як Andreessen Horowitz, Spark Capital та Matrix Partners, що підкреслює інтерес до її розробок, серед яких окуляри зі штучним інтелектом для тривалого носіння.