Компанія Sesame, відомий розробник штучного інтелекту, презентувала свою базову модель CSM-1B, що забезпечує роботу голосового асистента Maya. З близько 1 мільярдом параметрів вона діє під ліцензією Apache 2.0, дозволяючи її комерційне застосування з мінімальними обмеженнями.
Ця модель генерує аудіокоди RVQ з текстових і звукових входів, використовуючи залишкове векторне квантування. CSM-1B поєднує можливості моделі Llama від Meta із звуковим декодером, що робить її відкритою для різних аудіотехнологій, як-от SoundStream від Google та Encodec від Meta.
Незважаючи на свій потенціал, CSM-1B не гарантує належного функціонування з неанглійськими мовами та не має визначеності щодо даних, використовуваних для навчання.
Компанія Sesame наголошує на етичному використанні моделі, застерігаючи від імітацій людського голосу без згоди та виробництва оманливого контенту. Власні експерименти показали, що модель здатна швидко створити клон голосу та генерувати промови на суперечливі теми.
Відомо, що Sesame отримала інвестиції від таких компаній, як Andreessen Horowitz, Spark Capital та Matrix Partners, що підкреслює інтерес до її розробок, серед яких окуляри зі штучним інтелектом для тривалого носіння.
Україна заперечує оточення своїх військових у Курську, спростовуючи заяви Дональда Трампа.Україна стверджує, що її війська…
Станція «Туапсе» зустріла пасажирів потягу видовищною пожежею на нафтосховищіПасажири потягу російської залізниці («РЖД»), прибувши на…
Українська артилерія успішно знищила точку спостереження ворога в ТорецькуБлизько сорока хвилин тому українська артилерійська система…
Віталій Пляка: від офіцера до національного Героя У Києві презентовано книгу-буклет, присвячену Герою України Віталію…
Чи можливо, що наш Всесвіт знаходиться в межах чорної діри?Останні дослідження, проведені на основі зображень,…
Служба безпеки та поліція швидко виявили й затримали підозрюваного у справі резонансного вбивства одеського активіста.Служба…