Meta? спроектировала аудиокодек EnCodec на ИИ — стискивает в 10 раз мощнее, чем MP3 при том же качестве

Организация Meta? продемонстрировала свежий голосовой плеер EnCodec, который применяет способы автомобильного учебы для увеличения стадии сжатия без утраты качества — в итоге он способен стискивать аудио в 10 раз мощнее, чем MP3 при том же качестве. Про это рассказывает издание Ars Technica.


 Ресурс фотографий: *** AI

Ресурс фотографий: Meta? AI

Плеер EnCodec может использоваться как для потоковой передачи звука в режиме настоящего времени, к примеру, при телефонных звонках в участках неустойчивой связи, так и при кодировке для следующего сбережения в документах.

Создатели рассказали, что система сжатия EnCodec состоит из трёх элементов. Вначале кодировщик конвертирует несжатые данные в особый формат с не менее невысоким битрейтом. После этого приобретенный формат сдавливается до нужного объема, а сохраняется значительная информация, которая будет применена для восстановления отправного знака. В итоге дешифратор в режиме настоящего времени конвертирует стиснутые данные назад в голосовые волны при помощи нейронной сети.


В компании выделяют, что нейросеть правильно стискивает звук и разница между звуков до и после сжатия не будет оцениваться нашим слухом. Нейросети для сжатия звука применяются достаточно давно, но Meta? первой использовала технологию к стереозвуку при 48 кГц.

Система EnCodec как и прежде располагается в стадии подготовки и испытания. Создатели не рассказывают о сроках её внедрения в собственные сервисы и помощи иными фирмами.

Вы можете оставить комментарий, или ссылку на Ваш сайт.

Оставить комментарий