一款自动语音识别模型...

斌叔OKmath
2024-11-01 19:35:51

一款自动语音识别模型：Moonshine，在10秒音频剪辑上，速度比Whisper快5倍，同时能保持与Whisper相同的准确性

支持可变长度的输入，它可以根据实际语音内容动态调整处理的数据量，不是像Whisper那样固定处理30秒的音频块

Moonshine的设计考虑了低延迟和高效率，非常适合在资源受限的设备上进行实时语音识别任务

github：网页链接