一款自动语音识别模型...

  • 斌叔OKmath
  • 2024-11-01 19:35:51
一款自动语音识别模型:Moonshine,在10秒音频剪辑上,速度比Whisper快5倍,同时能保持与Whisper相同的准确性

支持可变长度的输入,它可以根据实际语音内容动态调整处理的数据量,不是像Whisper那样固定处理30秒的音频块

Moonshine的设计考虑了低延迟和高效率,非常适合在资源受限的设备上进行实时语音识别任务

github:网页链接
一款自动语音识别模型...