这几天听播客,有时候就觉得有个字...

  • 宝玉xp
  • 2023-03-27 05:33:30
这几天听播客,有时候就觉得有个字幕会好很多,但是PodCast都不提供字幕的,想起乃木坂46字幕组用AI翻译字幕 网页链接 ,虽然我不懂Python,但是借助GPT-4应该不难,昨晚写了个POC(Proof of Concept)能跑,今天又整理了一下,基本上可以用了。

原理很简单:
1. 解析音频地址:输入苹果的PodCast Url,解析HTML,找到里面扩展名是MP3或者M4A的URL
2. 下载音频到本地
3. 安装Whisper ( github.com/openai/whisper )下载数据模型
4. 生成字幕

需要借助Google Colab colab.research.google.com ,按照上面的步骤执行,输入你要下载的PodCast Url,目前只支持MP3和M4A格式的音频。

项目地址:github.com/JimLiu/whisper-podcast-subtitles

Whisper生成字幕部分的代码大量参考(复制粘贴)了whisper-youtube github.com/ArthurFDLR/whisper-youtube 和 N46Whisper github.com/Ayanaminn/N46Whisper
这几天听播客,有时候就觉得有个字...这几天听播客,有时候就觉得有个字...这几天听播客,有时候就觉得有个字...这几天听播客,有时候就觉得有个字...这几天听播客,有时候就觉得有个字...这几天听播客,有时候就觉得有个字...这几天听播客,有时候就觉得有个字...这几天听播客,有时候就觉得有个字...这几天听播客,有时候就觉得有个字...