AI 确确实实在改变我,让我自己的能力范围在扩大了,可以自行发现需求——产生方案——验证方案——解决需求,这个感觉还蛮棒的。
产生这个想法是因为:
2023.08.01 这个时间点,我看到微博 PG 的一个博主发了 PG 播客的生肉视频。我的英语水平,有字幕都看不懂何况没有 = =
最终的解决方案,逻辑其实也很简单:
1、用 whisper 生成原视频的英文字幕;(我预设 whisper 生成的字幕没问题,whisper 的问题不探讨)
2、让 GPT 结合字幕全文翻译,并让他根据原英文字幕的拆分,将译文进行同样行数的拆分;
3、将 GPT 译文拆分的结果插入到原英文字幕文件中形成一个新的双语字幕文件;
4、用FFmpeg处理音视频和字幕。
这个过程中所有的执行脚本都是让 GPT 写的。GPT 的 prompt 在最后。
08.04 更新这一节是失败的经历,可以跳过。
放一下最终的字幕文件:
08.01 产生想法之后,就经历了下面的过程(过去两天太兴奋了,但想法暂时都还没成功,恰好停一停记录一下):
1、识别音视频中的语言并生成字幕文件: