把sub字幕转换成srt或ass格式,最简单的办法就是用Subtitle Edit这款软件。你只需要把sub文件丢进去,通过它自带的OCR文字识别功能,把图片里的文字抠出来,最后直接另存为srt或ass格式就可以了。虽然这个过程涉及到一个文字识别的步骤,可能会花几分钟时间,但这是目前最稳妥、准确率最高的方法。
很多人在网上下载电影或者美剧的时候,经常会发现配套的字幕文件后缀是sub。这种字幕其实挺让人头疼的,因为它和我们常见的srt字幕不一样。srt字幕是纯文本,你可以用记事本打开随便改,但sub字幕本质上是一堆图片,它是把字幕内容像照片一样一张张叠在视频画面上的。这就导致你没法直接修改它的字体大小、颜色,甚至很多手机播放器或者电视盒子根本就认不出这种格式。要把这种图片字幕变成我们想要的文字字幕,就必须用到OCR技术,也就是光学字符识别。
Subtitle Edit就是处理这种问题的神器,它是免费开源的,功能非常强大。首先,你需要去它的官网或者找个靠谱的下载站把它装好。打开软件后,你会看到一个挺复杂的界面,别被那些密密麻麻的按钮吓到,我们只需要用到最核心的功能。
第一步,把你的sub字幕文件直接拖进软件窗口。这里有个细节要注意,sub字幕通常会跟着一个同名的idx文件,这两个文件是亲兄弟,缺一不可。sub文件里存的是图片,idx文件里存的是每一行字幕出现的时间点。只要这两个文件放在同一个文件夹里,你拖入sub文件的时候,软件就会自动关联上时间轴。
拖进去之后,软件会发现这是图片字幕,自动弹出一个OCR窗口。在这个窗口里,最关键的操作是选择语言。如果你的字幕是中文的,你得在语言下拉菜单里选中文。第一次使用时,软件可能没有内置中文识别库,它会提示你下载,你按照提示点一下下载安装就行,很快就能搞定。
选好语言后,点击右下角的开始OCR按钮。这时候你会看到软件开始飞快地扫描每一张字幕图片,并把它们转成文字。现在的识别技术已经很厉害了,尤其是Subtitle Edit集成了Tesseract这种顶尖的识别引擎,大部分汉字都能认得准。不过,偶尔遇到一些生僻字或者排版比较奇葩的字幕,软件可能会犹豫,这时候它会弹出一个小框问你:这个字到底是什么?你只需要在键盘上敲入正确的字,点一下确认,它就会继续往下跑。
等进度条走完,所有的图片就都变成了文字。在正式保存之前,我建议你简单检查一下。软件会把一些它觉得可能有问题的词用红色或者黄色标出来,你扫一眼,把明显的错别字改掉。
最后一步就是保存了。点击左上角的文件菜单,选择另存为。在保存类型的下拉框里,如果你追求兼容性,想在任何地方都能看,那就选SubRip,也就是后缀为srt的格式。如果你是个完美主义者,想以后自己给字幕调个好看的字体、加个边框或者改个位置,那就选Advanced Substation Alpha,也就是ass格式。选好之后点保存,你就得到了一个体积又小、兼容性又好的文字字幕文件。
其实整个操作过程非常顺手,熟练之后也就一两分钟的事。以后再遇到那种死活调不动字体大小的sub字幕,别急着去网上到处找替代资源,自己动手转一下,看电影的心情都会变好很多。这种方法不光能对付中文,日文、英文或者其他小语种的sub字幕也都能用同样的操作搞定,只要下好对应的语言识别包就行。