提取dvd光盘视频/iso视频里的字幕

avatar 2018年11月4日13:41:02提取dvd光盘视频/iso视频里的字幕已关闭评论 0 views

继上篇提取dvd光盘视频教程文章,如何提取DVD光盘视频/ISO视频里的字幕呢?这里小冷继续给大家完善教程,我也是不断地摸索最后整理出这样的教程。如果你有便捷高效的提取方法,欢迎小冷投稿。

本篇教程用到的工具软件是:VSRipSubtitle EditdVSRip是负责初次提取,Subtitle Editd负责二次提取和矫正。

提取dvd光盘视频/iso视频里的字幕

一、VSRip初次提取DVD光盘视频字幕

1、插入被提取的光盘或者加载ISO格式视频,在电脑系统里就会多出一个光盘盘符。

插入被提取的光盘或者加载ISO格式视频,在电脑系统里就会多出一个光盘盘符。

插入被提取的光盘或者加载ISO格式视频,在电脑系统里就会多出一个光盘盘符。

 

2、用VSRip加载DVD光盘文件里的字幕信息文件。你会看到有很多个后缀是.IFO文件,一般加载VTS_01_0.IFO这个。第一个VEDEO_TS.IFO不是,加载就会提示出错。不信你就试试。

用VSRip加载DVD光盘文件里的字幕信息文件。你会看到有很多个后缀是<code>.IFO</code>文件,一般加载<code>VTS_01_0.IFO</code>这个。第一个<code>VEDEO_TS.IFO</code>不是,加载就会提示出错。不信你就试试。

用VSRip加载DVD光盘文件里的字幕信息文件。你会看到有很多个后缀是.IFO文件,一般加载VTS_01_0.IFO这个。第一个VEDEO_TS.IFO不是,加载就会提示出错。不信你就试试。

3、选择字幕保存路径,只要保存的路径不是光盘盘符就行。我这里保存到桌面。之后Next>按钮就会出现,在你没选择保存路径之前,Next>按钮是灰色,表示不可操作。

选择字幕保存路径,只要保存的路径不是光盘盘符就行。我这里保存到桌面。之后<code>Next></code>按钮就会出现,在你没选择保存路上前,<code>Next></code>按钮是灰色,表示不可操作。

选择字幕保存路径,只要保存的路径不是光盘盘符就行。我这里保存到桌面。之后Next>按钮就会出现,在你没选择保存路上前,Next>按钮是灰色,表示不可操作。

4、紧跟上一步,出现下图,一般情况使用默认情况即可。但小冷提取的body beast这个健身操比较特殊,教练把两节课程放到一个光盘里,这就造成了有PGC 1PGC 2两个选项,它们包含的字幕是不同且不重复的。如果你想提取第二个视频里的,就选择PGC 2

紧跟上一步,出现下图,一般情况使用默认情况即可。但小冷提取的body beast这个健身操比较特殊,教练吧两节课程放到一个光盘里,这就造成了有【PGC 1】、【PGC 2】两个选项,它们包含的字幕是不同且不重复的。如果你提取第二个视频里的,就选择【PGC 2】

紧跟上一步,出现这图,一般情况使用默认情况即可。但小冷提取的body beast这个健身操比较特殊,教练吧两节课程放到一个光盘里,这就造成了有【PGC 1】、【PGC 2】两个选项,它们包含的字幕是不同且不重复的。如果你提取第二个视频里的,就选择【PGC 2】

5、等待软件自动处理

处理完成后保存路径的文件夹那就会多出两个文件,一个是存储的是时间轴,一个存储的是图片形式的字幕。两个文件缺一不可,都不能删。

二、Subtitle Editd二次提取图片式字幕

由于我们用VSRip提取的是时间轴和图片式文字分开的字幕,这就需要我们将图片里的文字转化为txt形式的可编辑的字幕。所以就需要Subtitle Editd这类软件来识别图片文字。既然是图片识别,那就有准确率的问题。伤心的是,目前没有那款软件识别率是100%,这就需要我们来校对文字。

1、用Subtitle Editd打开刚才提取的.sub后缀的字幕文件。

2、就会看到这么界面,小冷使用的是默认设置、默认词库。点击开始 OCR软件就会进行自动识别

就会看到这么界面,小冷使用的是默认设置、默认词库。点击开始 OCR软件就会进行自动识别

就会看到这么界面,小冷使用的是默认设置、默认词库。点击开始 OCR软件就会进行自动识别

 

3、重点来了,OCR识别单词时,有些词比如beachbody这个词没有在词库里出现,软件比较时就会提醒你是否需要修改。也有识别错的单个字符,软件会提醒你,你需要根据最上边黄色的字幕图像里的单词,自行修改成对的。如果没有错,就点击使用或者总是使用

重点来了,OCR识别单词时,有些词比如beachbody这个词没有在词库里出现,软件比较时就会提醒你是否需要修改。也有识别错的单个字符,软件会提醒你,你需要根据最上边黄色的字幕图像里的单词,自行修改成对的。如果没有错,就点击使用或者总是使用

重点来了,OCR识别单词时,有些词比如beachbody这个词没有在词库里出现,软件比较时就会提醒你是否需要修改。也有识别错的单个字符,软件会提醒你,你需要根据最上边黄色的字幕图像里的单词,自行修改成对的。如果没有错,就点击使用或者总是使用

 

4、OCR处理完之后,基本就可以保存为带时间轴的可编辑的.srt格式字幕。

OCR处理完之后,基本就可以保存为带时间轴的可编辑的.srt格式字幕。

OCR处理完之后,基本就可以保存为带时间轴的可编辑的.srt格式字幕。

最后就是把提取出来的英文字幕翻译成中文,然后通过Aegisub做特效处理。最后用小丸工具箱将字幕和视频压缩成一个视频。反正要做的事情挺多挺烦听耗费时间和精力的。

Subtitle Editd3.5.7最新的ORC词库识别率已经很高了。小冷之前使用的旧版的Subtitle Editd3.5.3耗费很多时间来校对错的单词。最近更新了一下软件和词库,和之前几行就修改一个单词相比,简直是舒服死星人了。

提取字幕真的是不难,但是烦,简单的事情重复做,枯燥无聊眼睛疼。把教程写出来,只为更多的有志翻译国外健身操的同学,有空搞搞玩玩。有懂的问题可以在微博评论提问,或者网站下面评论都可以。

avatar