最近经常会遇到有高清外语片源却无中文字幕的尴尬,而往往能找到带有字幕的是RMVB等内嵌字幕的资源,视频清晰度通常较差。。。为了满足个人内心需求,只好动手自己折腾。
废话不多说,下面接下来简单讲下硬字幕(内嵌字幕)的提取。
PS: 这多少有点窃取的味道,嘻嘻。
由于硬字幕是和视频融合在一起的,实际上就已经不是以独立的文本储存的了,而是成为画面的一部分,就是一帧一帧的图片。而我们常见的SRT,SSA格式的字幕,都是以文本的形式存在的(一般用文本编辑器就能打开浏览)。。。。
这就是说,要提取硬字幕,需要先将字幕图片一帧一帧截取下来,然后转为文本文字(利用ORC)。目前还有没一步到位的工具,需要单步执行:
【准备工具】
esrXP - - - 硬字幕提取(就是提取为字幕图片,并保留时间索引)
CAJ浏览器 - - - OCR文字识别(将图片上的文字转化为文本)
SrtEdit - - - 字幕编辑工具
(下载链接见末尾)
【步骤】
1.使用esrXP提取图片字幕
esrXP的相关使用教程具体可以看一下两篇文章:
http://www.360doc.com/content/12/0911/23/2793098_235625294.shtmlhttp://www.360doc.com/content/12/0928/15/2793098_238638667.shtml1) 导入视频,调节过滤器(字幕—)过滤器) -- 这里需要多做尝试,以求最好效果
PS: 如果发现过滤效果十分恶劣,一般是由于字幕色彩与周边画面的对比度不够分明,可以尝试先使用工具调整视频的对比度/亮度/色彩等参数,让字幕与画面更分离(窝里视频转换可以进行这些调整)
2) 完毕后,关闭过滤器,点击“开始”生成初步图片字幕
3) 使用字幕管理,剔除无效字幕及合并相同字幕
4) 最终会得到这样的效果:右侧就是筛选好的字幕图片,左侧空白是待输入的对应文字
现在下一步是需要将图片上的文字转换为文本,
利用esrXP的ORC导出功能,导出BMP图片。。。再利用CAJ进行识别转换(需先转为PDA,可使用工具包中提供的Pic2Pdf)。。。具体看上面教程了
---- 对于本身视频色彩质量较差的视频源,你会发现识别的效果是非常恶劣的(对就是恶劣),毕竟机器的识别能力有限,遇到此情况,我目前的应对是,放弃机器ORC识别,直接人工肉眼识别,然后手敲(觉得费事不划算?那你去试试调整乱码满天飞的识别结果就不会有怨言了,呵呵)---
2. 将识别好的文字,对应地添加到ersXP上左侧编辑面板
你会看到右侧高亮的同步的,对应上就好了。对于两行或多行的字幕,不可直接回车换行,默认是切换到下一个匹配项的,可使用‘\N’(不带括号,大小写没关系,大写免去切换输入法直接大写锁定)符号代替,后期用SrtEdit编辑会自动识别过来的。
3.另存为SRT/SSA字幕,使用SrtEdit做最后加工
1)esrXP上直接另存为,选好格式(SRT/SSA)点保存即可,建议工程项目也保存好,以便日后不时之需;
2)用SrtEdit进行编辑,通常字幕用于同内容只是画质不同的视频时,不需要做过多调整,只要调整下整体延时。。。
各位这个高手了,我自觉对这些没啥感觉,我是直接拿原带字幕视频和高清视频挂字幕来同步播放看字幕同步调的。。。
调整好了就保存完事咯!
以上就是我使用的一些情况说明,希望大家也能自己动手,多分享些失传已久的资源哈~~
【工具打包下载】
以上文中提到的工具已经打包上传,方便各位提取:
http://dl.vmall.com/c0s0byus1a
粗略介绍,欢迎交流~~