IdxSubOcr是个很好的字幕识别软件,不过在Office 2007下面会只能识别简体文字,这对只有繁体字幕的情况会比较困难,何况繁体字幕比简体的识别率要高一些。在2003已经有解决方案:即再安装一套繁体Office中的识别套件或是将那几个文件弄过去,但在2007下照搬的话会出问题,何况下个繁体中文版也太大了。但也不是没有解决办法,具体如下:
下载CAJViewer最新版本,将C:\Program Files\Common Files\TTKN\Bin\OCR目录下的以下文件复制到C:\Program Files\Common Files\Microsoft Shared\MODI\12.0下:(2003是11)
TCCODE.UNI TCPRINT.DAT TCPRINT2.DAT TCSERHT.DAT TCTREE.DAT TW_BU.DAT TW_UB.DAT TWBIG532.DLL
复制完成后,用记事本创建一个reg文件,把下面内容粘贴后存盘:
Windows Registry Editor Version 5.00 [HKEY_CURRENT_USER\Software\Microsoft\Installer\Components\61BA386016BD0C340BBEAC273D84FD5F] "1028"=hex(7):28,00,26,00,48,00,42,00,56,00,6e,00,2d,00,7d,00,66,00,28,00,5a,\ 00,58,00,66,00,65,00,41,00,52,00,36,00,2e,00,6a,00,69,00,4f,00,43,00,52,00,\ 5f,00,31,00,30,00,32,00,38,00,3e,00,7d,00,60,00,45,00,4d,00,61,00,65,00,2c,\ 00,37,00,71,00,39,00,2a,00,44,00,58,00,64,00,55,00,40,00,45,00,50,00,69,00,\ 3d,00,00,00,00,00
双击此reg文件导入注册表后,在MODI的OCR选项卡里,“OCR语言”即可看到“中文(繁体)”。注意导入注册表时必须先关闭所有MODI窗口,导入后再打开。
至此,IdxSubOcr可以正常识别繁体字了。当然Office本身也具备了这种识别繁体字的能力。