使用Microsoft Office Document Image Writer虛擬打印機(jī)
1、前提需要完全安裝Office2003-Office工具-Microsoft Office Document Imaging!一般默認(rèn)的office安裝沒有OCR識別文本功能!
完全安裝方法:在添加刪除程序里,選擇office2003,點(diǎn)擊更改,出現(xiàn)了office2003安裝修改界面,選擇-更改刪除-下一步-高級選項(xiàng)-office工具里找到Microsoft Office Document Imaging選擇從本機(jī)安裝(默認(rèn)的是“第一次使用時(shí)安裝”)-一路下去就ok了。接下來就可以體驗(yàn)office的文字識別功能了。
2、以最麻煩的超星文件為例。(建議安裝ssreader3.8版本,因?yàn)?.9版對虛擬打印有限制)
在3.8版本中使用虛擬打也需要一點(diǎn)前期工作,點(diǎn)擊控制面板-打印機(jī),列表中看到Microsoft Office Document Image Writer,重命名(避免一些writer等字眼,防止超星的禁止功能),命名數(shù)字即可,比如2。
打開下載的超星文件,由于超星對書目錄和正文分別記錄頁數(shù),所以,如果要全部轉(zhuǎn)化,需要自己算一下頁數(shù)(目錄+正文最后頁碼既可)。然后選到開始打印的頁面,選擇:圖書-打印-從當(dāng)前頁開始打?。蛴№摂?shù)(自己計(jì)算的頁數(shù))-確定-選擇打印機(jī)中選擇剛才改名的 2 打印機(jī)-打印,然后彈出對話框選擇打印文件(.mdi)名字和存放路徑。保存完畢后mdi文件會(huì)被Microsoft Office Document Imaging程序自動(dòng)打開。
3、在Microsoft Office Document Imaging打開文件中選擇:工具-使用OCR識別文本。注意,如果一次打印的超星頁數(shù)較多,ocr識別會(huì)花較長時(shí)間。以我的為例(670頁,機(jī)器賽揚(yáng)D2.66G,512M內(nèi)存,耗時(shí)20分鐘左右;一般十幾頁也就幾十秒)。等待OCR識別完畢,選擇:工具-將文本發(fā)送到word-保存!大功告成!
其他:如果時(shí)pdf或caj文件,打開文件后直接選擇:打印-打印頁數(shù)。。。等等同2、3步驟,就是如此簡單。
后話:可能有人會(huì)懷疑office文字識別的準(zhǔn)確率,經(jīng)PDF文件轉(zhuǎn)換驗(yàn)證,比用PDF Converter等轉(zhuǎn)word工具還要準(zhǔn)確,而且不用注冊,沒有垃圾信息。再說了,微軟,大品牌,值得信賴:)
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請
點(diǎn)擊舉報(bào)。