超酷PDF轉(zhuǎn)換WORD工具 綠色中文特別版
http://down.orsoon.com/%D3%A6%D3%C3%C8%ED%BC%FE/%CE%C4%BC%FE%B4%A6%C0%ED/drg0508/SolidConverterPDF.rar 安裝的時(shí)候是英文,裝好就是中文了!
注冊方法:Name:任意
Email:zhou_S_@sohu.com
Organization: 任意
Unlock code: XGXT
注:郵箱與注冊碼是必須填寫正確,其余則是可以隨便填寫的。
注冊運(yùn)行后有網(wǎng)絡(luò)驗(yàn)證,把注冊表里的HKEY_CURRENT_USER\Software\SolidDocuments\SolidConverterPDF\HistoryList鍵值刪除即可。(或者用防火墻禁止訪問網(wǎng)絡(luò)?)
轉(zhuǎn)換好后,只需要調(diào)整一些格式即可,如字體和文字大小等。
CAJ格式轉(zhuǎn)換成WORD的方法
從不同格式的文件中提取文本前需要做好以下準(zhǔn)備工作,安裝CAJViewer5.5瀏覽器軟件和acrobat 5 專業(yè)版瀏覽器軟件安裝Office2003,并完全安裝Of?鄄fice工具M(jìn)icrosoft Office Document Imaging,然后在打印機(jī)里面會增加Microsoft Office Document Image Writer打印機(jī)。 Microsoft Office Document Image可以非常準(zhǔn)確的全文件識別轉(zhuǎn)化中文、英文、表格。
一、CAJ文件的識別
(一)首先,從網(wǎng)上下載CAJ格式的資料文件保存到本地硬盤上。
(二)然后,啟動CAJViewer瀏覽器程序,并在該程序中打開剛才保存的CAJ格式的文件。瀏覽文件到最后一頁后,不要關(guān)閉CAJ瀏覽器程序。
(三)在CAJ瀏覽器程序窗口中,選擇“文件”→“打印”,并選擇打印機(jī)為Microsoft Office Document Image Writer打印機(jī),勾選打印到文件選項(xiàng)和確定打印頁數(shù)。
(四)保存打印文件(*.prn)到適當(dāng)位置。等待打印完成后,Microsoft Office Document Image 自動打開剛才保存的打印文件。
(五)在Microsoft Office Document Image窗口中,選擇“頁面”菜單中的“選擇所有頁面”菜單項(xiàng),然后選擇“工具”菜單中的“使用OCR識別文本”提取文本。
(六)選擇“工具”下的 “將文本發(fā)送到word”,最后將把整個(gè)CAJ文件識別輸出到word文件中。
二、PDF文件的識別
(一)以文本形式保存的PDF文件,用acrobat 5 專業(yè)版,識別整個(gè)文件。直接打開從網(wǎng)上下載的PDF格式文件另存為RTF文件,或者選擇工具欄上的文字選擇按鈕,然后選擇文字區(qū)域,然后復(fù)制到Word中即可。
(二)以圖片形式保存的PDF文件,將PDF文件打印到Microsoft Office Document Image Writer打印機(jī),選擇打印形成的文件的保存位置,然后會自動形成一個(gè)MDI文件,并且自動用Microsoft Office Document Image打開此文件,然后在Microsoft Office Document Im?鄄age中選擇“工具”菜單中的“使用OCR識別文本”,識別完成后,在選擇“工具”下的,“將文本發(fā)送到word”,最后將把整個(gè)PDF文件識別輸出到word文件中。
(三)加密的PDF文件先下載解密軟件,解密后在參照上述步驟1),2) 進(jìn)行。
(四)繁體PDF文件用上述步驟2)的方法識別到word后,用word中的“工具”→“語言”→“中文繁簡轉(zhuǎn)換”
三、超星文件的識別
(一)全文件識別打印到Microsoft Office Document Image Writer打印機(jī),然后按上述PDF文件的識別步驟中第二點(diǎn)操作,要注意的是,超星打印功能有點(diǎn)區(qū)別,因?yàn)槌鞘悄夸浐腿姆珠_的,所以打印時(shí),需要分別把目錄和正文識別到Word中,再合并到一起。打印時(shí)要填入打印頁碼從1到最后一頁,不要選擇打印全部。在打印選項(xiàng)中,要將頁面比例設(shè)成真實(shí)大小,而不是整寬。注意識別速度比其他格式要慢很多,請保持耐心。一般一本200多頁的書,識別需要幾分鐘的時(shí)間。
(二)超星文件識別相對比較麻煩一些,如果還有問題,可以先把超星打印成完整的PDF文件,然后再用上述識別PDF文件的方法轉(zhuǎn)成Word。
四、后記
經(jīng)過試驗(yàn),發(fā)現(xiàn)Microsoft Office Document Image 存在一些不穩(wěn)定的問題,如在用CAJ打印到Microsoft Office Document Image Writer時(shí),發(fā)現(xiàn)用CAJ5.5版本比較快,而CAJ5.0有時(shí)出現(xiàn)假死機(jī)。頁面顯示大時(shí),轉(zhuǎn)化的識別率較高。如果頁數(shù)多的文件,包括超星,可以分多次轉(zhuǎn)化。
由于虛擬打印到Microsoft Office Document Image Writer 比較慢,并且形成的虛擬文件很大,1本200多頁的書大約是60M,因此會嚴(yán)重影響機(jī)器的運(yùn)行速度、C盤和內(nèi)存空間。建議配置好的機(jī)器一次轉(zhuǎn)化不要超過 200頁,配置差的不要超過100頁,同時(shí)打印時(shí)在任務(wù)欄中會出現(xiàn)打印機(jī)圖標(biāo),可以雙擊,看到打印任務(wù)的進(jìn)度,避免誤以為死機(jī)。轉(zhuǎn)化完成后請刪除c:\ windows\temp目錄下的虛擬打印文件,否則C盤很快會被用光。