大部分PDF文件可以用OCR識別,圖片不行
http://www.ccebbs.com/forum/dispq.asp?LID=28281
如何將caj格式轉(zhuǎn)化為word格式
caj文件的識別:
1)局部文字識別:直接使用caj瀏覽器的ocr
2)全文件識別:打印到Microsoft Office Document Image Writer打印機,選擇打印形成的文件的保存位置,然后會自動形成一個MDI文件,并且自動用Microsoft Office Document Image打開此文件,然后選擇“工具”菜單下的“使用ocr識別文本”,識別完成后,在選擇“工具”下的,“將文本發(fā)送到word”,最后將把整個PDF文件識別輸出到word文件中。
注意:Microsoft Office Document Image可以非常準(zhǔn)確的全文件識別轉(zhuǎn)化中文、英文、表格,但是無法將圖形輸出到word,而是把文件中的所有圖形單獨形成一個個獨立的圖片文件,放在相同位置的一個相同名稱的文件夾中,因此可用snagit軟件將圖形打開,然后復(fù)制到word中。(所有的識別軟件都不能很好的處理圖形的識別問題,Microsoft Office Document Image的這種處理方法已經(jīng)是非常好的解決這個問題了。)
3)博碩論文全文下載:在線閱讀博碩論文,待可以看到最后一頁后,不要關(guān)閉caj瀏覽器,到caj安裝目錄下cache中找到一個較大的文件,拷貝到其他位置即可。然后使用2)全部轉(zhuǎn)化為word。
二種方法:
先用CAJViewer打開caj文件,然后,然后請看以下:
在編輯菜單欄中包括【復(fù)制】、【復(fù)制位圖】、【查找】、【全部選擇】,可以方便地實現(xiàn)文本摘錄,摘錄結(jié)果可以方便的粘貼到WPS、WORD
等編輯器中進(jìn)行任意編輯,方便讀者摘錄和保存。
【操作】
1.在【瀏覽】菜單中點擊【鼠標(biāo)用于選擇后】(鼠標(biāo)變?yōu)?箭頭+T形狀),按方向鍵上下移動,可以滾動瀏覽屏幕。箭頭指向左上方時點擊開頭,指向右上方時點擊結(jié)尾,使其呈反色顯示,按工具欄的【復(fù)制】按鈕。
2. 打開word新建文檔進(jìn)行【粘貼】即可得到摘錄的文本。同時也可以編輯存盤。
【復(fù)制】:可以復(fù)制選定的文件或其中部分內(nèi)容。
【復(fù)制位圖】:系統(tǒng)默認(rèn)設(shè)置,鼠標(biāo)所在的位置出現(xiàn)一個十字,點住拖到選定位置 劃出一片區(qū)域,點復(fù)制,將選中區(qū)域內(nèi)容復(fù)制到剪貼板。
【查找】:在彈出的對話框里輸入要查找的文字,點擊【查找】進(jìn)行查找,按下【向前查找】或【向后查找】按紐, 可以翻到上一頁、下一頁查找。
【全部選擇】:將頁面的內(nèi)容全部選定。
本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請
點擊舉報。