国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
如何用尚書七號(hào)OCR軟件做好文字識(shí)別工作

下面詳細(xì)介紹如何用尚書七號(hào)OCR軟件做好文字識(shí)別工作:

一、獲取圖像

有兩種方式獲取圖像,掃描圖像或打開計(jì)算機(jī)中已經(jīng)存在的圖像文件。本系統(tǒng)支持24位彩色、256級(jí)灰度和二值黑白圖像。

1.掃描圖像之前應(yīng)設(shè)置好保存掃描圖像文件的路徑、圖像文件名、圖像文件名后綴。設(shè)置圖像路徑,可以直接單擊“掃描到”按鈕,在瀏覽路徑窗口中選定存放圖像的文件夾。

2.單擊工具欄上的 按鈕或單擊“文件”菜單中的“掃描”命令,通過(guò)掃描儀開始批量掃描文件;單擊工具欄上的 按鈕(如果已經(jīng)掃描好的圖像文件,可以點(diǎn)擊 按鈕直接打開圖像),此時(shí)就會(huì)自動(dòng)調(diào)出默認(rèn)的掃描軟件,設(shè)置好參數(shù)(建議分辨率在300以上)后開始掃描。

二、圖像預(yù)處理

為提高識(shí)別率,對(duì)掃描后的圖像進(jìn)行圖像反白,自動(dòng)傾斜校正,調(diào)整邊框,去噪音(如麻點(diǎn)、下劃線等),表格畫線等處理。

在進(jìn)行“傾斜校正”時(shí),可按下工具欄的最下面的一個(gè)“圖像傾斜校正”工具按鈕。系統(tǒng)會(huì)自動(dòng)彈出一個(gè)對(duì)話框,提示需要校正的角度,此時(shí)按下“是”按鈕,系統(tǒng)就給予圖片做水平的傾斜校正。在此需要特別注意,“自動(dòng)傾斜校正功能”只能對(duì)原稿做±2.8度的傾角的校正,如果原稿的傾斜角度大于2.8度,系統(tǒng)會(huì)建議用戶重新掃描稿件,以提高識(shí)別率。

三、版面分析

1.自動(dòng)分析:?jiǎn)螕艄ぞ邫谥械?/font> 按鈕,或單擊“識(shí)別”菜單中的“版面分析”命令,自動(dòng)對(duì)圖像的版面布局、內(nèi)容進(jìn)行分析理解,切分圖像頁(yè),判別圖像框的版面屬性(橫欄、豎欄、表格、圖像),并以不同顏色的線框標(biāo)識(shí)圖像框?qū)傩?。?duì)分析錯(cuò)誤的版面可以手動(dòng)調(diào)整,方法為,先以鼠標(biāo)選中需要調(diào)整的版面塊,再調(diào)整版面塊的邊框改變大小,或單擊工具欄上的屬性按鈕(橫欄、豎欄、表格、圖像)改變?cè)摪婷鎵K屬性。

2.手動(dòng)分析:手動(dòng)分析時(shí),只要在圖像中的文字塊按照文章的先后,分別拖出選擇框,如下圖的文章,實(shí)際是分成兩個(gè)欄目進(jìn)行閱讀的,所以在設(shè)定識(shí)別區(qū)域的時(shí)候,注意需要將這個(gè)兩個(gè)欄目分別圈定,也就是設(shè)定兩個(gè)識(shí)別區(qū)域(如圖所示)。同時(shí),對(duì)于一些文字稿件,如果在中間插有圖片的時(shí)候,建議采用繞開的方式,對(duì)所環(huán)繞的文字分別進(jìn)行識(shí)別區(qū)域的設(shè)定。此外,對(duì)于表格類的圖片,為了將標(biāo)題欄也能識(shí)別進(jìn)去,建議將表格部分整個(gè)框選,同時(shí)標(biāo)題作為一個(gè)單獨(dú)的框選區(qū)域。

四、識(shí)別圖像

單擊 按鈕或單擊“識(shí)別”菜單中的“開始識(shí)別”命令,按照版面屬性(橫欄、豎欄、表格、圖像),自動(dòng)對(duì)圖像文件管理器選擇的圖像進(jìn)行批量識(shí)別,識(shí)別后的文字會(huì)顯示在窗口的上方。

五、文字校對(duì)

通過(guò)對(duì)比識(shí)別結(jié)果文本和原圖像,以發(fā)現(xiàn)識(shí)別錯(cuò)誤的文字??尚哦炔桓叩奈淖周浖?huì)用醒目的顏色標(biāo)出的,此時(shí)點(diǎn)擊這些文字,窗口中的圖像會(huì)自動(dòng)移動(dòng)至相應(yīng)位置,就可方便地進(jìn)行校對(duì),要修正時(shí),直接輸入正確的字就可以了。

六、文件存盤

單擊“輸出”菜單中的“到指定格式文件”命令,將識(shí)別并修改好的文本輸出、可以保存成可供計(jì)算機(jī)閱讀和查詢檢索的RTFHTML、XLS、TXT 格式的電子文檔。

建議用戶一般可選擇Text(純文本)格式保存,因?yàn)檫@種格式可以用幾乎所有文檔編輯器打開;如果用戶進(jìn)行表格識(shí)別,識(shí)別結(jié)果可以選擇保存為CSV格式,這樣用EXCEL就能夠直接打開;而HTML格式是針對(duì)網(wǎng)頁(yè)設(shè)計(jì)使用的,用IE等網(wǎng)絡(luò)瀏覽器或網(wǎng)頁(yè)編輯器可以打開。

七、一些使用技巧

1.如果用戶從光盤上復(fù)制圖像及數(shù)據(jù)進(jìn)行進(jìn)行處理,務(wù)必先將這些文件的只讀屬性去掉。

2.處理純英文文檔時(shí),識(shí)別語(yǔ)言選項(xiàng)設(shè)定為“簡(jiǎn)體”、“簡(jiǎn)繁”、“英文”都可以,但設(shè)定為“英文”識(shí)別效果最好;當(dāng)處理含有繁體字的文檔時(shí),語(yǔ)言選項(xiàng)應(yīng)設(shè)定為“簡(jiǎn)繁”。

3.如果表格結(jié)構(gòu)因?yàn)閿嗑€而識(shí)別錯(cuò)誤,可以先用工具按鈕中的畫筆在圖像上彌補(bǔ)斷線再重新版面分析。

4.識(shí)別效果不佳的主要原因

(1) 掃描設(shè)置不當(dāng),掃描圖像時(shí)的掃描分辨率(Resolution)一般應(yīng)設(shè)為300dpi,如果文檔字體較小則需要將掃描分辨率設(shè)定為更高值如400dpi600dpi??s放比例(Scaling)設(shè)為100%,亮度閥值(Threshold,Brightness)需根據(jù)紙張和印刷的質(zhì)量調(diào)節(jié),避免掃描圖像過(guò)黑或過(guò)淡。

(2) 如自動(dòng)版面分析有錯(cuò)誤,這時(shí)請(qǐng)用戶用鼠標(biāo)自己劃分出正確的版面塊;版面塊的版式設(shè)置錯(cuò)誤,如將橫版的設(shè)置為豎版,豎版的設(shè)置為橫版等,這時(shí)請(qǐng)用戶自行將塊的版式修改正確。

(3) 原稿印刷質(zhì)量太差,筆畫斷裂嚴(yán)重、油墨太濃、字與字之間粘連嚴(yán)重等也可能使識(shí)別率顯著降低。

(4) 識(shí)別語(yǔ)言選項(xiàng)選擇不當(dāng),應(yīng)根據(jù)原稿正確選擇“簡(jiǎn)體”、“簡(jiǎn)繁”或“英文”。

5.建議系統(tǒng)使用IE5.0以上版本,否則可能影響正確瀏覽聯(lián)機(jī)幫助文檔。

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
生活服務(wù)
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服