DjVuToy: A handy toolkit to merge, split and analyze DjVu files.
作者:馬健
郵箱:stronghorse@tom.com
主頁:老馬的原創(chuàng)空間
FAQ
使用說明
一、軟件安裝/刪除
二、軟件使用
文件合并
文件拆分
頁面調(diào)整
生成索引
DjVu制作
PDG轉(zhuǎn)換
PDG壓縮
書簽相關(guān)
頁面寬度
轉(zhuǎn)為圖像
文本相關(guān)
轉(zhuǎn)PDF
文件結(jié)構(gòu)
三、操作示范
附錄A 鳴謝
附錄B 版本更新記錄
FAQ
Q:DjVuToy是什么?
A:這是一個(gè)處理DjVu的工具集,具有下列功能:
文件合并:將散頁DjVu文件合并成一個(gè)多頁DjVu。支持指向外部文件的共享數(shù)據(jù)段。
文件拆分:將多頁DjVu拆分成每頁一個(gè)文件,并可指定是否拆分共享數(shù)據(jù)段、是否生成索引。
頁面調(diào)整:插入、刪除、移動(dòng)、旋轉(zhuǎn)多頁DjVu中的頁面。
生成索引:為文件夾下的散頁DjVu文件生成索引文件,打開索引文件即可瀏覽全部散頁文件,就像將散頁文件合并成了多頁文件一樣。但是與多頁文件不同,索引文件不能掛書簽。
DjVu制作:圖像文件轉(zhuǎn)DjVu,支持PDG、BMP、GIF、PNG、TIFF、JPEG、JPEG 2000。
PDG轉(zhuǎn)DjVu:這個(gè)不用說了吧?
PDG壓縮:對(duì)清晰版進(jìn)行無損壓縮,或?qū)⑶逦鎵嚎s成快速版,或?qū)⒑诎譚IFF轉(zhuǎn)換成PDG。
DjVu書簽處理:包括導(dǎo)出書簽、加掛書簽(支持多級(jí)書簽)、將中美百萬的a.opf、catalog.xml轉(zhuǎn)換成FreePic2Pdf接口文件。
DjVu頁寬設(shè)置:將多頁DjVu的頁面寬度或DPI設(shè)置為一個(gè)統(tǒng)一值。
轉(zhuǎn)為圖像:將多頁DjVu的每一頁轉(zhuǎn)換成一個(gè)圖像。
DjVu文本處理:包括OCR(生成可檢索的隱藏文本)、導(dǎo)出純文本、導(dǎo)出XML文本、導(dǎo)入XML文本、刪除文本。
DjVu轉(zhuǎn)PDF:一次將整本DjVu轉(zhuǎn)換成PDF,并可選擇是否轉(zhuǎn)換書簽(目錄)。
查看DjVu文件結(jié)構(gòu):如果打算對(duì)DjVu文件內(nèi)部格式進(jìn)行研究,這個(gè)功能那是相當(dāng)?shù)赜杏?,不然還是點(diǎn)“顯示設(shè)置”按鈕,把它藏起來算了。
Q:為什么要開發(fā)DjVuToy?
A:現(xiàn)在網(wǎng)絡(luò)上DjVu格式的電子書開始多起來,但是討論DjVu的專業(yè)文章并不多。為了深入了解DjVu文件的各個(gè)方面,我就開發(fā)了這個(gè)軟件。因?yàn)槟康牟皇呛車?yán)肅,所以軟件的名字也不是很嚴(yán)肅,不過我終于還是很嚴(yán)肅地為它挑選、修改了個(gè)一看就是toy的圖標(biāo)。
Q:DjVuToy收費(fèi)嗎?
A:DjVuToy是一個(gè)“友情軟件”(Friendware),用戶在承諾不用于商業(yè)目的,也不對(duì)文件及其附件進(jìn)行任何更改的條件下,不需要為使用該軟件付任何費(fèi)用,最多是在BBS上看到我發(fā)帖子灌水時(shí)(我的ID一般是strnghrs),進(jìn)去捧個(gè)人場,作為友情回報(bào);或者在年節(jié)時(shí)發(fā)個(gè)email問聲好(所以叫“友情軟件”)。我承諾絕不在程序中暗藏任何商業(yè)廣告、木馬,但不承諾為使用DjVuToy的后果承擔(dān)任何責(zé)任。如果您需要將它用于商業(yè)目的,或加入您的網(wǎng)站,請(qǐng)與我聯(lián)系,否則保留追究一切責(zé)任的權(quán)利。
Q:DjVuToy在將DjVu文件合并、切分、刪除、旋轉(zhuǎn)頁面,或改變頁面順序、改變頁面寬度時(shí),會(huì)造成圖像質(zhì)量下降嗎?
A:不會(huì),圖像數(shù)據(jù)流保持不變。
Q:FreePic2Pdf接口文件有什么作用?
A:接口文件是從Pdg2Pic和FreePic2Pdf借用過來的,對(duì)多級(jí)書簽進(jìn)行描述。接口文件的詳細(xì)格式說明和示例見FreePic2Pdf使用說明。 對(duì)書簽文件進(jìn)行編輯推薦使用PdgCntEditor。
Q:有些PDG文件轉(zhuǎn)換不出來,怎么辦?
A:詳見Pdg2Pic的使用說明。
Q:為什么在合并文件時(shí),如果選擇了“合并過程中花時(shí)間檢查壞頁”,DjVu會(huì)報(bào)告某些文件損壞,但是單獨(dú)用WinDjView看每頁都能正常顯示?
A:這種情況通常是下載的時(shí)候,散頁文件末尾被添加了垃圾數(shù)據(jù)。解決的辦法:
創(chuàng)建一個(gè)空文件夾,把問題散頁復(fù)制進(jìn)去,然后用“文件合并”功能合并這個(gè)文件夾,得到一頁結(jié)果。
將此一頁結(jié)果更名為問題散頁的文件名,覆蓋原問題散頁,重新合并即可。
Q:為什么有些散頁DjVu文件合并后,從某頁開始就無法顯示,但是單獨(dú)用WinDjView看每頁都能正常顯示?
A:這種情況通常是下載的時(shí)候,散頁文件末尾被添加了垃圾數(shù)據(jù),或文件數(shù)據(jù)不全。解決的辦法:
先定位有問題的散頁。辦法是把不能顯示的頁或其前、后頁對(duì)應(yīng)的散頁刪除,重新合并。如果某頁刪除后合并結(jié)果正常,則該頁即為問題頁。
用WinDjView打開問題頁,如果能夠打開,多半是文件末尾被添加了垃圾數(shù)據(jù),參照前述方法解決;如果不能打開,說明數(shù)據(jù)不全,只能重新下載。
Q:如何快速檢查合并后的DjVu文件是否有問題?
A:嚴(yán)格說來用WinDjView的縮略圖看是最保險(xiǎn)的,不過如果希望盡量快,也可以用DjVuToy的“文件結(jié)構(gòu)”功能,導(dǎo)出文件結(jié)構(gòu)為文本文件,如果此過程中沒有報(bào)錯(cuò),基本沒有問題,否則可能有問題。
Q:OCR功能有什么用?在什么情況下可以使用?
A:OCR功能在DjVu文件中生成隱藏文本,這些文本平時(shí)不可見,但可用WinDjVu的“Edit->Find”功能檢索,也可以用“File->Export Text”功能導(dǎo)出。隱藏文本不僅有文本信息,而且有位置信息,因此用鼠標(biāo)按住左鍵在DjVu頁面上拖動(dòng),可以選中隱藏文字,并復(fù)制到剪貼板。
DjVuToy的OCR功能對(duì)DjVu中的原始圖像不會(huì)造成任何影響,因此可以對(duì)其它軟件生成的DjVu文件進(jìn)行OCR,以實(shí)現(xiàn)強(qiáng)強(qiáng)聯(lián)合:目前DjVu制作軟件以國外的為佳,但是國外DjVu制作軟件在OCR中文時(shí)總覺得不如本土軟件。DjVuToy的OCR引擎是微軟從清華購買的,中文OCR效果不錯(cuò)。
當(dāng)然再好的OCR軟件都不可能完全準(zhǔn)確,因此DjVuToy提供了獨(dú)創(chuàng)性的“導(dǎo)出XML文本”、“導(dǎo)入XML文本”功能,可以將隱藏文本及其位置信息以XML格式導(dǎo)出,進(jìn)行人工校對(duì),然后再導(dǎo)入DjVu文件。 另外這兩個(gè)功能也可以用于文本的繁簡轉(zhuǎn)換:將繁體導(dǎo)出,用TextForever或其它轉(zhuǎn)碼軟件轉(zhuǎn)成簡體,然后再導(dǎo)入。
當(dāng)然如果您有更好的OCR引擎,也可以自己寫一個(gè)軟件,OCR后輸出符合DjVuToy格式要求的XML文件,然后用DjVuToy導(dǎo)入。
DjVuToy的OCR功能需要微軟Office 2003以上版本的Microsoft Office Document Imaging的支持,對(duì)于Office 2003、2007,這個(gè)功能可能缺省安裝都沒有裝全(Office 2007的缺省安裝干脆就沒裝),需要補(bǔ)充安裝。
在簡體中文環(huán)境下進(jìn)行配置,以O(shè)CR繁體中文、日文、韓文的方法,可以google我寫的《在簡體中文Office 2003下OCR繁體中文、日文、韓文》一文。
使用說明
一、軟件安裝/刪除
本軟件安裝非常簡單:創(chuàng)建一個(gè)目錄,用WinZip將下載下來的ZIP包解壓縮到該目錄即可。
本軟件的刪除也很簡單:直接刪除從ZIP包中解壓縮出來的所有文件及運(yùn)行過程中生成的文件即可。
ZIP包中包括下列文件:
DjVuToy.exe。這是軟件的主程序。
DjVuToy.dll。DjVu制作所需的文件,無此文件則不能使用該功能。
DjVuToy.htm。本幫助文件。
如果您下載到的ZIP包中還包括其它文件,毫無疑問不是我放進(jìn)去的,有廣告或木馬之嫌疑,請(qǐng)立即刪除。
另外程序運(yùn)行過程中還會(huì)生成以下文件:
DjVuToy.ini。這個(gè)是參數(shù)保存文件,第一次更改參數(shù)后生成。退出DjVuToy,刪除此文件,再重啟DjVuToy,即可恢復(fù)缺省參數(shù)。
DjVuToy_log.txt。這個(gè)是錯(cuò)誤記錄文件,在轉(zhuǎn)換過程中出現(xiàn)錯(cuò)誤時(shí)自動(dòng)生成,沒有錯(cuò)誤則自動(dòng)刪除以前的錯(cuò)誤記錄。
djvu_temp:如果運(yùn)行了“DjVu制作”功能,就會(huì)生成此文件夾,用來存儲(chǔ)中間文件。
二、軟件使用
統(tǒng)一說明
本軟件所有文件、文件夾輸入框均支持快捷鍵Ctrl+A(全選)、Ctrl+C(復(fù)制)、Ctrl+X(剪切)、Ctrl+V(粘貼)、Ctrl+Z(撤銷)。
Ctrl+V支持從資源管理器直接粘貼文件、文件夾。即在資源管理器中選擇某個(gè)文件或文件夾,選“復(fù)制”,然后光標(biāo)定位到輸入框,按Ctrl+V,即可將文件、文件夾的完整路徑粘貼過來。
公共按鈕:
恢復(fù):DjVuToy會(huì)自動(dòng)記憶您在各頁中設(shè)置的參數(shù)(記錄在DjVuToy.ini文件中),點(diǎn)擊“恢復(fù)”按鈕可以將所有參數(shù)恢復(fù)到缺省值。
顯示設(shè)置:隱藏/恢復(fù)某些頁面。通過隱藏不常用的頁面,可以簡化界面。
關(guān)于:顯示DjVuToy的版本和相關(guān)信息。
幫助:顯示本文件。
文件合并
功能:將多個(gè)DjVu文件合并成一個(gè),并加掛書簽(如果有書簽描述文件)。
操作:按界面上標(biāo)注的1、2、3、4操作即可。
說明:只有在“合并后順便把書簽掛上”選項(xiàng)被選中,并且在散頁DjVu文件夾下存放有書簽接口文件(FreePic2Pdf.itf、FreePic2Pdf_bkmk.txt)時(shí),合并出來的DjVu才會(huì)帶書簽。
接口文件來源有下列幾種:
1、通過“PDG轉(zhuǎn)DjVu”功能將PDG文件轉(zhuǎn)換成單頁DjVu文件時(shí),自動(dòng)按照bookcontents.dat生成的接口文件。
2、在“書簽相關(guān)”功能中,從中美百萬的a.opf或catalog.xml轉(zhuǎn)換而來。
3、按照接口文件規(guī)范(詳見FreePic2Pdf使用說明),自己手工編輯。
在合并DjVu文件時(shí),如果選了“合并過程中花時(shí)間查壞頁”選項(xiàng),能夠自動(dòng)跳過出錯(cuò)頁,當(dāng)然這樣可能導(dǎo)致書簽不準(zhǔn)。
文件拆分
功能:將多頁DjVu文件每頁拆分成一個(gè)單獨(dú)的DjVu文件。
操作:按界面上標(biāo)注的1、2、3、4操作即可。
說明:
如果“重新編號(hào)”選項(xiàng)被選中,則生成的文件名為“頁碼數(shù)字.djvu”,此時(shí)如果數(shù)字位數(shù)指定為0,則頁碼數(shù)字前面沒有0,否則用0補(bǔ)足指定的位數(shù)。
如果“重新編號(hào)”選項(xiàng)未被選中,則拆分后的DjVu文件名用合并前的文件名。
如果“生成索引”選項(xiàng)被選中,拆分后自動(dòng)生成index.djvu,否則不生成。
如果“嵌入INCL段(拆分后文件可單獨(dú)打開)”選項(xiàng)被選中(缺省為選中),則拆分過程中會(huì)將所有共享數(shù)據(jù)段(共享字典、注釋等)嵌入拆分后的文件,保證拆分后的每一個(gè)文件均可單獨(dú)打開,但是文件總長度可能會(huì)增加(同一個(gè)共享段被嵌入到多個(gè)文件中);如果此選項(xiàng)未被選中,則所有共享數(shù)據(jù)段會(huì)被導(dǎo)出成單獨(dú)的文件,文件總長度基本保持不變,但拆分后的文件只有在與共享文件在一起時(shí)才能打開。
頁面調(diào)整
功能:插入、刪除、移動(dòng)、旋轉(zhuǎn)多頁DjVu中的頁面。
操作:按界面上標(biāo)注的1、2操作,即可進(jìn)入頁面調(diào)整界面。在其中按照工具條按鈕提示操作即可。
說明:刪除的頁面不可恢復(fù),請(qǐng)?jiān)诓僮髑白龊脗浞荨?/p>
頁面調(diào)整界面也可單獨(dú)啟動(dòng):在運(yùn)行DjVuToy時(shí)以需要處理的DjVu文件路徑為參數(shù),即可進(jìn)入該界面。
生成索引
功能:為文件夾下的散頁DjVu文件生成索引文件,打開索引文件即可瀏覽全部散頁文件,就像將散頁文件合并成了多頁文件一樣。但是與多頁文件不同,索引文件不能掛書簽。
操作:按界面上標(biāo)注的1、2、3、4操作即可。
DjVu制作
功能:圖像文件轉(zhuǎn)DjVu,支持PDG、BMP、GIF、PNG、TIFF、JPEG、JPEG 2000。
操作:按界面上標(biāo)注的1、2、3、4操作即可。
參數(shù)說明:下列參數(shù)說明摘自DjVu SDK v3.6的幫助文件。
黑白圖像質(zhì)量:
無損(lossless):Preserves all the details of the original image. Each pixel in the resulting DjVu image is the same as the original image.
去斑(conservative):Preserves more detail than djvu_normal , but slightly increases encoding time and the size of the resulting DjVu file.
正常(normal):Specifies changes to text which are small enough that they are usually unnoticeable, resulting in faster encoding times and smaller DjVu files.
瞎搞(aggressive):Makes extensive changes to the image, resulting in very fast encoding times and very small DjVu files.
共享字典:Specifies the number of pages to be joined in a common shared dictionary. The recommended values for this option are between 10 and 20. Specify a value of 1 to disable the use of shared dictionaries when the document is fewer than ten pages or does not contain repeating shapes (for example, hand-drawn images).
圖像質(zhì)量系數(shù):If your primary purpose is to archive a copy of an image, assign a very high value (for example, 95) to the --quality option to produce nearly lossless results. If your primary purpose is to publish an image on the Web, a value of 70 or 75 is generally effective. Values lower than 70 should be used only when storage requirements are more important than visual appearance, or when the background layer is unvarying (for example, colored paper).
彩色圖像分層:
3層,Indicates the color image should be segmented into three layers: the mask, background, and foreground. The bitonal mask is encoded using JB2 data compression, and the foreground and background are encoded using IW44 wavelet-based compression.
2層,Indicates the mask and foreground of a color image should be combined into one layer, thereby creating a two-layer DjVu file that consists of a foreground and a background. Using the JB2 color mode, the foreground is encoded by specifying one solid color for each object described by the bitonal mask. The background is encoded using the IW44 compression method.
1層,Disables segmentation and creates a one-layer DjVu document that is encoded with the IW44 compression method. Use this setting to encode images that contain photographs.
注意:在生成DjVu之前,需要先對(duì)圖像文件進(jìn)行統(tǒng)一格式轉(zhuǎn)換,存放在中間臨時(shí)文件夾(缺省為djvu_temp文件夾),轉(zhuǎn)換完成后臨時(shí)文件夾中清空。為了保證轉(zhuǎn)換過程順利完成,請(qǐng)確認(rèn)臨時(shí)文件夾所在磁盤分區(qū)具有足夠的剩余空間。
PDG轉(zhuǎn)換
功能:將PDG文件轉(zhuǎn)換成DjVu,并將bookcontents.dat轉(zhuǎn)換成書簽接口文件。
操作:按界面上標(biāo)注的1、2、3、4操作即可。
參數(shù)說明:
黑白圖像壓縮:可選無損、清潔、有損。“無損”保證轉(zhuǎn)換出來的DjVu文件顯示效果與原PDG完全一樣;“清潔”可以去除圖像上的部分孤立噪點(diǎn),當(dāng)然也有可能去錯(cuò)了把有用的點(diǎn)去掉了;“有損”對(duì)于以字母、數(shù)字為主的頁面來說,可以大幅提高壓縮比,對(duì)于中文頁面來說,可能對(duì)漢字筆畫造成損傷 ,因此建議慎用。
單層JPG(04H)無損轉(zhuǎn)換:如果此選項(xiàng)被選中,PDG中的單層JPG圖像數(shù)據(jù)流將無損嵌入DjVu文件,這樣生成的DjVu文件顯示效果與PDG相同,生成的文件長度比PDG文件略小,比JPG略大。如果此選項(xiàng)未被選中,則所 有JPG圖像解碼后按照插圖參數(shù)重新壓縮。
T3插圖層采樣率:按照djvulibre的缺省設(shè)置,對(duì)于插圖應(yīng)該按照1/3重新采樣,即將插圖長、寬均縮小至原來的1/3,以減小文件體積。但是從我實(shí)際操作的情況看,PDG本身的插圖已經(jīng)夠不清晰,再這樣縮一把就更可憐了。所以缺省情況下采樣率為1/1,即不重新采樣。
插圖壓縮效果:這個(gè)是我自己總結(jié)的經(jīng)驗(yàn)值,一般選“快速版效果”即可。
DPI:對(duì)生成的DjVu文件的DPI進(jìn)行設(shè)置。與其它DjVu制作軟件不同,在這里設(shè)置的任何DPI值均不會(huì)對(duì)圖像壓縮本身造成影響。各選項(xiàng)的具體含義:
◆ 使用固定DPI:所有頁面使用相同的DPI。
◆ 使用PDG文件DPI:圖像寬度超過1200象素則DPI為300,否則為150。
◆ 統(tǒng)一至最大寬度:最終頁面寬度=頁面最大象素寬度/固定DPI,每個(gè)頁面的DPI值=該頁象素寬度/最終頁面寬度,保證所有頁面具有相同的邏輯寬度。
◆ 統(tǒng)一至最小寬度:與上一項(xiàng)類似。注意選擇了這兩項(xiàng)中的任意一項(xiàng),均需要先搜索所有PDG文件,找出最大或最小寬度。
◆ 統(tǒng)一至固定寬度:每個(gè)頁面的DPI值=該頁象素寬度/固定頁面寬度,保證所有頁面具有相同的邏輯寬度。
◆ 不理它,愛是多少就是多少:使用系統(tǒng)默認(rèn)的DPI,轉(zhuǎn)換速度會(huì)稍微快那么一點(diǎn)點(diǎn)。轉(zhuǎn)換以后如果后悔了,想再改變DPI,可以用“頁面寬度”功能加以改變。
對(duì)于快速版PDG,因?yàn)楸旧淼膱D像質(zhì)量已經(jīng)夠糟糕了,實(shí)在不希望有人再對(duì)它進(jìn)行反復(fù)壓縮,所以軟件在檢測(cè)到處理的是快速版PDG(原始數(shù)據(jù)流為DjVu)后,對(duì)于單層(無插圖層)的文件都是無損(黑白)或近似無損(彩色)轉(zhuǎn)換,只有在碰到多層(在Pdg2Pic中顯示為T3)PDG,才對(duì)插圖層重新壓縮,文字層保持無損。
對(duì)于清晰版PDG,則按照上述參數(shù)進(jìn)行轉(zhuǎn)換。
對(duì)于索引色圖像(PNG),轉(zhuǎn)換成彩色DjVu。
為了避免因?yàn)槟承┰蛟斐赊D(zhuǎn)換不完全,建議在使用本軟件前,先用PdgThumbViewer對(duì)需要轉(zhuǎn)換的PDG文件進(jìn)行格式檢查。
PDG壓縮
功能:
對(duì)清晰版進(jìn)行無損壓縮。通常清晰版PDG的文字部分采用CCITT壓縮,本功能將它重新壓縮成無損JB2格式。對(duì)中文頁面來說,約能砍掉20%的文件長度。
將清晰版壓縮成快速版。即長、寬各砍掉一半。此功能僅對(duì)寬度超過1200象素的文件起作用。
將黑白TIFF轉(zhuǎn)換成PDG。使用前,請(qǐng)先將TIFF更名成PDG。黑白TIFF可以用ComicEnhancer Pro生成。
對(duì)于名為PDG,實(shí)為PNG的文件,黑白的壓縮成JB2,24位真彩的按照“插圖”選項(xiàng)轉(zhuǎn)換成JPG或DjVu,索引色的仍然保持PNG格式。
注意:
不能進(jìn)行反復(fù)壓縮,即已經(jīng)用本軟件壓縮過的文件,再用同樣的參數(shù)再次壓縮并不會(huì)有效果。
所有壓縮過的PDG文件內(nèi)部數(shù)據(jù)流均為DjVu格式,需要高版本的超星瀏覽器才能閱讀。我用超星3.8沒什么問題,更早的版本沒有試過。其它早期開發(fā)的第三方瀏覽器,如BXViewer讀起來可能也會(huì)有問題。
本軟件畢竟不是超星官方軟件,使用前請(qǐng)先對(duì)需要壓縮的PDG進(jìn)行備份,壓縮后請(qǐng)及時(shí)進(jìn)行檢查,使用本軟件造成的一切后果由使用者自行承擔(dān)。
操作:按界面上注明的1、2、3、4步驟執(zhí)行即可。
選項(xiàng)說明:
轉(zhuǎn)換為快速版:如果此選項(xiàng)沒有選中,可以對(duì)清晰版進(jìn)行無損壓縮,或?qū)IFF無損轉(zhuǎn)換成PDG;否則是將清晰版壓縮成快速版,或?qū)IFF轉(zhuǎn)換成快速版PDG。
插圖保持JPG格式:如果此選項(xiàng)被選中,在清晰版轉(zhuǎn)換成快速版時(shí),插圖存儲(chǔ)為JPG格式,JPG質(zhì)量由“JPG質(zhì)量系數(shù)”選項(xiàng)決定。
插圖轉(zhuǎn)換成DjVu:如果此選項(xiàng)被選中,在清晰版轉(zhuǎn)換成快速版時(shí),插圖存儲(chǔ)為DjVu格式,DjVu質(zhì)量由“插圖壓縮效果”選項(xiàng)決定。
黑白圖縮小算法:在將清晰版縮小成快速版時(shí),需要將圖像尺寸縮小一半,此參數(shù)決定縮小時(shí)的插值算法。如果沒有什么特殊情況,建議保持缺省的“nearest”。
書簽相關(guān)
功能:包括導(dǎo)出書簽、加掛書簽(支持多級(jí)書簽)、刪除書簽、將中美百萬的a.opf或catalog.xml轉(zhuǎn)換成書簽接口文件。這個(gè)功能完全模仿FreePic2Pdf對(duì)PDF書簽的處理,所以順理成章使用了FreePic2Pdf的接口文件對(duì)書簽進(jìn)行定義。
操作:
導(dǎo)出書簽:
1、選擇需要操作的DjVu文件。
2、選擇存放導(dǎo)出后生成的接口文件的文件夾。
3、點(diǎn)“導(dǎo)出書簽”按鈕。
加掛書簽:
1、選擇需要操作的DjVu文件。
2、選擇存放接口文件的文件夾。
3、點(diǎn)“加掛書簽”按鈕。
刪除書簽:
1、選擇需要操作的DjVu文件。
2、點(diǎn)“刪除”按鈕。
a.opf轉(zhuǎn)接口文件:
1、選擇需要操作的a.opf文件所在文件夾,同時(shí)也是存放轉(zhuǎn)換出來的接口文件的文件夾。
2、點(diǎn)“a.opf -> 接口文件”按鈕。轉(zhuǎn)換出來的接口文件存放在a.opf文件所在文件夾。
catalog.xml轉(zhuǎn)接口文件:
1、選擇需要操作的catalog.xml文件所在文件夾,同時(shí)也是存放轉(zhuǎn)換出來的接口文件的文件夾。
2、點(diǎn)“catalog.xml -> 接口文件”按鈕。轉(zhuǎn)換出來的接口文件存放在catalog.xml文件所在文件夾。
說明:a.opf、catalog.xml均為中美百萬本身的文件,每本書對(duì)應(yīng)一個(gè),怎么下載就不必問我了。
頁面寬度
功能:統(tǒng)一設(shè)置頁面寬度或頁面DPI。在用WinDjView瀏覽DjVu文件時(shí),如果選擇“Fit Width”,頁面寬度不一樣也沒有關(guān)系,但是如果選擇按百分比顯示,頁面寬度不一就很難看了。此功能的“統(tǒng)一頁寬”就是通過調(diào)整頁面的DPI值,使按百分比顯示時(shí)各頁寬度一致。由于調(diào)整的僅僅是INFO段中的DPI值,對(duì)圖像數(shù)據(jù)不會(huì)造成影響。當(dāng)然由于DjVu的DPI是整數(shù),四舍五入后,實(shí)際顯示時(shí)頁寬可能還會(huì)有一點(diǎn)細(xì)微的差異。“統(tǒng)一DPI”功能可以看做是“統(tǒng)一頁寬”的反功能,將INFO段中的DPI值再設(shè)置回統(tǒng)一值。
操作:
統(tǒng)一頁寬:
1、選擇需要操作的DjVu文件。
2、設(shè)置“統(tǒng)一頁寬”框中的選項(xiàng)。
3、點(diǎn)“開始設(shè)置”按鈕。
統(tǒng)一DPI:
1、選擇需要操作的DjVu文件。
2、設(shè)置統(tǒng)一DPI。
3、點(diǎn)“開始設(shè)置”按鈕。
轉(zhuǎn)為圖像
功能:將多頁DjVu的每一頁轉(zhuǎn)成一個(gè)圖像。
操作:按界面上標(biāo)示的1、2、3、4操作即可。
選項(xiàng)說明:
轉(zhuǎn)換后的文件名:轉(zhuǎn)換后,按照頁碼對(duì)文件圖像文件進(jìn)行編號(hào),此值為號(hào)碼位數(shù)。
轉(zhuǎn)換范圍:只轉(zhuǎn)換指定范圍的頁。由于這個(gè)功能容易誤操作,所以缺省為關(guān)閉。
黑白頁存為:轉(zhuǎn)換后黑白頁面的存儲(chǔ)方式。缺省為采用CCITT G4壓縮的TIFF。
索引色頁存為:轉(zhuǎn)換后索引色頁(彩色文字頁)的存儲(chǔ)方式。缺省為PNG。
彩頁存為:轉(zhuǎn)換后彩色/插圖頁面的存儲(chǔ)方式。缺省為JPG。
JPG質(zhì)量系數(shù):彩頁如果存為JPG,此值決定文件的大小和質(zhì)量。
說明:
如果DjVu中某頁是JPG格式的Photo DjVu,則不論“彩頁存儲(chǔ)”選項(xiàng)如何選擇,該頁均存儲(chǔ)為JPG,數(shù)據(jù)流直接從DjVu的BGjp段中抽取,實(shí)現(xiàn)無損轉(zhuǎn)換。
索引色頁指的是“彩色文字頁”,這種頁面的背景色通常為白色。如果背景色不是白色,或有底紋,請(qǐng)將“索引色頁存為”選為BMP或JPG。 如果選擇存為PNG,軟件將自動(dòng)對(duì)圖像進(jìn)行減色處理,如果減色后出現(xiàn)顏色失真,請(qǐng)選擇存為BMP或JPG,這兩種格式不會(huì)嘗試減色。
文本相關(guān)
功能:包括OCR、導(dǎo)出純文本、導(dǎo)出XML文本、導(dǎo)入XML文本、刪除文本。
操作:
OCR:
1、選擇需要操作的DjVu文件。
2、如有必要,點(diǎn)擊“OCR選項(xiàng)”進(jìn)行配置。
3、點(diǎn)擊“OCR”開始生成隱藏文本。
對(duì)“OCR選項(xiàng)”的說明:
1、自動(dòng)旋轉(zhuǎn):如果頁面出現(xiàn)歪斜,用此功能可以糾斜。
2、自動(dòng)拉伸:如果頁面長寬比例失調(diào),或出現(xiàn)傾斜,可以用此功能校正。
3、語言:選擇OCR語言?!罢Z言”選擇準(zhǔn)確與否,對(duì)OCR的結(jié)果會(huì)有很大影響,務(wù)必注意。
自動(dòng)旋轉(zhuǎn)、自動(dòng)拉伸均需要時(shí)間,考慮到多數(shù)PDG文件不需要進(jìn)行校正,因此這兩個(gè)選項(xiàng)缺省不選中。如果頁面確實(shí)變形比較厲害,可以選中后重新OCR。
4、Word合并成Line:這個(gè)是DjVu的獨(dú)創(chuàng)。如果此選項(xiàng)被選中(缺省為選中),則DjVu將整行算做一個(gè)Word,可以有效減小文件長度,并增加檢索的匹配度;否則每個(gè)Word都算做單獨(dú)的Word。
具體這個(gè)選項(xiàng)是任何影響Word、Line的關(guān)系,可以用“導(dǎo)出XML文本”導(dǎo)出,然后進(jìn)行比較。
導(dǎo)出純文本:
1、選擇需要操作的DjVu文件。
2、選擇導(dǎo)出后的文本文件存放位置。
3、點(diǎn)“導(dǎo)出文本”按鈕。導(dǎo)出的結(jié)果為ANSI格式的文本文件。
導(dǎo)出XML文本:
1、選擇需要操作的DjVu文件。
2、選擇導(dǎo)出后的文本文件存放位置。
3、點(diǎn)“導(dǎo)出XML文本”按鈕。導(dǎo)出的結(jié)果為ANSI格式的XML文件。
導(dǎo)出的XML文件可以反映隱藏文本的內(nèi)容、位置,是對(duì)OCR結(jié)果的最直接表述。如果碰到DjVu文件檢索不到、檢索不準(zhǔn)確的問題,不妨用這個(gè)功能進(jìn)行導(dǎo)出,然后仔細(xì)看一下單詞切分是否準(zhǔn)確。
導(dǎo)入XML文本:
1、選擇需要操作的DjVu文件。
2、選擇需要導(dǎo)入的XML文件存放位置。
3、點(diǎn)“導(dǎo)入XML文本”按鈕。導(dǎo)入的XML文件為ANSI編碼,導(dǎo)入時(shí)按照系統(tǒng)缺省代碼頁轉(zhuǎn)換成utf8。
理論上說,“導(dǎo)出XML文本”、“導(dǎo)入XML文本”這兩個(gè)功能結(jié)合起來,可以實(shí)現(xiàn)DjVu文本校對(duì),或文本轉(zhuǎn)碼(簡體轉(zhuǎn)繁體,繁體轉(zhuǎn)簡體)。而“導(dǎo)入XML文本”則為使用第三方OCR提供了接口。
刪除文本:
1、選擇需要操作的DjVu文件。
2、點(diǎn)“刪除文本”按鈕。
某些電子書OCR得實(shí)在糟糕,可以用此功能刪除文本以節(jié)省空間。
轉(zhuǎn)PDF
功能:將整個(gè)多頁DjVu文件一次轉(zhuǎn)換成PDF,并可旋轉(zhuǎn)是否轉(zhuǎn)換書簽(目錄)。
操作:
1、選擇需要轉(zhuǎn)換的DjVu文件。
2、如有必要,點(diǎn)擊“PDF選項(xiàng)”進(jìn)行設(shè)置。
3、如有必要,重新選擇轉(zhuǎn)換后的PDF文件的存放位置。
4、點(diǎn)擊“開始轉(zhuǎn)換”按鈕,開始轉(zhuǎn)換。
說明:
1、如果選擇轉(zhuǎn)換書簽(目錄),轉(zhuǎn)換過程中會(huì)在源DjVu文件所在文件夾下臨時(shí)生成接口文件,轉(zhuǎn)換完成后自動(dòng)刪除。如果接口文件創(chuàng)建失敗,則不能正常轉(zhuǎn)換書簽(目錄)。
2、轉(zhuǎn)換過程采用FreePic2Pdf的轉(zhuǎn)換引擎,相關(guān)參數(shù)設(shè)置參見FreePic2Pdf使用說明。
3、轉(zhuǎn)換后的PDF采用JBIG2、JPEG 2000壓縮,如果您的PDF瀏覽器不支持這兩種壓縮格式,則不能采用此功能進(jìn)行轉(zhuǎn)換,建議改用“轉(zhuǎn)為圖像”功能先轉(zhuǎn)成通用圖像,再用FreePic2Pdf合并、轉(zhuǎn)換成PDF。
4、相關(guān)技術(shù)細(xì)節(jié)參見我寫的《DjVu轉(zhuǎn)PDF》。
文件結(jié)構(gòu)
功能:導(dǎo)出DjVu文件結(jié)構(gòu);或?qū)jVu文件某頁的三層(蒙板層、前景層、背景層)分別轉(zhuǎn)存成DjVu文件,便于對(duì)DjVu內(nèi)部數(shù)據(jù)進(jìn)行分析 ;或?qū)С鲋付撁娴腏B2數(shù)據(jù),即JB2壓縮的所有shape、頁面結(jié)構(gòu),用于DjVu內(nèi)部數(shù)據(jù)分析。
操作:
導(dǎo)出DjVu文件結(jié)構(gòu):
1、選擇需要操作的DjVu文件。
2、選擇導(dǎo)出的文本文件存放位置。
3、點(diǎn)“開始導(dǎo)出”按鈕。
導(dǎo)出DjVu文件的層:
1、選擇需要操作的DjVu文件。
2、選擇需要導(dǎo)出的頁碼(從1開始)。
3、點(diǎn)“開始導(dǎo)出”按鈕。導(dǎo)出后的文件為:頁碼_Sjbz.djvu(蒙板層)、頁碼_FG44.djvu(前景層)、頁碼_BG44.djvu(背景層)。建議在導(dǎo)出前先看一眼文件結(jié)構(gòu),確認(rèn)前景層、背景層是否是FG44和BG44。
導(dǎo)出DjVu文件的JB2數(shù)據(jù):
1、選擇需要操作的DjVu文件。
2、選擇需要導(dǎo)出的頁碼(從1開始)范圍,及存放導(dǎo)出文件的文件夾。
3、點(diǎn)“開始導(dǎo)出”按鈕。導(dǎo)出后的字典文件為:頁碼_shape編號(hào).tif。其中頁碼、shape編號(hào)均從1開始,占4位,不足4位的用0補(bǔ)足。 頁面描述文件為:頁碼.txt,頁碼同前。
三、操作示范
將PDG電子書轉(zhuǎn)換成DjVu電子書:
進(jìn)入“PDG轉(zhuǎn)DjVu”頁,將PDG轉(zhuǎn)換成單頁DjVu,并生成書簽接口文件(如果PDG文件夾下有bookcontents.dat文件)。
進(jìn)入“文件合并”頁,將單頁DjVu合并,并加掛書簽(如果在步驟1生成了書簽接口文件)。
將中美百萬下載到的文件轉(zhuǎn)換成DjVu電子書:
將下載到的文件存放在同一個(gè)文件夾,包括散頁DjVu、a.opf或catalog.xml。
進(jìn)入“書簽相關(guān)”頁,將a.opf或catalog.xml轉(zhuǎn)換成書簽接口文件。
進(jìn)入“文件合并”頁,將單頁DjVu合并,并加掛書簽(如果在步驟2生成了書簽接口文件)。
附錄A 鳴謝
本軟件的DjVu文件操作基于djvulibre源代碼,不過被我改到VC不再報(bào)告累積性內(nèi)存漏洞。另外本軟件 的PDG解碼器在開發(fā)過程中還得到網(wǎng)上讀書園地成員車明(BECompanion)、hstong、 伊茲魚、coolman和qdlsy,及rbook論壇mogaoku的大力支持與協(xié)助。 圖像文件處理采用了Davide Pizzolato的CxImage,底層JPEG采用了Independent JPEG Group(獨(dú)立JPEG小組)發(fā)布的JPEG LIB源代碼,PNG采用了libpng組織提供的源代碼,TIFF采用了libtiff組織提供的源代碼,Jpeg 2000的編解碼采用了openjpeg組織提供的LibOpenJPEG源代碼、Michael D. Adams發(fā)布的JasPer源代碼,zlib采用了ASM版(其實(shí)只有兩個(gè)文件是ASM的)。
在此對(duì)以上組織和個(gè)人表示深切的謝意!
附錄B 版本更新記錄
Version 1.09
新增功能:在“頁面調(diào)整”中,增加批量旋轉(zhuǎn)功能。
Version 1.08
錯(cuò)誤修正:在將某些多頁TIFF轉(zhuǎn)換成DjVu時(shí),只出現(xiàn)第一頁的內(nèi)容。
錯(cuò)誤修正:某些Old-style JPEG壓縮的TIFF文件轉(zhuǎn)換有錯(cuò)。
Version 1.07
錯(cuò)誤修正:在“DjVu制作”中,如果“彩色圖像轉(zhuǎn)換為”參數(shù)選擇了“純圖像(1層)”,則黑白圖像轉(zhuǎn)換成DjVu時(shí)會(huì)出錯(cuò)。
錯(cuò)誤修正:生成的PDF文件“文檔屬性”中的創(chuàng)建日期、修改日期未按時(shí)區(qū)校正。
Version 1.06
恢復(fù)v1.04取消的“Pdg轉(zhuǎn)換”功能。
Version 1.05
錯(cuò)誤修正:DjVu轉(zhuǎn)PDF時(shí),如果遇到JB2字典中shape寬或高為0的情況,會(huì)出錯(cuò)退出。
Version 1.04
新增功能:“DjVu制作”,將圖像文件轉(zhuǎn)換成DjVu,詳見使用說明。
新增功能:“文件拆分”中增加“重新編號(hào)”、“生成索引”、“嵌入INCL段(拆分后文件可單獨(dú)打開)”選項(xiàng),詳見使用說明。
功能增強(qiáng):DjVu轉(zhuǎn)PDF支持Smmr數(shù)據(jù)段,即CCITT G4壓縮的DjVu。
功能調(diào)整:原“Pdg轉(zhuǎn)換”功能與“DjVu制作”功能重復(fù),從此版本開始取消。
功能調(diào)整:“文本相關(guān)”頁面中,OCR選項(xiàng)中的“自動(dòng)拉伸”缺省改為選中,以對(duì)付傾斜頁面。
錯(cuò)誤修正:“文件合并”、“生成索引”、“轉(zhuǎn)為圖像”時(shí),如果需要處理的文件包含指向外部文件的共享數(shù)據(jù)段,則生成的結(jié)果不正確。
錯(cuò)誤修正:修正了一些內(nèi)存漏洞。即花了四年時(shí)間,終于將VC報(bào)告的所有內(nèi)存漏洞都補(bǔ)上了。
錯(cuò)誤修正:在“頁面調(diào)整”界面中,點(diǎn)擊工具條上的“旋轉(zhuǎn)”按鈕后,預(yù)覽界面沒有及時(shí)刷新。
錯(cuò)誤修正:按下F1鍵時(shí),會(huì)顯示錯(cuò)誤的提示信息。
Version 1.03
新增功能:支持名為PDG,實(shí)為GIF的文件,方便從售書網(wǎng)站上補(bǔ)封面。
錯(cuò)誤修正:DjVu轉(zhuǎn)PDF時(shí),如果碰到空白頁面,轉(zhuǎn)換后的PDF自空白頁面起顯示不正常。
錯(cuò)誤修正:某些灰度頁面轉(zhuǎn)換成PDF后成為黑頁。
錯(cuò)誤修正:名為PDG,實(shí)為空白DjVu的文件轉(zhuǎn)換不正確。
Version 1.02
新增功能:在“頁面調(diào)整”中,加入“批量刪除”功能。
功能增強(qiáng):在“頁面調(diào)整”中,顯示絕對(duì)頁碼。
錯(cuò)誤修正:DjVu轉(zhuǎn)PDF時(shí),如果DjVu多頁共享數(shù)據(jù)字典,中間某頁無Sjbz,則轉(zhuǎn)換后的PDF有錯(cuò)。
Version 1.01
錯(cuò)誤修正:在“Pdg壓縮”時(shí),會(huì)跳過名為PDG,實(shí)為JPG的文件。
Version 1.00
新增功能:DjVu轉(zhuǎn)PDF。相關(guān)細(xì)節(jié)參見我寫的《DjVu轉(zhuǎn)PDF》。
新增功能:頁面調(diào)整,可以插入、刪除、移動(dòng)、旋轉(zhuǎn)頁面。
新增功能:在“文件結(jié)構(gòu)”頁中可導(dǎo)出指定頁碼范圍的JB2數(shù)據(jù),即各個(gè)shape導(dǎo)出為tif,同時(shí)導(dǎo)出頁面描述數(shù)據(jù)。
功能增強(qiáng):支持帶FGjp、BGjp段的DjVu文件。
新增功能:“書簽相關(guān)”中,增加“刪除書簽”功能。
新增功能:支持名為PDG,實(shí)為jpeg 2000的文件,包括jpeg 2000插圖。
功能增強(qiáng):JasPer源代碼升級(jí)至v1.900.1。
錯(cuò)誤修正:OCR時(shí)如果一頁有錯(cuò),會(huì)導(dǎo)致后面所有頁面不能正常OCR。
錯(cuò)誤修正:合并某些引用外部文件的散頁時(shí),可能出錯(cuò)退出。
錯(cuò)誤修正:從“文件結(jié)構(gòu)”導(dǎo)出的某些前景、背景文件打開出錯(cuò)。
錯(cuò)誤修正:在DjVu轉(zhuǎn)圖像時(shí),某些調(diào)色板圖像會(huì)丟失顏色。
錯(cuò)誤修正:打開某些名為PDG,實(shí)為黑白TIFF的文件會(huì)出錯(cuò)退出。
錯(cuò)誤修正:不能正常打開某些名為PDG,實(shí)為JPG壓縮的TIFF文件。
錯(cuò)誤修正:文件總長度太大時(shí),“PDG壓縮”結(jié)束后報(bào)告的壓縮比不正確。
錯(cuò)誤修正:碰到假冒DjVu時(shí),某些操作會(huì)導(dǎo)致產(chǎn)生內(nèi)存漏洞。
同步發(fā)行英文版,但是英文版中去掉了PDG、中美百萬相關(guān)內(nèi)容。
Version 0.21
錯(cuò)誤修正:打開某些黑白PDG時(shí)可能出錯(cuò)退出。
Version 0.20
錯(cuò)誤修正:某些CMYK色彩空間的JPG(PDG)文件轉(zhuǎn)換不正確。
Version 0.19
錯(cuò)誤修正:某些CMYK色彩空間的JPG(PDG)文件轉(zhuǎn)換不正確。
Version 0.18
功能修正:在“書簽相關(guān)”的“a.opf->接口文件”中,改用微軟XML控件對(duì)a.opf文件進(jìn)行解析,以增強(qiáng)兼容性。
Version 0.17
功能增強(qiáng):支持ACH格式的PDG,支持04H的黑白PDG。
Version 0.16
功能增強(qiáng):libpng源代碼升級(jí)至v1.2.28。
錯(cuò)誤修正:碰到某些破損PNG會(huì)出錯(cuò)。
Version 0.15
功能增強(qiáng):放寬格式檢查,兼容某些第三方工具生成的不規(guī)范PDG。
錯(cuò)誤修正:在“文件合并”、“生成索引”中,“按結(jié)尾數(shù)字”排序?qū)償?shù)字文件名無效。
Version 0.14
新增功能:在“PDG轉(zhuǎn)換”、“PDG壓縮”功能中,支持名為PDG,實(shí)為DjVu、TIFF的文件。
功能修正:“文件拆分”功能中,“拆分后的文件名”缺省從8位數(shù)字改成6位數(shù)字,這樣拆分后只需要一個(gè)簡單的ren *.djvu *.pdg,即可用鄙人的PDG相關(guān)軟件進(jìn)行 瀏覽。
功能修正:“Pdg轉(zhuǎn)換”功能中,如果選擇了“重新編號(hào)轉(zhuǎn)換出來的文件”,則重新編號(hào)后的文件為6位數(shù)字,不再是8位。
Version 0.13
錯(cuò)誤修正:在“文本相關(guān)”功能中,不能對(duì)單頁DjVu進(jìn)行操作。
錯(cuò)誤修正:在“文本相關(guān)”中使用OCR時(shí),會(huì)在臨時(shí)文件夾下留下垃圾文件。
Version 0.12
新增功能:在“轉(zhuǎn)為圖像”功能中,可以選擇索引色頁的保存方式,詳見FAQ。
新增功能:在“PDG轉(zhuǎn)換”、“PDG壓縮”功能中,支持名為PDG,實(shí)為PNG的文件。
功能增強(qiáng):在“文本相關(guān)”功能中,支持日文OCR。當(dāng)然需要先安裝日文MODI。
錯(cuò)誤修正:在將PDG轉(zhuǎn)換成DjVu時(shí),如果PDG文件是灰度JPG,轉(zhuǎn)換過程會(huì)出錯(cuò)。
Version 0.11
錯(cuò)誤修正:在OCR時(shí),如果某頁OCR結(jié)果為空,則會(huì)報(bào)錯(cuò),并且不能繼續(xù)OCR后續(xù)頁面。
Version 0.10
功能修正:“文本相關(guān)”功能中,原“導(dǎo)出文本”按鈕更名為“導(dǎo)出純文本”,導(dǎo)出文本格式從UTF-8改為ANSI。
新增功能:“文本相關(guān)”功能中的“導(dǎo)出XML文本”、“導(dǎo)入XML文本”,可以將隱藏文本以XML格式導(dǎo)出、導(dǎo)入。理論上說,這兩個(gè)功能結(jié)合起來,可以實(shí)現(xiàn)DjVu文本校對(duì)。而“導(dǎo)入XML文本”則為使用第三方OCR提供了接口。
新增功能:“文本相關(guān)”功能中的“OCR”,生成可檢索的隱藏文本。改功能對(duì)DjVu中的原始圖像不會(huì)造成任何影響,可以對(duì)其它軟件生成的DjVu文件進(jìn)行OCR。
Version 0.09
新增功能:在“書簽相關(guān)”頁中,啟動(dòng)PdgCntEditor,對(duì)書簽文件進(jìn)行編輯。
功能增強(qiáng):改進(jìn)“按末尾數(shù)字排序”算法,能夠從文件名中正確抽取最后一個(gè)數(shù)字。
Version 0.08
新增功能:在“文件合并”中,新增“合并過程中花時(shí)間檢查壞頁”選項(xiàng),避免因?yàn)橛袎捻撛斐珊喜⒑蟮奈募蜷_錯(cuò)誤。
新增功能:在“Pdg壓縮”中,能夠?qū)雾揇jVu轉(zhuǎn)換成PDG。
功能增強(qiáng):在“文件合并”中,允許合并多個(gè)多頁DjVu成一個(gè)大DjVu。以前只允許合并單頁DjVu。
功能增強(qiáng):兼容某些非標(biāo)準(zhǔn)格式的BookContents.dat。
錯(cuò)誤修正:在用“Pdg壓縮”功能將單頁DjVu轉(zhuǎn)換成PDG時(shí),某些正常的DjVu轉(zhuǎn)換失敗。
錯(cuò)誤修正:在更改“顯示設(shè)置”后,提示信息中出現(xiàn)TextForever的信息。
錯(cuò)誤修正:幫助文件中“文件結(jié)構(gòu)”部分的使用說明有誤。
錯(cuò)誤修正:在加掛書簽時(shí),內(nèi)存消耗太多,導(dǎo)致某些大文件不能加掛書簽。
錯(cuò)誤修正:在“PDG壓縮”功能中,將灰度JPG壓縮成快速版DjVu會(huì)出現(xiàn)圖像變形。
在FAQ部分增加“文件合并”的幾個(gè)常見問題。
Version 0.07
新增功能:“PDG壓縮”,能夠?qū)η逦孢M(jìn)行無損壓縮,或?qū)⑶逦鎵嚎s成快速版,或?qū)⒑诎譚IFF轉(zhuǎn)換成PDG。詳見使用說明。
新增功能:“轉(zhuǎn)為圖像”,將多頁DjVu的每一頁轉(zhuǎn)換成一個(gè)圖像。
新增功能:“頁面寬度”,將多頁DjVu的頁面寬度或DPI設(shè)置為一個(gè)統(tǒng)一值。
新增功能:PDG轉(zhuǎn)DjVu時(shí),能夠?qū)ι傻腄jVu文件的DPI進(jìn)行設(shè)置。
功能增強(qiáng):PDG轉(zhuǎn)DjVu時(shí),能夠報(bào)告插圖下載不完全,或插圖數(shù)據(jù)錯(cuò)誤的T3文件。
功能增強(qiáng):PDG轉(zhuǎn)DjVu時(shí),改進(jìn)對(duì)黑線頁的識(shí)別。
功能增強(qiáng):在合并DjVu文件時(shí),能夠自動(dòng)跳過出錯(cuò)頁,當(dāng)然這樣可能導(dǎo)致書簽不準(zhǔn)。
功能增強(qiáng):優(yōu)化T3PDG轉(zhuǎn)DjVu過程。
功能增強(qiáng):給每個(gè)頁簽加了小圖標(biāo)。
Version 0.06
錯(cuò)誤修正:在轉(zhuǎn)換某些T3 PDG文件時(shí),會(huì)因?yàn)樯砂咨尘岸@示不出文字層。
Version 0.05
功能增強(qiáng):在PDG轉(zhuǎn)DjVu的參數(shù)選擇中,“插圖壓縮效果”選項(xiàng)新增“很爛快速版”,給那些認(rèn)為文件大小優(yōu)先于圖像質(zhì)量的人。
錯(cuò)誤修正:個(gè)別黑白圖像被識(shí)別為JPG圖像。
錯(cuò)誤修正:解碼某些特殊軟件下載的05H時(shí),會(huì)因?yàn)槠屏?6H處的1出問題。
Version 0.04
新增功能:PDG轉(zhuǎn)DjVu。
新增功能:在“文件結(jié)構(gòu)”頁中,可以將DjVu頁面的三層結(jié)構(gòu)(蒙板層、前景層、背景層)導(dǎo)出為獨(dú)立的DjVu文件,便于對(duì)DjVu文件進(jìn)行分析。
新增功能:將中美百萬的catalog.xml轉(zhuǎn)換成書簽接口文件,便于掛書簽。
新增功能:在合并文件時(shí),能夠加掛書簽。
Version 0.03
新增功能:生成索引。
錯(cuò)誤修正:導(dǎo)出書簽時(shí)生成的txt文件是utf8編碼,導(dǎo)致再次導(dǎo)入后書簽出現(xiàn)亂碼。
修正了測(cè)試過程中發(fā)現(xiàn)的一些bug。
Version 0.02
錯(cuò)誤修正:打開DjVu會(huì)出錯(cuò)。
Version 0.01
實(shí)現(xiàn)文件合并、文件拆分、文本處理、書簽處理、結(jié)構(gòu)導(dǎo)出。
聯(lián)系客服