有效地記錄日志可以簡化企業(yè)的開發(fā)過程提前規(guī)劃一個記錄日志的計劃,在開發(fā)過程后期就可以獲益 ![]() |
![]() |
級別: 中級 Charles Chan , 首席顧問, Ambrose Software Inc. 2005 年 9 月 05 日 在企業(yè)級的開發(fā)過程中,我們不可避免地會碰到很多問題;如果您希望在開發(fā)過程的后期能夠有效地捕捉 bug,那就需要一種有效的日志策略。但是在一個企業(yè)的應(yīng)用程序中要想實現(xiàn)有效地記錄日志,需要進行一番規(guī)劃,并設(shè)計一些準則。在本文中,顧問 Charles Chan 將向您介紹一些最好的實踐,從而幫助您從項目一開始就編寫有用的日志代碼。 如果您是一名開發(fā)人員,那您很可能就已經(jīng)具有這種經(jīng)驗:您已經(jīng)開發(fā)了一些代碼以及一些測試用例。應(yīng)用程序經(jīng)過了嚴格的 QA 測試,您確信代碼可以完全適合業(yè)務(wù)的需求。然而,在將應(yīng)用程序最終交付終端用戶的手里時,卻會出現(xiàn)一些預想不到的問題。如果沒有適當?shù)娜罩鞠?,可能需要花費幾天的時間來診斷這些問題。不幸的是,大部分項目對于日志都沒有一個清晰的策略。如果沒有這種策略,系統(tǒng)產(chǎn)生的日志消息就有可能無益于問題的分析和解決。在本文中,我們將討論企業(yè)應(yīng)用程序日志的各個方面的問題。您將看到一個 Java™ 平臺上日志 API 的概述,學習一些最好的編寫日志代碼的實踐,并了解如果需要在產(chǎn)品環(huán)境中對詳細日志重新進行排序,應(yīng)該如何處理。 選擇日志 API 在使用 Java 平臺進行開發(fā)時,可以使用兩個主要的日志 API:Apache Log4J 和 Java Logging API,在 1.4 及更高版本的 Java 平臺中都提供了這兩個 API。與 Java Logging API 相比,Log4J 更加成熟,特性也更加豐富。這兩個日志的實現(xiàn)都采用了一個類似的設(shè)計模式(如圖 1 所示)。除非您的公司限制要使用第三方的庫,否則我強烈建議使用 Log4J。如果您不能決定使用哪個 API,就可以使用 Apache Commons Logging API,它對底層的日志實現(xiàn)進行了封裝。從理論上來說,這樣不用修改代碼就可以進行日志實現(xiàn)的切換。然而,實際上您很少會切換日志的實現(xiàn);因此,我不建議使用 Apache Commons Logging API,因為它的復雜性并不沒有給您帶來其他特性。
日志概述 Log4J 和 Java Logging API 都采用了類似的設(shè)計和使用模式(如圖 1 和清單 1 所示)。消息首先被創(chuàng)建,然后傳遞給一個具有特定優(yōu)先權(quán)的日志對象。這些消息的目的和格式是由輸出處理程序及其布局所決定。 圖 1. 日志實現(xiàn)的主要組件 ![]() 清單 1. 日志對象的實例化和使用
一個好的日志實現(xiàn)中提供了很多不同的輸出處理程序,最常見的文件輸出處理程序和終端輸出處理程序。Log4J 還提供了一些處理程序?qū)⑾l(fā)布到一個 JMS 主題中,或者將消息插入一個數(shù)據(jù)庫表中。盡管這編寫一個定制的附加器并不困難,但是編寫和維護這種代碼的總體成本不應(yīng)低估。消息的格式可以通過 清單 2 給出了一個 Log4J 的樣例配置文件,它負責配置 清單 2. Log4J XML 配置樣例文件
日志最佳實踐 關(guān)于日志,您要做的一個最重要的選擇可能是確定一種模式,將每個日志消息分配給一個特定的 類別。常見的一種實踐是使用每個類的全名,這些類的操作會被作為一個消息類別在日志中記錄(正如我們在清單 1 中看到的一樣),這是因為這可以讓開發(fā)人員更細粒度地記錄每個類的設(shè)置。然而,這只有在使用日志消息來跟蹤執(zhí)行過程時才能良好地工作。在企業(yè)級的應(yīng)用程序中,有很多其他類型的日志消息。舉例來說,一條日志消息可能是為安全顧問產(chǎn)生的,而另外一條日志消息則可能是會為了幫助進行性能調(diào)優(yōu)而產(chǎn)生的。如果這兩條消息所關(guān)注的是同一個類,這樣就會被分配給相同的類別,這將很難在日志輸出結(jié)果中對其進行區(qū)分。 為了避免這個問題,應(yīng)用程序應(yīng)該具有一組專用的日志記錄程序,它們都進行了獨特的分類,如清單 3 所示。每個日志記錄程序都可以配置自己的優(yōu)先級和輸出處理程序。例如,安全性日志記錄程序可以在將日志寫入目的地之前對消息進行加密。有時應(yīng)用程序的設(shè)計者應(yīng)該與使用日志的用戶(例如安全顧問)一起來商討日志的輸出格式,從而對這些消息進行更好的控制。 清單 3. 專用的日志記錄程序
選擇日志的級別 一個 類別 (例如 security)中的消息可以具有不同的 優(yōu)先級。有些消息是為了調(diào)試而產(chǎn)生的,有些是為了警告而產(chǎn)生的,有些則是出現(xiàn)錯誤而產(chǎn)生的。消息的不同優(yōu)先級可以通過記錄 級別 來產(chǎn)生。最常用的日志級別有:
標準的 Java Logging API 和 Apache Log4J 在此之外又提供了一些日志級別。日志級別的主要目標是幫助您過濾有用信息中的噪聲。為了防止出現(xiàn)使用錯誤的級別以及降低日志消息的效用的情況,在開始編碼之前,必須為開發(fā)人員提供一個清晰的指導方針。 日志消息的格式 一旦選定日志記錄程序并建立起日志級別之后,就可以開始構(gòu)建日志消息了。在這樣做時,重要的是要包含盡可能多的上下文信息,例如用戶提供的參數(shù),其他應(yīng)用程序的狀態(tài)信息。記錄日志對象的一種方法是將它們轉(zhuǎn)換成 XML。第三方庫,例如 XStream(請參閱 參考資料)可以自動將 Java 對象轉(zhuǎn)換成 XML 。盡管這是一種非常強大的機制,但是我們必須要考慮在速度與詳細程度之間達到一種平衡。除了典型的應(yīng)用程序狀態(tài)信息之外,還應(yīng)該記錄以下信息:
上面這些信息(除了調(diào)用程序標識)都是由日志實現(xiàn)自動獲取的。為了將這些信息包含到消息中,您只需要為輸出處理程序配置一個適當?shù)?layout 模式即可。要捕獲調(diào)用者的標識,您可以利用 Log4J 中的診斷上下文特性(更多信息請參閱 參考資料)。診斷上下文讓您可以將上下文信息與當前正在運行的線程關(guān)聯(lián)在一起。這些信息可以在為輸出進行格式化的同時而包含到每條消息中。 在 J2EE Web 應(yīng)用程序中,應(yīng)用邏輯將用戶標識保存到診斷上下文中最好的地方是在一個 servlet 過濾器中。清單 4 中顯示了要實現(xiàn)這種功能的必要代碼。它使用了 Log4J 1.3 alpha 中提供的映射診斷上下文類( 清單 4. 在 servlet 過濾器中使用診斷上下文
使用 AspectJ 跟蹤執(zhí)行情況 在對問題進行診斷時,通常跟蹤程序的執(zhí)行情況會很有幫助。您可以在程序執(zhí)行的不同地方持續(xù)發(fā)送日志消息嗎?例如方法的入口函數(shù)和出口函數(shù)。這是一個老問題,在出現(xiàn) AspectJ 之前一直都沒有什么好的解決方案。使用 AspectJ,可以在應(yīng)用程序的不同地方執(zhí)行代碼段。在 AspectJ 中,這些地方都稱為 point cut,在 point cut 處所執(zhí)行的代碼稱為 advice。point cut 和advice 合稱 aspect。 關(guān)于 AspectJ,有一件事情非常神奇,aspect 不用很多努力就可以應(yīng)用到整個應(yīng)用程序中。有關(guān) AspectJ 的更多信息,請參閱 參考資料。清單 5 給出了一個 AspectJ 源文件的例子,它用來對方法的入口和出口函數(shù)記錄日志。在這個例子中,跟蹤日志程序?qū)⒃诿看芜M入或退出 清單 5. 使用 AspectJ 記錄方法的入口和出口
產(chǎn)品環(huán)境中的日志 一旦應(yīng)用程序處于產(chǎn)品環(huán)境中之后,您通常都需要關(guān)閉調(diào)試或信息日志消息,從而對運行時的性能進行優(yōu)化。然而,當有些不好的事情發(fā)生時,您又不能在開發(fā)環(huán)境中重現(xiàn)這個問題,那就可能需要在產(chǎn)品環(huán)境中激活調(diào)試消息了。重要的是能夠修改日志的設(shè)置,而不用關(guān)閉服務(wù)器。診斷產(chǎn)品的問題即使不用花費數(shù)天來進行詳細的調(diào)研,通常也需要幾個小時的時間。在這段時間之內(nèi),開發(fā)人員需要激活或關(guān)閉應(yīng)用程序不同范圍的日志。如果每次修改日志的設(shè)置之后都需要重新啟動產(chǎn)品應(yīng)用程序,那么情況就會變得非常不可靠了。 幸運的是,Log4J 提供了一種簡單的機制來解決這個問題。在 Log4J 1.2 中, 為了確保 清單 6. 使用 DOMConfigurator 配置 Log4J
如果您的日志配置文件不能方便地進行訪問(例如您的產(chǎn)品環(huán)境是由一個不同的組織進行維護的),那么您就必須使用一種不同的策略。標準的方法是使用 JMX,它提供了一個標準的 API 來管理自己的應(yīng)用程序設(shè)置。在現(xiàn)代 JMX 兼容的服務(wù)器中,您可以使用管理 bean (或 MBeans )來擴展應(yīng)用服務(wù)器的管理終端的功能(更多有關(guān)使用 JMX 以及在 WebSphere Application Server 6.0 中使用 JMX 的內(nèi)容,請參閱 參考資料 一節(jié)。)由于 JMX 方法非常復雜,如果您的情況需要使用 JMX,那就應(yīng)該只用作這個用途。 記錄敏感的數(shù)據(jù) 在記錄產(chǎn)品環(huán)境中的日志時,除了技術(shù)方面的挑戰(zhàn)之外,還存在一些業(yè)務(wù)問題需要克服。例如,記錄敏感的信息可能會引起安全性的問題。并沒有任何限制可以防止您將某個用戶的用戶名和密碼保存到正文文件中。您還必須要保護其他敏感信息,例如 e-mail 地址、電話號碼以及賬號信息。安全顧問和設(shè)計師有責任要確保這些信息不會未加任何處理就保存到日志中。對敏感信息使用安全性專用的日志程序可以幫助降低風險。您可以給這個日志程序配置一個專用的附加器,從而使用一種加密的格式來保存消息,或者將其保存到一個安全的地方。然而,防止出現(xiàn)安全風險的最佳方法是在項目開始之前就設(shè)置適當?shù)木幋a規(guī)范,并在檢查代碼時強制施行這些規(guī)范。 從異常中提取有用信息 當發(fā)生一個非預期的異常時 —— 例如,如果數(shù)據(jù)庫連接突然失效了,或者系統(tǒng)資源變得很低了 —— 就必須對其適當?shù)剡M行處理,否則就會丟失有用的信息,這些信息在診斷問題時是非常有幫助的。首先,必須記錄異常及其堆棧跟蹤狀況。其次,應(yīng)該使用一種用戶界面友好的方式來標識錯誤頁面,這對于終端用戶和技術(shù)支持小組來說都是非常有幫助的。 技術(shù)支持小組在接到一個技術(shù)支持電話時所面臨的一個挑戰(zhàn)是在用戶所報告的問題與特定的日志異常之間建立某種關(guān)聯(lián)。非常有用的一種簡單技術(shù)是為每個異常都記錄一個唯一的 ID。這個 ID 可以告訴用戶,也可以包含在終端用戶所填寫的問題報告表單中。這樣可以減少技術(shù)支持團隊成員猜測的時間,讓他們可以快速對問題作出響應(yīng)??紤]到可讀性的問題,可以定期對 ID 進行回收。 日志文件的管理 一個非常繁忙的應(yīng)用程序的日志文件可能會迅速變得非常大。較大的日志文件很難使用,這是因為它們需要過濾大量的噪聲才能找到有用的信號。Log 循環(huán) 是常見的一個可以幫助解決這個問題的實踐。日志循環(huán)會周期性地對舊日志進行歸檔,這樣新消息就可以總能寫到一個相對較小的文件中。日志消息降低了一些效用來提高速度;您可能很少需要參考一周之前的日志消息。在 Log4J 1.2 中, 清單 7. 使用 DailyRollingFileAppender 循環(huán)使用日志文件
集群環(huán)境中的日志 現(xiàn)在有越來越多的企業(yè)級應(yīng)用程序是在集群環(huán)境或分布式環(huán)境中進行部署的。然而,集群環(huán)境中的日志需要更多規(guī)劃,因為消息都是從不同的源頭生成的(通常是不同的機器)。如果要對不同的機器記錄日志,那就必須對這些機器的時間戳進行同步,否則日志消息的次序就混亂了。對機器間時鐘進行同步的一種簡單方法是使用一個時間服務(wù)器。有兩種方法可以設(shè)置時間服務(wù)器。您可以指定一臺內(nèi)部的機器作為時間服務(wù)器。然后其他機器就可以使用網(wǎng)絡(luò)時間協(xié)議(NTP)來與時間服務(wù)器的時間戳進行同步。另外,您可以使用 Internet 上提供的時間服務(wù)器(請參閱 參考資料)。在 AIX 上, 在集群環(huán)境中搜集日志消息還面臨著一些挑戰(zhàn)。在這種環(huán)境中保存日志消息的一種簡單方法是將它們保存到主機特定的日志文件中。當集群是使用 session affinity 配置時,這可以很好地工作 —— 如果對某個特定用戶會話的請求都要到同一個服務(wù)器上,并且 EJB 也都是部署在本地的。在這種配置中,集群中的機器所產(chǎn)生的日志文件都可以獨立進行分析。如果不是這種情況 —— 換而言之,如果任何給定的請求都可以由多臺機器進行處理 —— 那么對不同日志文件中的日志消息進行分析就會變得更加困難。在這種情況中,一種好的辦法是使用系統(tǒng)管理軟件來管理日志消息,例如 IBM Tivoli® 軟件(請參閱 參考資料 中的鏈接)。這種軟件對所有的日志消息(在系統(tǒng)管理軟件的術(shù)語中稱之為 事件)提供了一個綜合的視圖,從而便于管理員使用。系統(tǒng)管理軟件也可以根據(jù)所接收到的事件的類型觸發(fā)一些操作(例如發(fā)送 e-mail 消息或傳呼消息)。
結(jié)束語 在本文中,我們介紹了在規(guī)劃日志策略時需要考慮哪些問題。正如在編程時所碰到的問題一樣,從一開始就采用一個經(jīng)過詳細考慮的規(guī)劃要比在進行的同時規(guī)劃更能節(jié)省工作量。良好的日志策略可以極大地幫助對問題進行診斷。最終,終端用戶可以獲得更好的應(yīng)用程序,并能從技術(shù)支持團隊獲得迅速的響應(yīng)。
參考資料
關(guān)于作者
|