国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費(fèi)電子書(shū)等14項(xiàng)超值服

開(kāi)通VIP
故障診斷:Lotus Domino的掛起和崩潰
服務(wù)器掛起與崩潰之間究竟有什么區(qū)別?更重要的是,如何修復(fù)它們?在本文中,我們將解釋如何識(shí)別 Lotus Domino 服務(wù)器掛起和崩潰,以及如何分析和糾正它們。

  Lotus Domino 構(gòu)建得非??煽?。但是即使構(gòu)建得再好的產(chǎn)品,也會(huì)遇到導(dǎo)致其掛起或崩潰的問(wèn)題。當(dāng)出現(xiàn)這樣的情況時(shí),您隔離、分析和修復(fù)問(wèn)題的速度越快,您的用戶社團(tuán)就會(huì)越快高興起來(lái)并正常運(yùn)行,您也因而能夠更快地返回去考慮別的事情。

  本文提供了一些可用于修復(fù) Notes/Domino 問(wèn)題的思路。我們首先來(lái)定義服務(wù)器掛起和服務(wù)器崩潰之間的區(qū)別,以及如何解決每種問(wèn)題的例子。我們最后將概述該產(chǎn)品的最新版本 —— Notes/Domino 7 —— 中包含的新的故障診斷特性。我們假設(shè)您是一名有經(jīng)驗(yàn)的 Domino 管理員,并且熟悉基本的 Notes/Domino 概念和術(shù)語(yǔ)。

  何為服務(wù)器掛起和崩潰?

  在進(jìn)入技術(shù)細(xì)節(jié)之前,我們首先定義兩個(gè)常用的術(shù)語(yǔ),即崩潰(crash)和掛起(hang),以確保我們的理解是一致的。

  服務(wù)器崩潰

  Domino 服務(wù)器崩潰是這樣一種情景,即服務(wù)器程序已經(jīng)終止并且不再運(yùn)行。您通??梢酝ㄟ^(guò)查看崩潰屏幕或者 NSD/RIP 日志文件(取決于您運(yùn)行的是什么版本的 Domino),來(lái)確定服務(wù)器終止時(shí)所執(zhí)行的任務(wù)。

  Domino 服務(wù)器崩潰的常見(jiàn)故障現(xiàn)象包括:

  Domino 服務(wù)器不再運(yùn)行,但是系統(tǒng)上的其他程序還在運(yùn)行。

  Domino 服務(wù)器控制臺(tái)不出現(xiàn),即使當(dāng)任務(wù)似乎已加載時(shí)。

  Domino 服務(wù)器已加載,并且沒(méi)做任何事情就突然死機(jī)。

  一個(gè) panic 錯(cuò)誤出現(xiàn)在控制臺(tái)上或 Log.nsf 中,并且系統(tǒng)死機(jī)。

  NSD/RIP 自動(dòng)運(yùn)行并生成一個(gè)文件,服務(wù)器自己死機(jī)和/或重新啟動(dòng)。

  存在幾種不同類型的服務(wù)器崩潰。例如一次性崩潰(one-time crash),顧名思義,可能只出現(xiàn)一次,并且不會(huì)再次出現(xiàn)。一個(gè)導(dǎo)致 Domino 崩潰的進(jìn)程訪問(wèn)壞內(nèi)存或已破壞的文檔時(shí)會(huì)出現(xiàn)一次性崩潰。例如,假設(shè)位于 Mail.box 中的一個(gè)文檔已經(jīng)破壞。當(dāng) Domino 路由器訪問(wèn) Mail.box 想將該文檔路由到其目的地時(shí),將產(chǎn)生一個(gè) Domino 服務(wù)器崩潰。類似的場(chǎng)景以后可能會(huì)出現(xiàn),也可能不會(huì)出現(xiàn)。一般來(lái)說(shuō),一次性崩潰是最難分析的。

  可重復(fù)的崩潰(reproducible crash)是一種可通過(guò)一系列步驟重復(fù)的崩潰。例如一個(gè)這樣的表單,其中包含一個(gè)編碼錯(cuò)誤的按鈕,每當(dāng)按這個(gè)按鈕時(shí),都會(huì)導(dǎo)致一個(gè)可重復(fù)的崩潰。

  重復(fù)的崩潰(Repetitive crashes)按一定的規(guī)律發(fā)生。它們似乎不與任何特定動(dòng)作相關(guān),而是發(fā)生在每天的相同時(shí)間。在這樣的場(chǎng)景中,您需要確切地知道,在導(dǎo)致問(wèn)題的時(shí)間段,服務(wù)器上在運(yùn)行什么。例如,假設(shè) Domino 服務(wù)器上啟用了一個(gè)預(yù)定的代理,每個(gè)月運(yùn)行一次。該代理可能會(huì)導(dǎo)致服務(wù)器崩潰。在這樣的場(chǎng)景中,首先需要禁用導(dǎo)致問(wèn)題的代理,然后再檢查該代理為什么會(huì)導(dǎo)致問(wèn)題(并修復(fù)問(wèn)題)。

  ABEND 是服務(wù)器崩潰的一種特殊形態(tài)。術(shù)語(yǔ) ABEND 是 “abnormal end” 這兩個(gè)單詞的組合。ABEND 崩潰不產(chǎn)生 RIP 或 NSD 文件。

  崩潰的原因如下:

  代碼中的軟件問(wèn)題(無(wú)論是在服務(wù)器上還是客戶機(jī)上)。

  數(shù)據(jù)庫(kù)中的破壞。

  訪問(wèn) Domino 的第三方應(yīng)用程序中的軟件問(wèn)題。

  內(nèi)存不足。

  定制代碼導(dǎo)致的限制操作。

  內(nèi)存泄漏。

  未完成的請(qǐng)求。

  服務(wù)器掛起

  Domino 服務(wù)器掛起是這樣一種場(chǎng)景,即 Domino 服務(wù)器仍在運(yùn)行,但是服務(wù)器上的一個(gè)或多個(gè)任務(wù)不響應(yīng)請(qǐng)求。這些任務(wù)可能還是活躍的,但是不在做它們應(yīng)該做的事情。術(shù)語(yǔ) “掛起” 也定義了一種狀態(tài),即當(dāng)計(jì)算機(jī)程序不按設(shè)計(jì)運(yùn)行時(shí)可能會(huì)出現(xiàn)的狀態(tài)。大部分時(shí)候,出現(xiàn)掛起是因?yàn)?,低?jí)循環(huán)或資源的持久不可用導(dǎo)致嚴(yán)重的性能問(wèn)題。服務(wù)器掛起通常歸因于資源問(wèn)題,所以有時(shí)可把它們看成性能問(wèn)題。

  在掛起期間,程序看起來(lái)像已癱瘓,也不顯示錯(cuò)誤消息,并且屏幕凍結(jié)或者應(yīng)用程序不響應(yīng)用戶的動(dòng)作。鍵盤(pán)輸入或鼠標(biāo)點(diǎn)擊沒(méi)有反應(yīng),不管光標(biāo)置于何處都一樣,但是程序仍在運(yùn)行。與 ABEND 或崩潰不一樣,掛起有時(shí)會(huì)自己解決問(wèn)題,應(yīng)用程序繼續(xù)其正常的執(zhí)行過(guò)程,無(wú)需您的干預(yù)。這樣的情況更應(yīng)該看成是性能問(wèn)題,而不是掛起。

  Domino 服務(wù)器掛起的故障現(xiàn)象包括:

  Domino 仍在運(yùn)行,但是不響應(yīng)客戶機(jī)。在這種情況下,用戶通常報(bào)告說(shuō)他們收到 “Server not responding” 消息。

  控制臺(tái)的行為就像是斷開(kāi)連接的,不接受任何命令,甚至像 quit 這樣簡(jiǎn)單的命令也不接受。

  客戶機(jī)對(duì)服務(wù)器的訪問(wèn)(例如,打開(kāi)數(shù)據(jù)庫(kù))感覺(jué)到響應(yīng)時(shí)間慢。

  出現(xiàn)信號(hào)量超時(shí)。“show stat” 命令將報(bào)告信號(hào)量超時(shí)信息。下面是 Statrep.nsf 中報(bào)告的一個(gè)信號(hào)量超時(shí)的例子:Sem.Timeouts = 430D: 58 0A13:42 030B:28 0116:26 0A12:21。在這個(gè)例子中,430D 是信號(hào)量名稱,58 是超時(shí)的數(shù)量。注意,信號(hào)量超時(shí)并不一定表示性能問(wèn)題。在忙碌的服務(wù)器上出現(xiàn)信號(hào)量超時(shí)是很常見(jiàn)的。如果服務(wù)器上沒(méi)有出現(xiàn)任何信號(hào)量超時(shí),統(tǒng)計(jì)數(shù)據(jù) Sem.timeouts 就不會(huì)出現(xiàn)在 Statrep.nsf 中。

  會(huì)報(bào)告與性能相關(guān)的錯(cuò)誤消息,比如:

  Insufficient memory.

  Insufficient memory. NSF Folder Pool is full.

  Maximum number of memory segments that Notes can support has been exceeded.

  Network operation did not complete in a reasonable amount of time.

  Server not responding.

  注意,在服務(wù)器掛起場(chǎng)景中,NSD/RIP 是不會(huì)自動(dòng)生成的。

  導(dǎo)致服務(wù)器掛起的原因包括,資源問(wèn)題(資源不足)、第三方應(yīng)用程序沖突和硬件問(wèn)題。一般來(lái)說(shuō),服務(wù)器掛起比服務(wù)器崩潰更難分析。最后指出一點(diǎn):崩潰和掛起不只出現(xiàn)在 Domino 服務(wù)器上,也可以出現(xiàn)在 Notes 客戶機(jī)上。

  故障診斷

  在本節(jié)中,我們來(lái)看一些用于故障診斷服務(wù)器崩潰和服務(wù)器掛起的一般方法。

  故障診斷 Domino 服務(wù)器崩潰

  如果 Domino 已經(jīng)崩潰,并且不能重啟,那么從 Notes.ini 變量 Servertask 刪除任務(wù),并試圖縮小范圍和識(shí)別導(dǎo)致崩潰的任務(wù)。當(dāng)您懷疑是某個(gè)特定的任務(wù)導(dǎo)致問(wèn)題時(shí),就打開(kāi)服務(wù)器控制臺(tái),并縮小該任務(wù)產(chǎn)生的可能的錯(cuò)誤消息的范圍。例如,如果在訪問(wèn) Mail.box 中的郵件時(shí)路由器崩潰了,那么重新命名 Mail.box 并允許服務(wù)器重新創(chuàng)建 Mail.box。

  如果您懷疑問(wèn)題是已破壞的數(shù)據(jù)庫(kù)導(dǎo)致的,那么在該數(shù)據(jù)庫(kù)上運(yùn)行離線維護(hù)任務(wù)。如果崩潰是按規(guī)律發(fā)生的,那么檢查崩潰發(fā)生時(shí)服務(wù)器上執(zhí)行的動(dòng)作。

  考慮下列問(wèn)題:

  Domino 服務(wù)器向控制臺(tái)或日志文件報(bào)告錯(cuò)誤消息嗎?

  錯(cuò)誤消息的確切語(yǔ)法是什么樣的?

  錯(cuò)誤消息是哪里產(chǎn)生的?是 Domino 服務(wù)器上,還是 Notes 客戶機(jī)上?

  該問(wèn)題第一次出現(xiàn)是什么時(shí)候?

  在問(wèn)題開(kāi)始出現(xiàn)之前,最近做了更改嗎?

  故障診斷 Notes 客戶機(jī)崩潰

  首先,找出問(wèn)題是否特定于某個(gè)用戶。如果是的,就檢查該用戶的配置,并將之與其他用戶的配置進(jìn)行比較。此外,還要確定問(wèn)題發(fā)生是否歸結(jié)于訪問(wèn)某個(gè)特定的應(yīng)用程序。如果是的,就請(qǐng)一個(gè)開(kāi)發(fā)人員來(lái)檢查應(yīng)用程序。

  如果您懷疑問(wèn)題是由已破壞的數(shù)據(jù)庫(kù)或文檔導(dǎo)致的,就運(yùn)行維護(hù)任務(wù) Updall、Fixup 和 Compact(用適當(dāng)?shù)拈_(kāi)關(guān))。此外,如果您認(rèn)為問(wèn)題是由于壞的索引,那么試圖重新創(chuàng)建數(shù)據(jù)庫(kù)的全文本索引(如果可能的話)。

  故障診斷 Domino 服務(wù)器掛起

  如果常量信號(hào)量問(wèn)題出現(xiàn)在服務(wù)器控制臺(tái)上,那么檢查任務(wù)的安排是否沖突。如果系統(tǒng)響應(yīng)緩慢,那么檢查您的非-Domino 應(yīng)用程序,看它們是否也運(yùn)行緩慢。另外, 一般來(lái)說(shuō),應(yīng)該確保用所有最新的補(bǔ)丁更新了操作系統(tǒng)。

  NSD 分析

  確定讓服務(wù)器崩潰的進(jìn)程通常是解決服務(wù)器崩潰的第一步。在 Domino 6 和更高版本中,NSD 文件是一個(gè)很好的起點(diǎn)。NSD 給出服務(wù)器狀態(tài)的所有當(dāng)前信息(所有線程的調(diào)用堆棧、內(nèi)存信息,等等)。在發(fā)生崩潰時(shí),Domino 服務(wù)器將自動(dòng)生成一個(gè) NSD 日志文件,并存儲(chǔ)在 data\IBM_TECHNICAL_SUPPORT 目錄中。NSD 日志文件的文件名中帶有一個(gè)時(shí)間戳,展示了 NSD 是何時(shí)生成的。例如Nsd_W32I_KIRANTP_2006_01_17@17_17_18.log表示這個(gè) NSD 是 2006 年 1 月 17 日生成的。NSD 在運(yùn)行時(shí),會(huì)附加到每個(gè)進(jìn)程和線程,以轉(zhuǎn)儲(chǔ)調(diào)用堆棧。這有助于您確定服務(wù)器或工作站崩潰的原因。

  NSD 文件的核心是堆棧跟蹤部分。這一部分提供代碼路徑的一個(gè) breakdown,當(dāng)前存在的進(jìn)程中的每個(gè)線程要遍歷該路徑,以進(jìn)入其當(dāng)前狀態(tài)。這對(duì)于考察服務(wù)器上的掛起或崩潰場(chǎng)景非常有幫助。此外,通過(guò)檢查 NSD 文件,可以找到 Domino data 目錄中生成的任何核心文件,并進(jìn)行基本的分析,以跟蹤死去并遺留下核心文件的進(jìn)程所做調(diào)用的最終堆棧。在諸如 Domino 這樣的復(fù)雜產(chǎn)品中,兩臺(tái)不同服務(wù)器上相同類型的動(dòng)作的堆棧跟蹤可以產(chǎn)生不同的結(jié)果。

  在 NSD 文件中,通過(guò)執(zhí)行對(duì)單詞 “fatal”、“panic” 或 “segmentation” 的搜索,可以識(shí)別失敗進(jìn)程中的可執(zhí)行部分。找到進(jìn)程后,我們可以看出誰(shuí)在它之前,并有望確定崩潰是如何發(fā)生的。有時(shí),當(dāng) “panic”、“fatal” 都沒(méi)有找到時(shí),核心轉(zhuǎn)儲(chǔ)將包含對(duì)函數(shù)中 “segmentation fault” 的引用。這表明,進(jìn)程試圖訪問(wèn)因某種原因已破壞的共享內(nèi)存段,并將不調(diào)用 “fatal_error” 或 “panic” 而崩潰。

  下面是 NSD 文件的示例摘錄,其中的一個(gè)服務(wù)器進(jìn)程涉及到崩潰:

  ### FATAL THREAD 39/83 [ nSERVER:07c0: 2764]

  ### FP=0743f548, PC=60197cf3, SP=0743ebd0, stksize=2424

  Exception code: c0000005 (ACCESS_VIOLATION)

  ############################################################

  @[ 1] 0x60197cf3 nnotes._Panic@4+483(7430016,496dae76,0,496dace8)

  @[ 2] 0x600018a4 nnotes._OSBBlockAddr@8+148(1153f38,2000000,743f608,1)

  @[ 3] 0x6000bd92 nnotes._CollectionNavigate@24+610(0,743fc74,f,0)

  @[ 4] 0x600626cc nnotes._ReadEntries@68+2860(4c5440e8,4cfb8dba,800f,1)

  @[ 5] 0x600b9f6f nnotes._NIFReadEntriesExt@72+351(0,4cfb8dba,800f,1)

  @[ 6] 0x10032d40nserverl._ServerReadEntries@8+1424(0,8d0c0035,4b64b5bc,4ae46dd6)

  @[ 7] 0x100191fc nserverl._DbServer@8+2284(41b0383,cb740064,0,23696f8)

  @[ 8] 0x1002b8c8 nserverl._WorkThreadTask@8+1576 (4711d68,0,3,563fb10)

  @[ 9] 0x100016cb nserverl._Scheduler@4+763(0,563fb10,0,10ec334)

  @[10] 0x6011e5e4 nnotes._ThreadWrapper@4+212 (0,10ec334,563fb10,0)

  @[11] 0x77e887dd KERNEL32.GetModuleFileNameA+465

  當(dāng)確定了失敗進(jìn)程后,您就可以著重故障診斷這個(gè)特定的進(jìn)程了。ServerTasks

  如果一臺(tái)服務(wù)器不斷地崩潰(例如,每五分鐘一次),一個(gè)有用的故障診斷步驟是,從服務(wù)器的 Notes.ini 文件臨時(shí)刪除 ServerTasks= 行。然后,服務(wù)器可以重新啟動(dòng),任務(wù)可以單獨(dú)地加載,以確定是哪個(gè)進(jìn)程導(dǎo)致崩潰。

  Panic 消息

  當(dāng) Domino 檢測(cè)到一個(gè)內(nèi)部一致性錯(cuò)誤,或者一個(gè)可能導(dǎo)致數(shù)據(jù)破壞或其他問(wèn)題的條件時(shí),它會(huì)立即調(diào)用一個(gè)名為 Panic 的子例程。這是在代碼操作時(shí),用于不斷監(jiān)控代碼的關(guān)鍵部分的一種特殊構(gòu)造。這有助于在問(wèn)題升級(jí)并可能破壞數(shù)據(jù)之前,盡可能早地捕捉問(wèn)題。當(dāng)發(fā)生 panic 時(shí),它將導(dǎo)致系統(tǒng)停止(因此可看成是一種可控制的崩潰)。Panics 產(chǎn)生的消息,有時(shí)是英語(yǔ)形式的,有時(shí)是代碼形式的(例如,PANIC: 04:3C)。您可以將該代碼提交給 Lotus Software Technical Support,以便進(jìn)一步故障診斷。

  故障診斷工具

  本節(jié)介紹您在遇到 Domino 服務(wù)器崩潰或掛起時(shí)可用的一些故障診斷工具。在使用任何這些工具之前,請(qǐng)確保參考 Domino 管理文檔。此外,Domino 自助支持頁(yè)面 對(duì)于故障診斷信息也是一個(gè)好的資源。

  RIP(Domino R5)

  RIP 文件是在服務(wù)器崩潰時(shí)產(chǎn)生的。該文件包含關(guān)于服務(wù)器崩潰時(shí)在做什么的信息。它報(bào)告系統(tǒng)上的任何崩潰,而不只是與 Domino 有關(guān)的崩潰。RIP 文件只在 Domino 5.x 中才產(chǎn)生。在 Domino 6 和更高版本中,NSD 取代了 RIP,并且還包括 RIP 中沒(méi)有的附加功能。

  要產(chǎn)生 RIP 文件,需要將 QNC.EXE 加載到 Domino 服務(wù)器上。QNC.EXE 程序(通常叫做 “quincy”)是與 Domino 一起發(fā)布的默認(rèn)調(diào)試程序。QNC.EXE 程序通常位于 \Domino 目錄中。要啟用 QNC.EXE,請(qǐng)?jiān)诓僮飨到y(tǒng)的命令提示符下輸入 “qnc –I”。也可以通過(guò)在服務(wù)器啟動(dòng)時(shí)輸入 “qnc nserver” 啟動(dòng) QNC.EXE。如果在服務(wù)器崩潰時(shí)不生成 RIP 文件,那么請(qǐng)檢查 QNC.EXE 是否已啟用。通常,RIP 文件創(chuàng)建在 data 目錄中。

  NSD(Domino 6 和更高版本)

  如前所述,Domino 6 和更高版本提供 NSD 特性。這個(gè)文件包含關(guān)于服務(wù)器崩潰時(shí)的狀態(tài)信息。有關(guān)更多信息,請(qǐng)參閱本文前面的 “NSD 分析” 一節(jié)。

  內(nèi)存轉(zhuǎn)儲(chǔ)(Domino 6 和更高版本)

  在 Domino 6 和更高版本中,可以在服務(wù)器控制臺(tái)上使用命令 “sh memory dump” 來(lái)創(chuàng)建內(nèi)存轉(zhuǎn)儲(chǔ)文件。內(nèi)存轉(zhuǎn)儲(chǔ)文件包含關(guān)于 Domino 當(dāng)前使用的內(nèi)存的信息。這在故障診斷性能問(wèn)題和內(nèi)存泄漏時(shí)非常有用。通常,內(nèi)存轉(zhuǎn)儲(chǔ)文件位于 data\IBM_TECHNICAL_SUPPORT 目錄中。內(nèi)存轉(zhuǎn)儲(chǔ)文件名包含一個(gè)時(shí)間戳,表示生成 NSD 時(shí)的時(shí)間。例如:

  memory_KIRANTP_2005_09_14@17_50_08.dmp

  注意:要將可用內(nèi)存記錄到文件,而不是在服務(wù)器控制臺(tái)上查看它,請(qǐng)輸入下面的服務(wù)器控制臺(tái)命令: sh memory dump >memory.txt

  HTTP 請(qǐng)求日志

  為了故障診斷與 Domino Web 服務(wù)器崩潰和掛起有關(guān)的問(wèn)題,Lotus Software Technical Support 通常會(huì)要求您創(chuàng)建 HTTP 請(qǐng)求日志。要為請(qǐng)求日志啟用默認(rèn)設(shè)置,請(qǐng)編輯服務(wù)器的 Notes.ini 文件,并添加 HTTPEnableThreadDebug=1 這一行。這將 HTTP 請(qǐng)求日志記錄設(shè)置為默認(rèn)級(jí)別。(要將日志記錄級(jí)別設(shè)置為記錄更詳細(xì)的信息,請(qǐng)參閱 Domino 管理文檔。)也可以通過(guò)在 Domino 服務(wù)器控制臺(tái)輸入 “tell http debug thread on | off” 動(dòng)態(tài)地啟用 HTTP 請(qǐng)求日志記錄。啟用了 HTTP 請(qǐng)求日志記錄之后,Domino 就會(huì)創(chuàng)建一系列名為 htthr*.log 的文件,例如 htthr_a40_10_20050914@171556.log。

  HTTP 請(qǐng)求日志記錄應(yīng)該只用于故障診斷特定的問(wèn)題,并且通常是在 Lotus Software Technical Support 的指導(dǎo)和幫助下完成的。不要將請(qǐng)求日志記錄用于其他目的,比如一般管理。這些日志文件隨著時(shí)間會(huì)不斷增大,所以不應(yīng)該長(zhǎng)時(shí)間啟用該設(shè)置,否則會(huì)消耗掉所有可用的設(shè)備空間。

  Automatic Data Collection

  Notes/Domino 6.0.1 引入了自動(dòng)診斷數(shù)據(jù)收集工具,也叫做 Automatic Data Collection,或者簡(jiǎn)稱為 ADC。Automatic Data Collection 只意味著,當(dāng) Notes 客戶機(jī)或 Domino 服務(wù)器崩潰時(shí),該程序?qū)⑹占{(diào)試崩潰時(shí)必需的所有數(shù)據(jù),并在客戶機(jī)或服務(wù)器重啟時(shí)發(fā)送到一個(gè) mail-in 數(shù)據(jù)庫(kù)。然后,管理員就每個(gè)域具有一個(gè)位置,在這里,他們可以看到所有客戶機(jī)和服務(wù)器已經(jīng)發(fā)生的所有崩潰。這將有助于消除這樣的情況,即管理員或用戶在客戶機(jī)或服務(wù)器崩潰時(shí)不能捕獲適當(dāng)?shù)臄?shù)據(jù)。Notes.ini 設(shè)置

  為了故障診斷性能和崩潰問(wèn)題,您可以啟用下列 Notes.ini 調(diào)試參數(shù):

  Debug_threadid=1 記錄每個(gè)服務(wù)器操作的每個(gè)進(jìn)程和線程 ID。

  Debug_show_timeout=1 打開(kāi)到控制臺(tái)的信號(hào)量超時(shí)消息,并創(chuàng)建一個(gè)名為的 semdebug.txt 信號(hào)量文本文件。

  Debug_capture_timeout=10 給每個(gè)信號(hào)量超時(shí)消息加時(shí)間戳。

  CONSOLE_LOG_ENABLED=1 (Domino 6 和更高版本)啟用 Domino 控制臺(tái)日志記錄。

  服務(wù)器崩潰的故障恢復(fù)

  您可以將故障恢復(fù)設(shè)置為自動(dòng)處理 Domino 服務(wù)器崩潰。當(dāng)服務(wù)器崩潰時(shí),它就自動(dòng)關(guān)閉并重啟,無(wú)需任何管理員干預(yù)。Domino 將崩潰信息記錄在 data 目錄中。當(dāng)服務(wù)器重啟時(shí),Domino 檢查它是否是崩潰后重啟。如果是的,就會(huì)自動(dòng)給 “Mail Fault Notification to” 域中的人員或組發(fā)送一封電子郵件。

  重大的錯(cuò)誤(比如操作系統(tǒng)異?;騼?nèi)部 panic)終止每個(gè) Domino 進(jìn)程,并釋放所有相關(guān)的資源。啟動(dòng)腳本檢測(cè)該場(chǎng)景,并重啟服務(wù)器。如果您使用的是多服務(wù)器分區(qū),并且故障發(fā)生在單個(gè)分區(qū)中,那么只有該分區(qū)終止并重啟。

  Domino 7 中的新故障診斷特性

  本節(jié)簡(jiǎn)要介紹一些有助于您分析和糾正服務(wù)器掛起和崩潰的 Domino 7 新特性。

  Domino Domain Monitoring

  Domino 7 中的一個(gè)最重要且有用的服務(wù)器維護(hù)和故障診斷特性是 Domino Domain Monitoring (DDM)。這為監(jiān)控一個(gè)域(或多個(gè)域)中的所有服務(wù)器提供了一個(gè)中央位置。DDM 使用名為 probes 的程序來(lái)收集來(lái)自單個(gè)服務(wù)器的服務(wù)器信息,然后報(bào)告回一個(gè)特殊的數(shù)據(jù)庫(kù)(DDM.nsf),您可以在該數(shù)據(jù)庫(kù)中查看所收集的數(shù)據(jù)。這允許您從單個(gè) Domino Administrator 控制臺(tái)監(jiān)控、分析和故障診斷大量的服務(wù)器。

  Activity Trends

  Activity Trends 特性用于分析 “歷史” 服務(wù)器數(shù)據(jù),以助于發(fā)現(xiàn)只有通過(guò)很長(zhǎng)時(shí)間才能發(fā)現(xiàn)的趨勢(shì)。您可以查看該數(shù)據(jù),來(lái)幫助預(yù)計(jì)和避免未來(lái)的問(wèn)題。該數(shù)據(jù)從日志文件(Log.nsf)和 Catalog 任務(wù)收集而來(lái),并存儲(chǔ)在 Activity Trends 數(shù)據(jù)庫(kù)(Activity.nsf)中。Activity Trends Collector 任務(wù)處理該數(shù)據(jù),并產(chǎn)生 “趨勢(shì)化” 數(shù)據(jù),用于繪制圖表和平衡資源。

  將狀態(tài)條歷史寫(xiě)到日志文件

  您可以將 Notes 客戶機(jī)狀態(tài)條消息設(shè)置為記錄到本地日志文件(Log.nsf)或者您指定的外部文件。這有助于您故障診斷 Notes 客戶機(jī)崩潰。使用 Notes.ini 的設(shè)置 logstatusbar=1 將狀態(tài)條消息記錄到 Log.nsf。要查看已記錄的消息,請(qǐng)打開(kāi) Log.nsf 并點(diǎn)擊 Miscellaneous Events 視圖。狀態(tài)條消息后跟有 Status Msg。要將狀態(tài)條消息寫(xiě)到外部文件,請(qǐng)使用 Notes.ini 的設(shè)置 Debug_Outfile= 和 Notes.ini 的設(shè)置 logstatusbar=1。例如:

  logstatusbar=1

  Debug_Outfile=c:\temp\StatusBarLogging.txt

  這將狀態(tài)條消息記錄到文件 StatusBarLogging.txt。

  Log.nsf 文件也提供 Notes 客戶機(jī)崩潰之前記錄到狀態(tài)條中的動(dòng)作的一個(gè)快照。

  Fault Analyzer

  Fault Analyzer 是一個(gè)新的服務(wù)器特性,用于在所有新的崩潰被提交到 Automatic Data Collection mail-in 數(shù)據(jù)庫(kù)時(shí)對(duì)它們進(jìn)行處理。Fault Analyzer 任務(wù)搜索為 Fault Report 文檔配置的數(shù)據(jù)庫(kù),并確定堆棧是否與用戶或服務(wù)器已經(jīng)看到過(guò)的崩潰相匹配。它通過(guò)分析 Fault Report mail-in 數(shù)據(jù)庫(kù)中的調(diào)用堆棧,并分析它們以確定其中是否有相同問(wèn)題的其他情況,從而在 Automatic Data Collection 特性的基礎(chǔ)上新增了功能。

  Fault Analyzer 是在設(shè)置 Automatic Data Collection 的同時(shí)配置的。使用 Server Configuration 文檔在服務(wù)器上設(shè)置 Automatic Data Collection 和啟用或禁用 Fault Analyzer。

  如果 Fault Analyzer 找到重復(fù)的故障報(bào)告,那么新的崩潰就被報(bào)告為初始崩潰的一個(gè)響應(yīng),并且附件要么被從響應(yīng)文檔刪除以節(jié)省數(shù)據(jù)庫(kù)空間,要么用響應(yīng)文檔進(jìn)行保存。

  Automatic Data Collection 增強(qiáng)

  當(dāng)您使用 Automatic Data Collection 工具來(lái)收集有關(guān)服務(wù)器崩潰的信息時(shí),現(xiàn)在服務(wù)器被首先檢查,看它是否運(yùn)行在 Domino 之下,如果是的,就使用 Controller 日志。如果不是的,就檢查服務(wù)器是否啟用了控制臺(tái)記錄,如果是的,就使用控制臺(tái)輸出。最后,如果既沒(méi)設(shè)置 Domino Controller,也沒(méi)設(shè)置控制臺(tái)記錄,則會(huì)從 Log.nsf 中提取數(shù)據(jù)。

  現(xiàn)在您可以選擇,Automatic Data Collection 工具在客戶機(jī)或服務(wù)器上運(yùn)行時(shí),將會(huì)收集哪些文件(使用通配符)。在 Notes 客戶機(jī)上,它是使用 Desktop Policy Settings 文檔配置的。在 Domino 服務(wù)器上,它是使用 Server Configuration 文檔配置的。

  可能會(huì)出現(xiàn)這樣的情況,即 Automatic Data Collection 發(fā)送的輸出非常大。如果這成為了問(wèn)題,那么您可以配置 Automatic Data Collection,限制 NSD 發(fā)送的附件和記錄到 Fault Reports 數(shù)據(jù)庫(kù)的控制臺(tái)日志的大小。

  Shutdown Monitor

  在您發(fā)出退出或重啟服務(wù)器的命令之后,Domino 服務(wù)器通常要花很長(zhǎng)時(shí)間才能實(shí)際關(guān)閉。為了避免這一延遲,Shutdown Monitor 任務(wù)確保 Domino 在請(qǐng)求一終止時(shí)就立即終止。如果服務(wù)器不在指定的時(shí)間內(nèi)終止,那么服務(wù)器將被迫終止,并在終止之前生成一個(gè) NSD 日志。這個(gè)時(shí)間限制是在 Server 文檔的 Automatic Server Restart 部分的 Server Shutdown Timeout 域中指定的。

  默認(rèn)的 Server Shutdown Timeout 設(shè)置是 5 分鐘。可以使用 Notes.ini 的設(shè)置 shutdown_monitor_disabled=1 禁用該特性。

  Process Monitor(僅針對(duì) Windows 平臺(tái))

  Process Monitor 任務(wù)監(jiān)控應(yīng)該作為 Domino 服務(wù)器環(huán)境一部分運(yùn)行的進(jìn)程。(該任務(wù)只運(yùn)行在 Microsoft Windows 平臺(tái)上;該功能在 Domino for Unix 平臺(tái)上已實(shí)現(xiàn),無(wú)需使用單獨(dú)的服務(wù)器任務(wù)。)如果任何這些進(jìn)程缺失,或者一個(gè)進(jìn)程在沒(méi)有完成通常的 Domino 終止例程時(shí)就意外終止了,那么該任務(wù)將導(dǎo)致服務(wù)器 panic 并確定哪個(gè)進(jìn)程過(guò)早終止了。Process Monitor 任務(wù)與 Nprocmon.exe 一起工作,后者監(jiān)控 Nserver.exe 進(jìn)程的異常終止。

  該特性可以大大減少異常終止問(wèn)題出現(xiàn)的次數(shù),而這樣的問(wèn)題很難分析(因?yàn)橥ǔky以確定哪個(gè)進(jìn)程終止了并導(dǎo)致了服務(wù)器問(wèn)題)。要禁用 Process Monitor 任務(wù),請(qǐng)?jiān)诜?wù)器的 Notes.ini 文件中設(shè)置變量 process_monitor_disabled=1。

  結(jié)束語(yǔ)

  在本文中,我們定義了 Domino 服務(wù)器掛起與崩潰之間的區(qū)別。討論了在分析和修復(fù) Notes/Domino 問(wèn)題時(shí)可以使用的一些故障診斷過(guò)程和工具。還了解了 Notes/Domino 7 中引入的一些新的故障診斷特性。在 Notes 客戶機(jī)或 Domino 服務(wù)器遇到掛起或崩潰時(shí),您可以來(lái)參考這篇文章,當(dāng)然,希望您不要經(jīng)常碰到這種情況。

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)
打開(kāi)APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
Domino服務(wù)器管理notes.ini實(shí)用參數(shù)
Notes郵件系統(tǒng)管理維護(hù)及典型故障分析
Lotus]NSD is running 問(wèn)題
Domino Console Command
Lotus平臺(tái)驗(yàn)證字過(guò)期如何處理?
IPMI詳細(xì)介紹
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服