from:http://www.ibm.com/developerworks/cn/db2/library/techarticles/dm-0602jiangt/
級(jí)別: 初級(jí)
DB2 UDB通過鎖來完成應(yīng)用程序的并發(fā)性控制,而應(yīng)用程序的并發(fā)性可以有效地保證數(shù)據(jù)的完整性和一致性,同時(shí)大大提高應(yīng)用程序的執(zhí)行效率。但是,由于應(yīng)用程序設(shè)計(jì),代碼編寫或者數(shù)據(jù)庫(kù)設(shè)計(jì)方面的不足,多數(shù)數(shù)據(jù)庫(kù)應(yīng)用程序都經(jīng)歷過鎖升級(jí),甚至死鎖的現(xiàn)象。這大大降低了應(yīng)用程序的并發(fā)性能,嚴(yán)重影響了用戶對(duì)于產(chǎn)品的滿意程度。本文通過實(shí)例幫助用戶了解如何在DB2 UDB中監(jiān)控死鎖的發(fā)生以及分析監(jiān)控的結(jié)果,從而提出了幾個(gè)最佳的實(shí)踐和規(guī)則,最大可能地避免鎖升級(jí)和死鎖的發(fā)生。
序言
本文的目的就是通過詳細(xì)的實(shí)例來闡述如何在DB2 UDB 中監(jiān)控死鎖的發(fā)生。在DB2 UDB中有兩種類型的監(jiān)控器:快照監(jiān)控器和事件監(jiān)控器。快照顧名思義就是數(shù)據(jù)庫(kù)連續(xù)狀態(tài)下的一個(gè)切面,通過快照監(jiān)控器,你可以很方便地查看當(dāng)前連接的應(yīng)用程序,當(dāng)前等待的鎖,當(dāng)前的死鎖,以及正在執(zhí)行的SQL語(yǔ)句,同時(shí)你可以查看緩沖區(qū),表和表空間的用法。如果保存歷史數(shù)據(jù),并且能夠做出比較,對(duì)于分析數(shù)據(jù)庫(kù)的并發(fā)性能有很大的幫助。
但是我們并不能預(yù)測(cè)什么時(shí)候發(fā)生死鎖,所以如果有一個(gè)后臺(tái)程序能夠一直監(jiān)控?cái)?shù)據(jù)庫(kù)的活動(dòng),記錄下所有的死鎖事件,這對(duì)于數(shù)據(jù)庫(kù)管理員來說是非常重要的。DB2 UDB提供了事件監(jiān)控器。通過不遺漏地獲得一段時(shí)間內(nèi)所有的數(shù)據(jù)庫(kù)事件(在本文中只關(guān)心其中的死鎖事件),事件監(jiān)控器提供了一種可以分析歷史數(shù)據(jù)(本文的重點(diǎn)),預(yù)測(cè)將來趨勢(shì)的可能。DB2 UDB同時(shí)提供了DB2 Performance Expert (DB2/PE) 或者類似的程序用來生成分析報(bào)表,不過這已經(jīng)超出了本文的范疇。
常用術(shù)語(yǔ)
鎖是控制應(yīng)用程序并發(fā)的數(shù)據(jù)庫(kù)軟件機(jī)制,鎖用來防止以下情況的發(fā)生:
1. 丟失以前更新
2. 不可重復(fù)讀取
3. 訪問未提交數(shù)據(jù)
鎖的模式包括共享鎖和排他鎖,共享鎖允許其他程序讀取已經(jīng)被其他共享鎖占用的資源,所以也叫讀鎖,排他鎖意味著在釋放資源以前其他的應(yīng)用程序無法訪問同一資源,所以也叫寫鎖。此外,DB2 UDB 還提供了不同的鎖級(jí)別,不同的應(yīng)用程序可能會(huì)要求訪問不同范圍的數(shù)據(jù),鎖級(jí)別有利于充分利用系統(tǒng)資源,提高系統(tǒng)性能。若一個(gè)應(yīng)用程序請(qǐng)求一個(gè)鎖,而該鎖被另外一個(gè)應(yīng)用程序所使用且不能共享,DB2 UDB 就會(huì)掛起前一個(gè)應(yīng)用程序。鎖升級(jí)就是當(dāng)LOCKLIST (LOCKLIST代表鎖能夠占用的內(nèi)存空間) 耗盡或者一個(gè)應(yīng)用程序所擁有的鎖大于MAXLOCKS*LOCKLIST的時(shí)候(MAXLOCKS 代表應(yīng)用程序所擁有的鎖占所空間的百分比),DB2 UDB 就試圖把幾個(gè)行級(jí)別的鎖合并為一個(gè)表級(jí)別的鎖,從而釋放鎖空間。雖然鎖升級(jí)本身并不耗費(fèi)多少時(shí)間,但是鎖住整個(gè)表通常會(huì)大大地降低并發(fā)性能。
當(dāng)應(yīng)用程序處于掛起狀態(tài)超過了一段規(guī)定的時(shí)間后,DB2 UDB就會(huì)自動(dòng)中止這個(gè)應(yīng)用程序,同時(shí)會(huì)向SQLCA發(fā)送描述性的錯(cuò)誤信息。當(dāng)兩個(gè)或者更多的應(yīng)用程序都持有另外一個(gè)應(yīng)用程序所需資源上的鎖,沒有這些資源,那些應(yīng)用程序都無法繼續(xù)完成其工作的時(shí)候,就會(huì)發(fā)生死鎖。
在DLCHKTIME超時(shí)之后,DB2 UDB會(huì)中止發(fā)生死鎖的某個(gè)應(yīng)用程序(通常為所做工作最少的那個(gè)應(yīng)用程序),這會(huì)釋放這個(gè)應(yīng)用程序所持有的所有的鎖,并允許別的應(yīng)用程序繼續(xù)工作,DB2 UDB 將向被終止的應(yīng)用程序的SQLCA發(fā)送描述性的錯(cuò)誤信息。LOCKTIMEOUT 指定一個(gè)應(yīng)用程序被允許的鎖等待的時(shí)間,這將避免全局的死鎖從而導(dǎo)致整個(gè)應(yīng)用崩潰。如果LOCKTIMEOUT 的值為-1,應(yīng)用程序會(huì)等待直到該鎖被釋放或者發(fā)生一個(gè)死鎖。
事件監(jiān)控器
事件監(jiān)控器用來收集當(dāng)一個(gè)數(shù)據(jù)庫(kù)事件發(fā)生時(shí)所關(guān)聯(lián)的應(yīng)用程序的信息。這里的事件指,連接,死鎖,聲明和事務(wù)。你可以定義你想監(jiān)控的事件類型的監(jiān)控器。比如說,一個(gè)死鎖監(jiān)控器就是用來監(jiān)控死鎖的發(fā)生。
在DB2 UDB 中存在兩種和死鎖有關(guān)的事件類型:
DEADLOCKS
記錄簡(jiǎn)單的應(yīng)用程序信息。
DEADLOCKS WITH DETAILS
記錄所有復(fù)雜的信息,包括應(yīng)用程序、執(zhí)行語(yǔ)句聲明以及死鎖的詳細(xì)信息。但是使用這種事件監(jiān)控器會(huì)因?yàn)樾枰玫酱罅款~外的信息而降低系統(tǒng)的性能。
如何監(jiān)控死鎖
為了詳細(xì)說明事件監(jiān)控器在死鎖監(jiān)控中的用途,我引入了一個(gè)簡(jiǎn)單的死鎖場(chǎng)景來觸發(fā)一個(gè)死鎖,在隨后的章節(jié),我會(huì)告訴讀者如何分析監(jiān)控結(jié)果以及根據(jù)結(jié)果來避免死鎖的發(fā)生。
這里我們需要至少三個(gè)應(yīng)用程序來調(diào)用DB2 CLI,一個(gè)用來監(jiān)控死鎖的發(fā)生,另外兩個(gè)用來產(chǎn)生死鎖。我們可以使用DB2 UDB 安裝時(shí)附帶的SAMPLE數(shù)據(jù)庫(kù)。
1. 首先建立一個(gè)死鎖事件監(jiān)控器
Session Monitor
db2 connect to sample
db2 "create event monitor dlmon for tables, deadlocks with details write to file 'C:\dlmon'"
mkdir C:\dlmon
db2 "set event monitor dlmon state 1"
2. 用另外兩個(gè)應(yīng)用程序來產(chǎn)生一個(gè)死鎖
Session A
db2 connect to sample
db2 +c "insert into employee values('000350', 'Truman', 'I', 'Jiang', 'B00', '5892',
'1999-02-21', 'Engineer', 19, 'M', '1978-06-17', 60000, 2000, 6000)"
現(xiàn)在應(yīng)用程序A就擁有了一個(gè)EMPLOYEE表的行級(jí)別的排他鎖
(注: +c 代表不自動(dòng)提交SQL語(yǔ)句,DB2 中 autocommit 是缺省設(shè)置,也可以通過 db2 update command options using c off 關(guān)閉該缺省選項(xiàng)。)
Session B
db2 connect to sample
db2 +c "insert into project values('AD3300', 'Dead Lock Monitor', 'B00', '000350', 7.00,
'1982-07-21', '1983-02-03', 'AD3111')"
現(xiàn)在應(yīng)用程序B就擁有了一個(gè)PROJECT表的行級(jí)別的排他鎖
Session A
db2 +c "select projname from project"
應(yīng)用程序A需要PROJECT表上所有行的共享鎖,但是因?yàn)镻ROJECT表正在被應(yīng)用程序B以排他鎖的形式獨(dú)占,這時(shí)候應(yīng)用程序1就進(jìn)入一個(gè)鎖等待的狀態(tài)。
Session B
db2 +c "select firstnme from employee"
應(yīng)用程序B也進(jìn)入一個(gè)鎖等待的狀態(tài)。此時(shí)就出現(xiàn)了一個(gè)死鎖狀態(tài)。
3.兩個(gè)本身處于鎖等待并且占有資源的應(yīng)用程序互相等待另外一方所持有的資源,這時(shí)候Session A和Session B就出現(xiàn)了死鎖狀態(tài),這種狀態(tài)一直會(huì)延續(xù)直到死鎖檢查器(超出DLCHKTIME時(shí)間以后)檢查出一個(gè)死鎖并且回滾其中的一個(gè)事務(wù)。
Session B
SQLN0991N 因?yàn)樗梨i或者超時(shí),當(dāng)前事務(wù)已經(jīng)被回滾。原因碼為 "2". SQLSTATE=40001
這時(shí)候死鎖事件監(jiān)控器就會(huì)記錄這個(gè)死鎖,同時(shí)應(yīng)用程序A可以完成他的工作。
Session A
PROJNAME
----------------------------------------
……
20 條記錄已選擇
Session A
db2 connect reset
Session B
db2 connect reset
4. 通過 db2evmon 工具可以獲得死鎖信息的日志,并且把日志文件導(dǎo)入到本地機(jī)器的文件系統(tǒng)當(dāng)中。在下面一節(jié),我們將詳細(xì)分析導(dǎo)出的日志文件。
--------------------------------------------------------------------------
……
--------------------------------------------------------------------------
--------------------------------------------------------------------------
--------------------------------------------------------------------------
3) Deadlock Event ...
4) Connection Header Event ...
5) Deadlocked Connection ...
Text
(產(chǎn)生B共享鎖的SQL語(yǔ)句)