無(wú)論是多么優(yōu)秀的程序員,都難以保證自己在編寫代碼時(shí)不會(huì)出現(xiàn)任何錯(cuò)誤,因此調(diào)試是軟件開發(fā)過(guò)程中的一個(gè)必不可少的組成部分。當(dāng)程序完成編譯之后,它很 可能無(wú)法正常運(yùn)行,或者會(huì)徹底崩潰,或者不能實(shí)現(xiàn)預(yù)期的功能。此時(shí)如何通過(guò)調(diào)試找到問(wèn)題的癥結(jié)所在,就變成了擺在開發(fā)人員面前最嚴(yán)峻的問(wèn)題。通常說(shuō)來(lái),軟 件項(xiàng)目的規(guī)模越大,調(diào)試起來(lái)就會(huì)越困難,越需要一個(gè)強(qiáng)大而高效的調(diào)試器作為后盾。對(duì)于Linux程序員來(lái)講,目前可供使用的調(diào)試器非常多,GDB(GNU DeBugger)就是其中較為優(yōu)秀的。
初識(shí)GDB
GDB是自由軟件基金會(huì)(Free Software Foundation,F(xiàn)SF)的軟件工具之一。它的作用是協(xié)助程序員找到代碼中的錯(cuò)誤。如果沒(méi)有GDB的幫助,程序員要想跟蹤代碼的執(zhí)行流程,唯一的辦 法就是添加大量的語(yǔ)句來(lái)產(chǎn)生特定的輸出。但這一手段本身就可能會(huì)引入新的錯(cuò)誤,從而也就無(wú)法對(duì)那些導(dǎo)致程序崩潰的錯(cuò)誤代碼進(jìn)行分析。GDB的出現(xiàn)減輕了開 發(fā)人員的負(fù)擔(dān),他們可以在程序運(yùn)行的時(shí)候單步跟蹤自己的代碼,或者通過(guò)斷點(diǎn)暫時(shí)中止程序的執(zhí)行。此外,他們還能夠隨時(shí)察看變量和內(nèi)存的當(dāng)前狀態(tài),并監(jiān)視關(guān) 鍵的數(shù)據(jù)結(jié)構(gòu)是如何影響代碼運(yùn)行的。
調(diào)試方法
如果想對(duì)程序進(jìn)行調(diào)試,必須先在用GCC編譯源代碼時(shí)加上-g選項(xiàng),以便產(chǎn)生GDB所需要的調(diào)試符號(hào)信息。例如,debugme.c是一個(gè)存在錯(cuò)誤程序,可以使用如下的命令對(duì)其進(jìn)行編譯,同時(shí)產(chǎn)生調(diào)試符號(hào):
# gcc -g debugme.c -o debugme
如果愿意的話,還可以在編譯時(shí)使用“-ggdb”選項(xiàng)來(lái)生成更多的調(diào)試信息。由于這些調(diào)試信息中的相當(dāng)一部分是GDB所特有的,所以生成的代碼將無(wú)法在 其它調(diào)試器中正常調(diào)試。對(duì)于大多數(shù)情況來(lái)說(shuō),普通的-g選項(xiàng)就足夠了。需要注意的是,GCC雖然允許同時(shí)使用-g(調(diào)試)和-o(優(yōu)化)選項(xiàng),但優(yōu)化會(huì)影 響最終生成的代碼,導(dǎo)致程序源代碼和二進(jìn)制代碼之間的關(guān)系變得復(fù)雜起來(lái)。如果不想為調(diào)試制造障礙,建議不要將-g和-o選項(xiàng)一同使用,并且只在程序徹底調(diào) 試完后才開始進(jìn)行代碼優(yōu)化。這樣調(diào)試過(guò)程將變得相對(duì)輕松和愉快。
基本應(yīng)用
現(xiàn)在可以啟動(dòng)GDB來(lái)調(diào)試已經(jīng)生成的可執(zhí)行程序debugme,命令如下:
# gdb debugme
GNU gdb Red Hat Linux (5.3post-0.20021129.18rh)
……
(gdb)
如果一切正常,GDB將被啟動(dòng)并在屏幕上輸出版權(quán)信息,但如果使用了-q或--quiet選項(xiàng)則不會(huì)顯示它們。啟動(dòng)GDB時(shí)另外一個(gè)有用的命令行選項(xiàng)是“-d dirname”,其中dirname是一個(gè)目錄名。該目錄名告訴GDB應(yīng)該到哪里去尋找源代碼。
一旦出現(xiàn)GDB的命令提示符(gdb),就表明GDB已經(jīng)準(zhǔn)備好接收來(lái)自用戶的各種調(diào)試命令了。如果想在調(diào)試環(huán)境下運(yùn)行這個(gè)程序,可以使用GDB提供的 “run”命令,而程序在正常運(yùn)行時(shí)所需的各種參數(shù)可以作為“run”命令的參數(shù)傳入,或者使用單獨(dú)的“set args”命令進(jìn)行設(shè)置。如果在執(zhí)行“run”命令時(shí)沒(méi)有給出任何參數(shù),GDB將使用上一次“run”或“set args”命令指定的參數(shù)。如果想取消上次設(shè)置的參數(shù),可以執(zhí)行不帶任何參數(shù)的“set args”命令。下面嘗試在調(diào)試器中運(yùn)行這個(gè)程序:
(gdb) run
……
Program received signal SIGSEGV, Segmentation fault.
0x4000c6ac in _dl_fini () from /lib/ld-linux.so.2
最后一行輸出表明程序在調(diào)用動(dòng)態(tài)鏈接庫(kù)/lib/ld-linux.so.2中的_dl_fini()函數(shù)時(shí)出現(xiàn)了錯(cuò)誤,地址是0x4000c6ac。 這些對(duì)調(diào)試是非常重要的線索。另外還有一種信息對(duì)調(diào)試也很重要,就是錯(cuò)誤發(fā)生時(shí)的函數(shù)調(diào)用層級(jí)關(guān)系,可以通過(guò)執(zhí)行“backtrace”命令來(lái)獲得。在使 用GDB調(diào)試命令時(shí),用戶可以不必輸入完整的命令名稱,使用任何惟一的縮寫都可以。例如“backtrace”命令就可以縮寫成“back”甚至 “bt”。GDB還支持很多常用的Shell命令編輯特征,比如可以像在bash或tcsh中那樣按Tab鍵補(bǔ)齊命令。如果相關(guān)命令不惟一的話,則列出所 有可能的匹配項(xiàng)。此外鍵盤上的方向鍵可用來(lái)翻動(dòng)歷史命令。
GDB是一個(gè)源代碼級(jí)的調(diào)試器,使用“list”命令可以查看當(dāng)前調(diào)試對(duì)象的源代碼。該命令的通用格式為“list [m,n]”,表示顯示從m行開始到n行結(jié)束的代碼段,而不帶任何參數(shù)的“list”命令將顯示最近10行源代碼。
設(shè)置斷點(diǎn)
在調(diào)試有問(wèn)題的代碼時(shí),在某一點(diǎn)停止運(yùn)行往往很管用。這樣程序運(yùn)行到此外時(shí)會(huì)暫時(shí)掛起,等待用戶的進(jìn)一步輸入。GDB允許在幾種不同的代碼結(jié)構(gòu)上設(shè)置斷 點(diǎn),包括行號(hào)和函數(shù)名等,并且還允許設(shè)置條件斷點(diǎn),讓程序只有在滿足一定的條件時(shí)才停止執(zhí)行。要根據(jù)行號(hào)設(shè)置斷點(diǎn),可以使用“ break linenum”命令。要根據(jù)函數(shù)名設(shè)置斷點(diǎn),則應(yīng)該使用“break funcname”命令。
在以上兩種情況中,GDB將在 執(zhí)行指定的行號(hào)或進(jìn)入指定的函數(shù)之前停止執(zhí)行程序。此時(shí)可以使用“print”顯示變量的值,或者使用“list”查看將要執(zhí)行的代碼。對(duì)于由多個(gè)源文件 組成的項(xiàng)目,如果想在執(zhí)行到非當(dāng)前源文件的某行或某個(gè)函數(shù)時(shí)停止執(zhí)行,可以使用如下形式的命令:
# break filename:linenum
# break filename:funcname
條件斷點(diǎn)允許當(dāng)一定條件滿足時(shí)暫時(shí)停止程序的執(zhí)行。它對(duì)于調(diào)試來(lái)講非常有用。設(shè)置條件斷點(diǎn)的正確語(yǔ)法如下:
break linenum if expr
break funcname if expr
其中expr是一個(gè)邏輯表達(dá)式。當(dāng)該表達(dá)式的值為真時(shí),程序?qū)⒃谠摂帱c(diǎn)處暫時(shí)掛起。例如,下面的命令將在debugme程序的第38行設(shè)置一個(gè)條件斷點(diǎn)。當(dāng)程序運(yùn)行到該行時(shí),如果count的值等于3,就將暫時(shí)停止執(zhí)行:
(gdb) break 38 if count==3
設(shè)置斷點(diǎn)是調(diào)試程序時(shí)最常用到的一種手段。它可以中斷程序的運(yùn)行,給程序員一個(gè)單步跟蹤的機(jī)會(huì)。使用命令“ break main”在main函數(shù)上設(shè)置斷點(diǎn)可以在程序啟動(dòng)時(shí)就開始進(jìn)行跟蹤。
接下去使用“continue”命令繼續(xù)執(zhí)行程序,直到遇到下一個(gè)斷點(diǎn)。如果在調(diào)試時(shí)設(shè)置了很多斷點(diǎn),可以隨時(shí)使用“info breakpoints”命令來(lái)查看設(shè)置的斷點(diǎn)。此外,開發(fā)人員還可以使用“delete”命令刪除斷點(diǎn),或者使用“disable”命令來(lái)使設(shè)置的斷點(diǎn) 暫時(shí)無(wú)效。被設(shè)置為無(wú)效的斷點(diǎn)在需要的時(shí)候可以用“enable”命令使其重新生效。
觀察變量
GDB最有用的特性之 一是能夠顯示被調(diào)試程序中幾乎任何表達(dá)式、變量或數(shù)組的類型和值,并且能夠用編寫程序所用的語(yǔ)言打印出任何合法表達(dá)式的值。查看數(shù)據(jù)最簡(jiǎn)單的辦法是使用 “print”命令,只需在“print”命令后面加上變量表達(dá)式,就可以打印出此變量表達(dá)式的當(dāng)前值,示例如下:
(gdb) print str
$1 = 0x40015360 "Happy new year!\n"
從輸出信息中可以看出,輸入字符串被正確地存儲(chǔ)在了字符指針str所指向的內(nèi)存緩沖區(qū)中。除了給出變量表達(dá)式的值外,“print”命令的輸出信息中還 包含變量標(biāo)號(hào)($1)和對(duì)應(yīng)的內(nèi)存地址(0x40015360)。變量標(biāo)號(hào)保存著被檢查數(shù)值的歷史記錄,如果此后還想訪問(wèn)這些值,就可以直接使用別名而不 用重新輸入變量表達(dá)式。
如果想知道變量的類型,可以使用“whatis”命令,示例如下:
(gdb) whatis str
type = char *
對(duì)于第一次調(diào)試別人的代碼,或者面對(duì)的是一個(gè)異常復(fù)雜的系統(tǒng)時(shí),“whatis”命令的作用不容忽視。
單步執(zhí)行
為了單步跟蹤代碼,可以使用單步跟蹤命令“step”,它每次執(zhí)行源代碼中的一行。
在GDB中可以使用許多方法來(lái)簡(jiǎn)化操作,除了可以將“step”命令簡(jiǎn)化為“s”之外,還可以直接輸入回車鍵來(lái)重復(fù)執(zhí)行前面一條命令。
除了可以用“step”命令來(lái)單步運(yùn)行程序之外,GDB還提供了另外一條單步調(diào)試命令“next”。兩者功能非常相似,差別在于如果將要被執(zhí)行的代碼行中包含函數(shù)調(diào)用,使用step命令將跟蹤進(jìn)入函數(shù)體內(nèi),而使用next命令則不進(jìn)入函數(shù)體內(nèi)。
在進(jìn)入下一部分之前,使用下面的命令退出GDB:
(gdb) quit
分析核心(core)文件
在程序發(fā)生崩潰時(shí),有時(shí)可能無(wú)法直接運(yùn)行GDB來(lái)進(jìn)行調(diào)試。比如程序可能是在另外一臺(tái)機(jī)器上運(yùn)行的,或者因?yàn)槌绦驅(qū)r(shí)間比較敏感,所以手動(dòng)跟蹤調(diào)試會(huì)產(chǎn) 生無(wú)法接受的延遲等。遇到這些情況,就只能等到程序運(yùn)行結(jié)束后才能判斷崩潰的原因了。這時(shí)需要用到Linux提供的core dump機(jī)制。當(dāng)程序中出現(xiàn)內(nèi)存操作錯(cuò)誤時(shí),會(huì)發(fā)生崩潰并產(chǎn)生核心文件。使用GDB可以對(duì)產(chǎn)生的核心文件進(jìn)行分析,找出程序是在什么時(shí)候崩潰的和在崩潰之 前程序都做了些什么。當(dāng)然,如果要用GDB來(lái)分析核心文件,也必須在編譯時(shí)加上-g選項(xiàng)來(lái)產(chǎn)生調(diào)試符號(hào)表。
在分析核心文件之前必須確認(rèn)系統(tǒng)是否允許生成核心文件,很多Linux發(fā)行版在默認(rèn)時(shí)禁止生成核心文件。為了生成核心文件,首先必須執(zhí)行下面的命令:
# ulimit -c unlimited
然后就可以生成核心文件了。這里仍以前面的debugme程序?yàn)槔?,再次?zhí)行下面命令將產(chǎn)生核心文件:
# ./debugme
Enter a string to count words:Happy new year!
The number of words is 3.
Segmentation fault (core dumped)
生成的核心文件名根據(jù)系統(tǒng)配置的不同會(huì)有所差異。要在GDB中分析核心文件,除了要給出核心文件的文件名外,還必須給出生成該核心文件的可執(zhí)行程序的名稱,示例如下:
#gdb debugme core.547
……
Program terminated with signal 11, Segmentation fault.
Reading symbols from /lib/libc.so.6...done.
……
從GDB的輸出信息中可以看出,產(chǎn)生這個(gè)核心文件的原因是因?yàn)槌绦蚴盏搅诵蛱?hào)為11的信號(hào)。如果想知道程序在崩潰之前運(yùn)行到了哪里,可以使用“backtrace”或“info stack”命令查看一下堆棧的歷史記錄。示例如下:
(gdb) info stack
#0 0x4000c6ac in _dl_fini () from /lib/ld-linux.so.2
#1 0x40057940 in exit () from /lib/libc.so.6
#2 0x4004291f in _libc_start_main () from /lib/libc.so.6
由上可知,程序崩潰時(shí)正處于_dl_fini()函數(shù)之中。但很多時(shí)候程序員感興趣的可能并不是這個(gè),而是exit()或 _libc_start_main()函數(shù),因?yàn)樗鼈儾趴赡苁菃?wèn)題真正的癥結(jié)所在。GDB提供的“frame”命令可以用來(lái)在不同的調(diào)用上下文中切換。例 如下面的命令可以查看exit()函數(shù)在執(zhí)行時(shí)的狀況:
(gdb) frame 1
#1 0x40057940 in exit () from /lib/libc.so.6
此外還可以用“up”或“down”命令在不同的函數(shù)調(diào)用上下文中切換。開發(fā)人員使用這三條命令可以很輕松地實(shí)現(xiàn)調(diào)用棧的遍歷。在分析核心文件時(shí),通過(guò)將遍歷棧的命令和檢查變量值的“print”命令結(jié)合起來(lái),就能夠復(fù)原程序運(yùn)行時(shí)的全部景象。
調(diào)試其它進(jìn)程
有時(shí)會(huì)遇到一種很特殊的調(diào)試需求,對(duì)當(dāng)前正在運(yùn)行的其它進(jìn)程進(jìn)行調(diào)試。這種情況有可能發(fā)生在那些無(wú)法直接在調(diào)試器中運(yùn)行的進(jìn)程身上,例如有的進(jìn)程只能在 系統(tǒng)啟動(dòng)時(shí)運(yùn)行。另外如果需要對(duì)進(jìn)程產(chǎn)生的子進(jìn)程進(jìn)行調(diào)試的話,也只能采用這種方式。GDB可以對(duì)正在執(zhí)行的程序進(jìn)行調(diào)度,它允許開發(fā)人員中斷程序并查看 其狀態(tài),之后還能讓這個(gè)程序正常地繼續(xù)執(zhí)行。
GDB提供了兩種方式來(lái)調(diào)試正在運(yùn)行的進(jìn)程:一種是在GDB命令行上指定進(jìn)程的PID,另一種是在GDB中使用“attach”命令。例如,開發(fā)人員可以先啟動(dòng)debugme程序,讓其開始等待用戶的輸入。示例如下:
#./debugme
Enter a string to count words:
接下去在另一個(gè)虛擬控制臺(tái)中用下面的命令查出該進(jìn)程對(duì)應(yīng)的進(jìn)程號(hào):
# ps -ax | grep debugme
555 pts/1 S 0:00 ./debugme
得到進(jìn)程的PID后,就可以使用GDB對(duì)其進(jìn)行調(diào)試了:
# gdb debugme 555
GNU gdb Red Hat Linux (5.3post-0.20021129.18rh)
Attaching to program: /home/xiaowp/debugme, process 555
Reading symbols from /lib/libc.so.6...done.
……
在上面的輸出信息中,以Attaching to program開始的行表明GDB已經(jīng)成功地附加在PID為555的進(jìn)程上了。另外一種連接到其它進(jìn)程的方法是先用file命令加載調(diào)試時(shí)所需的符號(hào)表,然后再通過(guò)“attaché”命令進(jìn)行連接:
(gdb) file /home/xiaowp/debugme
Reading symbols from /home/xiaowp/debugme...done.
(gdb) attach 555
……
如果想知道程序現(xiàn)在運(yùn)行到了哪里,同樣可以使用“backtrace”命令。當(dāng)然也可以使用“step”命令對(duì)程序進(jìn)行單步調(diào)試。
在完成調(diào)試之后,不要忘記用detach命令斷開連接,讓被調(diào)試的進(jìn)程可以繼續(xù)正常運(yùn)行:
GDB是Linux下一個(gè)最基本的調(diào)試器,其功能非常豐富。完整地介紹GDB的功能可能需要幾百頁(yè),本文只涵蓋了GDB的一些最常見(jiàn)的用法。作為一個(gè)合格的Linux程序員,花在GDB上的功夫和時(shí)間越多,從調(diào)試中獲得的益處就越多。