一、數(shù)據(jù)傳輸指令
───────────────────────────────────────
它們在存貯器和寄存器、寄存器和輸入輸出端口之間傳送數(shù)據(jù).
1. 通用數(shù)據(jù)傳送指令.
MOV 傳送字或字節(jié).
MOVSX 先符號擴(kuò)展,再傳送.
MOVZX 先零擴(kuò)展,再傳送.
PUSH 把字壓入堆棧.
POP 把字彈出堆棧.
PUSHA 把AX,CX,DX,BX,SP,BP,SI,DI依次壓入堆棧.
POPA 把DI,SI,BP,SP,BX,DX,CX,AX依次彈出堆棧.
PUSHAD 把EAX,ECX,EDX, EBX,ESP,EBP,ESI,EDI依次壓入堆棧.
POPAD 把EDI,ESI,EBP,ESP,EBX,EDX, ECX,EAX依次彈出堆棧.
BSWAP 交換32位寄存器里字節(jié)的順序
XCHG 交換字或字節(jié).( 至少有一個操作數(shù)為寄存器,段寄存器不可作為操作數(shù))
CMPXCHG 比較并交換操作數(shù).( 第二個操作數(shù)必須為累加器AL/AX/EAX )
XADD 先交換再累加.( 結(jié)果在第一個操作數(shù)里 )
XLAT 字節(jié)查表轉(zhuǎn)換.
── BX 指向一張 256 字節(jié)的表的起點, AL 為表的索引值 (0-255,即
0-FFH); 返回 AL 為查表結(jié)果. ( [BX+AL]->AL )
2. 輸入輸出端口傳送指令.
IN I/O端口輸入. ( 語法: IN 累加器, {端口號│DX} )
OUT I/O端口輸出. ( 語法: OUT {端口號│DX},累加器 )
輸入輸出端口由立即方式指定時, 其范圍是 0-255; 由寄存器 DX 指定時,
其范圍是 0-65535.
3. 目的地址傳送指令.
LEA 裝入有效地址.
例: LEA DX,string ;把偏移地址存到DX.
LDS 傳送目標(biāo)指針,把指針內(nèi)容裝入DS.
例: LDS SI,string ;把段地址:偏移地址存到DS:SI.
LES 傳送目標(biāo)指針,把指針內(nèi)容裝入ES.
例: LES DI,string ;把段地址:偏移地址存到ES:DI.
LFS 傳送目標(biāo)指針,把指針內(nèi)容裝入FS.
例: LFS DI,string ;把段地址:偏移地址存到FS:DI.
LGS 傳送目標(biāo)指針,把指針內(nèi)容裝入GS.
例: LGS DI,string ;把段地址:偏移地址存到GS:DI.
LSS 傳送目標(biāo)指針,把指針內(nèi)容裝入SS.
例: LSS DI,string ;把段地址:偏移地址存到SS:DI.
4. 標(biāo)志傳送指令.
LAHF 標(biāo)志寄存器傳送,把標(biāo)志裝入AH.
SAHF 標(biāo)志寄存器傳送,把 AH內(nèi)容裝入標(biāo)志寄存器.
PUSHF 標(biāo)志入棧.
POPF 標(biāo)志出棧.
PUSHD 32位標(biāo)志入棧.
POPD 32位標(biāo)志出棧.
二、算術(shù)運算指令
───────────────────────────────────────
ADD 加法.
ADC 帶進(jìn)位加法.
INC 加 1.
AAA 加法的ASCII碼調(diào)整.
DAA 加法的十進(jìn)制調(diào)整.
SUB 減法.
SBB 帶借位減法.
DEC 減 1.
NEC 求反(以 0 減之).
CMP 比較.(兩操作數(shù)作減法,僅修改標(biāo)志位,不回送結(jié)果).
AAS 減法的 ASCII碼調(diào)整.
DAS 減法的十進(jìn)制調(diào)整.
MUL 無符號乘法.
IMUL 整數(shù)乘法.
以上兩條,結(jié)果回送AH和AL(字節(jié)運算),或DX和AX(字運算),
AAM 乘法的ASCII碼調(diào)整.
DIV 無符號除法.
IDIV 整數(shù)除法.
以上兩條,結(jié)果回送:
商回送AL,余數(shù)回送AH, (字節(jié)運算);
或 商回送AX,余數(shù)回送DX, (字運算).
AAD 除法的ASCII碼調(diào)整.
CBW 字節(jié)轉(zhuǎn)換為字. (把AL中字節(jié)的符號擴(kuò)展到AH中去)
CWD 字轉(zhuǎn)換為雙字. (把AX中的字的符號擴(kuò)展到DX中去)
CWDE 字轉(zhuǎn)換為雙字. (把AX中的字符號擴(kuò)展到EAX中去)
CDQ 雙字?jǐn)U展. (把EAX中的字的符號擴(kuò)展到EDX中去)
三、邏輯運算指令
───────────────────────────────────────
AND 與運算.
OR 或運算.
XOR 異或運算.
NOT 取反.
TEST 測試.(兩操作數(shù)作與運算,僅修改標(biāo)志位,不回送結(jié)果).
SHL 邏輯左移.
SAL 算術(shù)左移.(=SHL)
SHR 邏輯右移.
SAR 算術(shù)右移.(=SHR)
ROL 循環(huán)左移.
ROR 循環(huán)右移.
RCL 通過進(jìn)位的循環(huán)左移.
RCR 通過進(jìn)位的循環(huán)右移.
以上八種移位指令,其移位次數(shù)可達(dá)255次.
移位一次時, 可直接用操作碼. 如 SHL AX,1.
移位>1次時, 則由寄存器CL給出移位次數(shù).
如 MOV CL,04
SHL AX,CL
四、串指令
───────────────────────────────────────
DS:SI 源串段寄存器 :源串變址.
ES:DI 目標(biāo)串段寄存器:目標(biāo)串變址.
CX 重復(fù)次數(shù)計數(shù)器.
AL/AX 掃描值.
D標(biāo)志 0表示重復(fù)操作中SI和DI應(yīng)自動增量; 1表示應(yīng)自動減量.
Z標(biāo)志 用來控制掃描或比較操作的結(jié)束.
MOVS 串傳送.
( MOVSB 傳送字符. MOVSW 傳送字. MOVSD 傳送雙字. )
CMPS 串比較.
( CMPSB 比較字符. CMPSW 比較字. )
SCAS 串掃描.
把AL或AX的內(nèi)容與目標(biāo)串作比較,比較結(jié)果反映在標(biāo)志位.
LODS 裝入串.
把源串中的元素(字或字節(jié))逐一裝入AL或AX中.
( LODSB 傳送字符. LODSW 傳送字. LODSD 傳送雙字. )
STOS 保存串.
是LODS的逆過程.
REP 當(dāng)CX/ECX<>0時重復(fù).
REPE/REPZ 當(dāng)ZF=1或比較結(jié)果相等,且 CX/ECX<>0時重復(fù).
REPNE/REPNZ 當(dāng)ZF=0或比較結(jié)果不相等,且 CX/ECX<>0時重復(fù).
REPC 當(dāng)CF=1且CX/ECX< >0時重復(fù).
REPNC 當(dāng)CF=0且CX/ECX<>0時重復(fù).
五、程序轉(zhuǎn)移指令
───────────────────────────────────────
1>無條件轉(zhuǎn)移指令 (長轉(zhuǎn)移)
JMP 無條件轉(zhuǎn)移指令
CALL 過程調(diào)用
RET/RETF過程返回.
2>條件轉(zhuǎn)移指令 (短轉(zhuǎn)移,-128到+127的距離內(nèi))
( 當(dāng)且僅當(dāng)(SF XOR OF)=1時,OP1<OP2 )
JA/JNBE 不小于或不等于時轉(zhuǎn)移.
JAE/JNB 大于或等于轉(zhuǎn)移.
JB/JNAE 小于轉(zhuǎn)移.
JBE/JNA 小于或等于轉(zhuǎn)移.
以上四條,測試無符號整數(shù)運算的結(jié)果(標(biāo)志C和Z).
JG/JNLE 大于轉(zhuǎn)移.
JGE/JNL 大于或等于轉(zhuǎn)移.
JL/JNGE 小于轉(zhuǎn)移.
JLE/JNG 小于或等于轉(zhuǎn)移.
以上四條,測試帶符號整數(shù)運算的結(jié)果(標(biāo)志S,O和Z).
JE/JZ 等于轉(zhuǎn)移.
JNE/JNZ 不等于時轉(zhuǎn)移.
JC 有進(jìn)位時轉(zhuǎn)移.
JNC 無進(jìn)位時轉(zhuǎn)移.
JNO 不溢出時轉(zhuǎn)移.
JNP/JPO 奇偶性為奇數(shù)時轉(zhuǎn)移.
JNS 符號位為 "0" 時轉(zhuǎn)移.
JO 溢出轉(zhuǎn)移.
JP/JPE 奇偶性為偶數(shù)時轉(zhuǎn)移.
JS 符號位為 "1" 時轉(zhuǎn)移.
3>循環(huán)控制指令(短轉(zhuǎn)移)
LOOP CX不為零時循環(huán).
LOOPE/LOOPZ CX不為零且標(biāo)志Z=1時循環(huán).
LOOPNE/LOOPNZ CX 不為零且標(biāo)志Z=0時循環(huán).
JCXZ CX為零時轉(zhuǎn)移.
JECXZ ECX 為零時轉(zhuǎn)移.
4>中斷指令
INT 中斷指令
INTO 溢出中斷
IRET 中斷返回
5>處理器控制指令
HLT 處理器暫停, 直到出現(xiàn)中斷或復(fù)位信號才繼續(xù).
WAIT 當(dāng)芯片引線TEST為高電平時使CPU進(jìn)入等待狀態(tài).
ESC 轉(zhuǎn)換到外處理器.
LOCK 封鎖總線.
NOP 空操作.
STC 置進(jìn)位標(biāo)志位.
CLC 清進(jìn)位標(biāo)志位.
CMC 進(jìn)位標(biāo)志取反.
STD 置方向標(biāo)志位.
CLD 清方向標(biāo)志位.
STI 置中斷允許位.
CLI 清中斷允許位.
六、偽指令
───────────────────────────────────────
DW 定義字(2字節(jié)).
PROC 定義過程.
ENDP 過程結(jié)束.
SEGMENT 定義段.
ASSUME 建立段寄存器尋址.
ENDS 段結(jié)束.
END 程序結(jié)束.
|
肖文鵬(xiaowp@263.net) 北京理工大學(xué)計算機(jī)系碩士研究生 2003 年 7 月
匯編語言的優(yōu)點是速度快,可以直接對硬件進(jìn)行操作,這對諸如圖形處理等關(guān)鍵應(yīng)用是非常重要的。Linux 是一個用 C 語言開發(fā)的操作系統(tǒng),這使得很多程序員開始忘記在 Linux 中還可以直接使用匯編這一底層語言來優(yōu)化程序的性能。本文為那些在Linux 平臺上編寫匯編代碼的程序員提供指南,介紹 Linux 匯編語言的語法格式和開發(fā)工具,并輔以具體的例子講述如何開發(fā)實用的Linux 匯編程序。
一、簡介
作為最基本的編程語言之一,匯編語言雖然應(yīng)用的范圍不算很廣,但重要性卻勿庸置疑,因為它能夠完成許多其它語言所無法完成的功能。就拿 Linux 內(nèi)核來講,雖然絕大部分代碼是用 C 語言編寫的,但仍然不可避免地在某些關(guān)鍵地方使用了匯編代碼,其中主要是在 Linux 的啟動部分。由于這部分代碼與硬件的關(guān)系非常密切,即使是 C 語言也會有些力不從心,而匯編語言則能夠很好揚長避短,最大限度地發(fā)揮硬件的性能。
大 多數(shù)情況下 Linux 程序員不需要使用匯編語言,因為即便是硬件驅(qū)動這樣的底層程序在 Linux 操作系統(tǒng)中也可以用完全用 C 語言來實現(xiàn),再加上 GCC 這一優(yōu)秀的編譯器目前已經(jīng)能夠?qū)ψ罱K生成的代碼進(jìn)行很好的優(yōu)化,的確有足夠的理由讓我們可以暫時將匯編語言拋在一邊了。但實現(xiàn)情況是 Linux 程序員有時還是需要使用匯編,或者不得不使用匯編,理由很簡單:精簡、高效和 libc 無關(guān)性。假設(shè)要移植 Linux 到某一特定的嵌入式硬件環(huán)境下,首先必然面臨如何減少系統(tǒng)大小、提高執(zhí)行效率等問題,此時或許只有匯編語言能幫上忙了。
匯編語言直接同計算機(jī)的底層軟件甚至硬件進(jìn)行交互,它具有如下一些優(yōu)點:
- 能夠直接訪問與硬件相關(guān)的存儲器或 I/O 端口;
- 能夠不受編譯器的限制,對生成的二進(jìn)制代碼進(jìn)行完全的控制;
- 能夠?qū)﹃P(guān)鍵代碼進(jìn)行更準(zhǔn)確的控制,避免因線程共同訪問或者硬件設(shè)備共享引起的死鎖;
- 能夠根據(jù)特定的應(yīng)用對代碼做最佳的優(yōu)化,提高運行速度;
- 能夠最大限度地發(fā)揮硬件的功能。
同時還應(yīng)該認(rèn)識到,匯編語言是一種層次非常低的語言,它僅僅高于直接手工編寫二進(jìn)制的機(jī)器指令碼,因此不可避免地存在一些缺點:
- 編寫的代碼非常難懂,不好維護(hù);
- 很容易產(chǎn)生 bug,難于調(diào)試;
- 只能針對特定的體系結(jié)構(gòu)和處理器進(jìn)行優(yōu)化;
- 開發(fā)效率很低,時間長且單調(diào)。
Linux 下用匯編語言編寫的代碼具有兩種不同的形式。第一種是完全的匯編代碼,指的是整個程序全部用匯編語言編寫。盡管是完全的匯編代碼,Linux 平臺下的匯編工具也吸收了 C 語言的長處,使得程序員可以使用 #include、#ifdef 等預(yù)處理指令,并能夠通過宏定義來簡化代碼。第二種是內(nèi)嵌的匯編代碼,指的是可以嵌入到C語言程序中的匯編代碼片段。雖然 ANSI 的 C 語言標(biāo)準(zhǔn)中沒有關(guān)于內(nèi)嵌匯編代碼的相應(yīng)規(guī)定,但各種實際使用的 C 編譯器都做了這方面的擴(kuò)充,這其中當(dāng)然就包括 Linux 平臺下的 GCC。
二、Linux 匯編語法格式
絕大多數(shù) Linux 程序員以前只接觸過DOS/Windows 下的匯編語言,這些匯編代碼都是 Intel 風(fēng)格的。但在 Unix 和 Linux 系統(tǒng)中,更多采用的還是 ATAT&Tamp;T 格式,兩者在語法格式上有著很大的不同:
-
在 ATAT&Tamp;T 匯編格式中,寄存器名要加上 ‘%‘ 作為前綴;而在 Intel 匯編格式中,寄存器名不需要加前綴。例如:
ATAT&Tamp;T 格式 |
Intel 格式 |
pushl %eax |
push eax |
-
在 ATAT&Tamp;T 匯編格式中,用 ‘$‘ 前綴表示一個立即操作數(shù);而在 Intel 匯編格式中,立即數(shù)的表示不用帶任何前綴。例如:
ATAT&Tamp;T 格式 |
Intel 格式 |
pushl $1 |
push 1 |
-
ATAT&Tamp;T 和 Intel 格式中的源操作數(shù)和目標(biāo)操作數(shù)的位置正好相反。在 Intel 匯編格式中,目標(biāo)操作數(shù)在源操作數(shù)的左邊;而在 ATAT&Tamp;T 匯編格式中,目標(biāo)操作數(shù)在源操作數(shù)的右邊。例如:
ATAT&Tamp;T 格式 |
Intel 格式 |
addl $1, %eax |
add eax, 1 |
-
在 ATAT&Tamp;T 匯編格式中,操作數(shù)的字長由操作符的最后一個字母決定,后綴‘b‘、‘w‘、‘l‘分別表示操作數(shù)為字節(jié)(byte,8 比特)、字(word,16 比特)和長字(long,32比特);而在 Intel 匯編格式中,操作數(shù)的字長是用 "byte ptr" 和 "word ptr" 等前綴來表示的。例如:
ATAT&Tamp;T 格式 |
Intel 格式 |
movb val, %al |
mov al, byte ptr val |
- 在 ATAT&Tamp;T 匯編格式中,絕對轉(zhuǎn)移和調(diào)用指令(jump/call)的操作數(shù)前要加上‘*‘作為前綴,而在 Intel 格式中則不需要。
-
遠(yuǎn)程轉(zhuǎn)移指令和遠(yuǎn)程子調(diào)用指令的操作碼,在 ATAT&Tamp;T 匯編格式中為 "ljump" 和 "lcall",而在 Intel 匯編格式中則為 "jmp far" 和 "call far",即:
ATAT&Tamp;T 格式 |
Intel 格式 |
ljump $section, $offset |
jmp far section:offset |
lcall $section, $offset |
call far section:offset |
與之相應(yīng)的遠(yuǎn)程返回指令則為:
ATAT&Tamp;T 格式 |
Intel 格式 |
lret $stack_adjust |
ret far stack_adjust |
-
在 ATAT&Tamp;T 匯編格式中,內(nèi)存操作數(shù)的尋址方式是
section:disp(base, index, scale)
|
而在 Intel 匯編格式中,內(nèi)存操作數(shù)的尋址方式為:
section:[base + index*scale + disp]
|
由于 Linux 工作在保護(hù)模式下,用的是 32 位線性地址,所以在計算地址時不用考慮段基址和偏移量,而是采用如下的地址計算方法:
disp + base + index * scale
|
下面是一些內(nèi)存操作數(shù)的例子:
ATAT&Tamp;T 格式 |
Intel 格式 |
movl -4(%ebp), %eax |
mov eax, [ebp - 4] |
movl array(, %eax, 4), %eax |
mov eax, [eax*4 + array] |
movw array(%ebx, %eax, 4), %cx |
mov cx, [ebx + 4*eax + array] |
movb $4, %fs:(%eax) |
mov fs:eax, 4 |
三、Hello World!
真不知道打破這個傳統(tǒng)會帶來什么樣的后果,但既然所有程序設(shè)計語言的第一個例子都是在屏幕上打印一個字符串 "Hello World!",那我們也以這種方式來開始介紹 Linux 下的匯編語言程序設(shè)計。
在 Linux 操作系統(tǒng)中,你有很多辦法可以實現(xiàn)在屏幕上顯示一個字符串,但最簡潔的方式是使用 Linux 內(nèi)核提供的系統(tǒng)調(diào)用。使用這種方法最大的好處是可以直接和操作系統(tǒng)的內(nèi)核進(jìn)行通訊,不需要鏈接諸如 libc 這樣的函數(shù)庫,也不需要使用 ELF 解釋器,因而代碼尺寸小且執(zhí)行速度快。
Linux 是一個運行在保護(hù)模式下的 32 位操作系統(tǒng),采用 flat memory 模式,目前最常用到的是 ELF 格式的二進(jìn)制代碼。一個 ELF 格式的可執(zhí)行程序通常劃分為如下幾個部分:.text、.data 和 .bss,其中 .text 是只讀的代碼區(qū),.data 是可讀可寫的數(shù)據(jù)區(qū),而 .bss 則是可讀可寫且沒有初始化的數(shù)據(jù)區(qū)。代碼區(qū)和數(shù)據(jù)區(qū)在 ELF 中統(tǒng)稱為 section,根據(jù)實際需要你可以使用其它標(biāo)準(zhǔn)的 section,也可以添加自定義 section,但一個 ELF 可執(zhí)行程序至少應(yīng)該有一個 .text 部分。下面給出我們的第一個匯編程序,用的是 ATAT&Tamp;T 匯編語言格式:
例1. ATAT&Tamp;T 格式
#hello.s .data # 數(shù)據(jù)段聲明 msg : .string "Hello, world!\\n" # 要輸出的字符串 len = . - msg # 字串長度 .text # 代碼段聲明 .global _start # 指定入口函數(shù) _start: # 在屏幕上顯示一個字符串 movl $len, %edx # 參數(shù)三:字符串長度 movl $msg, %ecx # 參數(shù)二:要顯示的字符串 movl $1, %ebx # 參數(shù)一:文件描述符(stdout) movl $4, %eax # 系統(tǒng)調(diào)用號(sys_write) int $0x80 # 調(diào)用內(nèi)核功能 # 退出程序 movl $0,%ebx # 參數(shù)一:退出代碼 movl $1,%eax # 系統(tǒng)調(diào)用號(sys_exit) int $0x80 # 調(diào)用內(nèi)核功能
|
初次接觸到 ATAT&Tamp;T 格式的匯編代碼時,很多程序員都認(rèn)為太晦澀難懂了,沒有關(guān)系,在 Linux 平臺上你同樣可以使用 Intel 格式來編寫匯編程序:
例2. Intel 格式
; hello.asm section .data ; 數(shù)據(jù)段聲明 msg db "Hello, world!", 0xA ; 要輸出的字符串 len equ $ - msg ; 字串長度 section .text ; 代碼段聲明 global _start ; 指定入口函數(shù) _start: ; 在屏幕上顯示一個字符串 mov edx, len ; 參數(shù)三:字符串長度 mov ecx, msg ; 參數(shù)二:要顯示的字符串 mov ebx, 1 ; 參數(shù)一:文件描述符(stdout) mov eax, 4 ; 系統(tǒng)調(diào)用號(sys_write) int 0x80 ; 調(diào)用內(nèi)核功能 ; 退出程序 mov ebx, 0 ; 參數(shù)一:退出代碼 mov eax, 1 ; 系統(tǒng)調(diào)用號(sys_exit) int 0x80 ; 調(diào)用內(nèi)核功能
|
上 面兩個匯編程序采用的語法雖然完全不同,但功能卻都是調(diào)用 Linux 內(nèi)核提供的 sys_write 來顯示一個字符串,然后再調(diào)用 sys_exit 退出程序。在 Linux 內(nèi)核源文件 include/asm-i386/unistd.h 中,可以找到所有系統(tǒng)調(diào)用的定義。
四、Linux 匯編工具
Linux 平臺下的匯編工具雖然種類很多,但同 DOS/Windows 一樣,最基本的仍然是匯編器、連接器和調(diào)試器。
1.匯編器
匯編器(assembler)的作用是將用匯編語言編寫的源程序轉(zhuǎn)換成二進(jìn)制形式的目標(biāo)代碼。Linux 平臺的標(biāo)準(zhǔn)匯編器是 GAS,它是 GCC 所依賴的后臺匯編工具,通常包含在 binutils 軟件包中。GAS 使用標(biāo)準(zhǔn)的 ATAT&Tamp;T 匯編語法,可以用來匯編用 ATAT&Tamp;T 格式編寫的程序:
[xiaowp@gary code]$ as -o hello.o hello.s
|
Linux 平臺上另一個經(jīng)常用到的匯編器是 NASM,它提供了很好的宏指令功能,并能夠支持相當(dāng)多的目標(biāo)代碼格式,包括 bin、a.out、coff、elf、rdf 等。NASM 采用的是人工編寫的語法分析器,因而執(zhí)行速度要比 GAS 快很多,更重要的是它使用的是 Intel 匯編語法,可以用來編譯用 Intel 語法格式編寫的匯編程序:
[xiaowp@gary code]$ nasm -f elf hello.asm
|
2.鏈接器
由匯編器產(chǎn)生的目標(biāo)代碼是不能直接在計算機(jī)上運行的,它必須經(jīng)過鏈接器的處理才能生成可執(zhí)行代碼。鏈接器通常用來將多個目標(biāo)代碼連接成一個可執(zhí)行代碼,這樣可以先將整個程序分成幾個模塊來單獨開發(fā),然后才將它們組合(鏈接)成一個應(yīng)用程序。 Linux 使用 ld 作為標(biāo)準(zhǔn)的鏈接程序,它同樣也包含在 binutils 軟件包中。匯編程序在成功通過 GAS 或 NASM 的編譯并生成目標(biāo)代碼后,就可以使用 ld 將其鏈接成可執(zhí)行程序了:
[xiaowp@gary code]$ ld -s -o hello hello.o
|
3.調(diào)試器
有人說程序不是編出來而是調(diào)出來的,足見調(diào)試在軟件開發(fā)中的重要作用,在用匯編語言編寫程序時尤其如此。Linux 下調(diào)試匯編代碼既可以用 GDB、DDD 這類通用的調(diào)試器,也可以使用專門用來調(diào)試匯編代碼的 ALD(Assembly Language Debugger)。
從調(diào)試的角度來看,使用 GAS 的好處是可以在生成的目標(biāo)代碼中包含符號表(symbol table),這樣就可以使用 GDB 和 DDD 來進(jìn)行源碼級的調(diào)試了。要在生成的可執(zhí)行程序中包含符號表,可以采用下面的方式進(jìn)行編譯和鏈接:
[xiaowp@gary code]$ as --gstabs -o hello.o hello.s [xiaowp@gary code]$ ld -o hello hello.o
|
執(zhí)行 as 命令時帶上參數(shù) --gstabs 可以告訴匯編器在生成的目標(biāo)代碼中加上符號表,同時需要注意的是,在用 ld 命令進(jìn)行鏈接時不要加上 -s 參數(shù),否則目標(biāo)代碼中的符號表在鏈接時將被刪去。
在 GDB 和 DDD 中調(diào)試匯編代碼和調(diào)試 C 語言代碼是一樣的,你可以通過設(shè)置斷點來中斷程序的運行,查看變量和寄存器的當(dāng)前值,并可以對代碼進(jìn)行單步跟蹤。圖1 是在 DDD 中調(diào)試匯編代碼時的情景:
圖1 用 DDD 中調(diào)試匯編程序
匯編程序員通常面對的都是一些比較苛刻的軟硬件環(huán)境,短小精悍的ALD可能更能符合實際的需要,因此下面主要介紹一下如何用ALD來調(diào)試匯編程序。首先在命令行方式下執(zhí)行ald命令來啟動調(diào)試器,該命令的參數(shù)是將要被調(diào)試的可執(zhí)行程序:
[xiaowp@gary doc]$ ald hello Assembly Language Debugger 0.1.3 Copyright (C) 2000-2002 Patrick Alken hello: ELF Intel 80386 (32 bit), LSB, Executable, Version 1 (current) Loading debugging symbols...(15 symbols loaded) ald>
|
當(dāng) ALD 的提示符出現(xiàn)之后,用 disassemble 命令對代碼段進(jìn)行反匯編:
ald> disassemble -s .text Disassembling section .text (0x08048074 - 0x08048096) 08048074 BA0F000000 mov edx, 0xf 08048079 B998900408 mov ecx, 0x8049098 0804807E BB01000000 mov ebx, 0x1 08048083 B804000000 mov eax, 0x4 08048088 CD80 int 0x80 0804808A BB00000000 mov ebx, 0x0 0804808F B801000000 mov eax, 0x1 08048094 CD80 int 0x80
|
上述輸出信息的第一列是指令對應(yīng)的地址碼,利用它可以設(shè)置在程序執(zhí)行時的斷點:
ald> break 0x08048088 Breakpoint 1 set for 0x08048088
|
斷點設(shè)置好后,使用 run 命令開始執(zhí)行程序。ALD 在遇到斷點時將自動暫停程序的運行,同時會顯示所有寄存器的當(dāng)前值:
ald> run Starting program: hello Breakpoint 1 encountered at 0x08048088 eax = 0x00000004 ebx = 0x00000001 ecx = 0x08049098 edx = 0x0000000F esp = 0xBFFFF6C0 ebp = 0x00000000 esi = 0x00000000 edi = 0x00000000 ds = 0x0000002B es = 0x0000002B fs = 0x00000000 gs = 0x00000000 ss = 0x0000002B cs = 0x00000023 eip = 0x08048088 eflags = 0x00000246 Flags: PF ZF IF 08048088 CD80 int 0x80
|
如果需要對匯編代碼進(jìn)行單步調(diào)試,可以使用 next 命令:
ald> next Hello, world! eax = 0x0000000F ebx = 0x00000000 ecx = 0x08049098 edx = 0x0000000F esp = 0xBFFFF6C0 ebp = 0x00000000 esi = 0x00000000 edi = 0x00000000 ds = 0x0000002B es = 0x0000002B fs = 0x00000000 gs = 0x00000000 ss = 0x0000002B cs = 0x00000023 eip = 0x0804808F eflags = 0x00000346 Flags: PF ZF TF IF 0804808F B801000000 mov eax, 0x1
|
若想獲得 ALD 支持的所有調(diào)試命令的詳細(xì)列表,可以使用 help 命令:
ald> help Commands may be abbreviated. If a blank command is entered, the last command is repeated. Type `help ‘ for more specific information on . General commands attach clear continue detach disassemble enter examine file help load next quit register run set step unload window write Breakpoint related commands break delete disable enable ignore lbreak tbreak
|
五、系統(tǒng)調(diào)用
即便是最簡單的匯編程序,也難免要用到諸如輸入、輸出以及退出等操作,而要進(jìn)行這些操作則需要調(diào)用操作系統(tǒng)所提供的服務(wù),也就是系統(tǒng)調(diào)用。除非你的程序只完成加減乘除等數(shù)學(xué)運算,否則將很難避免使用系統(tǒng)調(diào)用,事實上除了系統(tǒng)調(diào)用不同之外,各種操作系統(tǒng)的匯編編程往往都是很類似的。
在 Linux 平臺下有兩種方式來使用系統(tǒng)調(diào)用:利用封裝后的 C 庫(libc)或者通過匯編直接調(diào)用。其中通過匯編語言來直接調(diào)用系統(tǒng)調(diào)用,是最高效地使用 Linux 內(nèi)核服務(wù)的方法,因為最終生成的程序不需要與任何庫進(jìn)行鏈接,而是直接和內(nèi)核通信。
和 DOS 一樣,Linux 下的系統(tǒng)調(diào)用也是通過中斷(int 0x80)來實現(xiàn)的。在執(zhí)行 int 80 指令時,寄存器 eax 中存放的是系統(tǒng)調(diào)用的功能號,而傳給系統(tǒng)調(diào)用的參數(shù)則必須按順序放到寄存器 ebx,ecx,edx,esi,edi 中,當(dāng)系統(tǒng)調(diào)用完成之后,返回值可以在寄存器 eax 中獲得。
所有的系統(tǒng)調(diào)用功能號都可以在文件 /usr/include/bits/syscall.h 中找到,為了便于使用,它們是用 SYS_ 這樣的宏來定義的,如 SYS_write、SYS_exit 等。例如,經(jīng)常用到的 write 函數(shù)是如下定義的:
ssize_t write(int fd, const void *buf, size_t count);
|
該 函數(shù)的功能最終是通過 SYS_write 這一系統(tǒng)調(diào)用來實現(xiàn)的。根據(jù)上面的約定,參數(shù) fb、buf 和 count 分別存在寄存器 ebx、ecx 和 edx 中,而系統(tǒng)調(diào)用號 SYS_write 則放在寄存器 eax 中,當(dāng) int 0x80 指令執(zhí)行完畢后,返回值可以從寄存器 eax 中獲得。
或許你已經(jīng)發(fā)現(xiàn),在進(jìn)行系統(tǒng)調(diào)用時至多只有 5 個寄存器能夠用來保存參數(shù),難道所有系統(tǒng)調(diào)用的參數(shù)個數(shù)都不超過 5 嗎?當(dāng)然不是,例如 mmap 函數(shù)就有 6 個參數(shù),這些參數(shù)最后都需要傳遞給系統(tǒng)調(diào)用 SYS_mmap:
void * mmap(void *start, size_t length, int prot , int flags, int fd, off_t offset);
|
當(dāng)一個系統(tǒng)調(diào)用所需的參數(shù)個數(shù)大于 5 時,執(zhí)行int 0x80 指令時仍需將系統(tǒng)調(diào)用功能號保存在寄存器 eax 中,所不同的只是全部參數(shù)應(yīng)該依次放在一塊連續(xù)的內(nèi)存區(qū)域里,同時在寄存器 ebx 中保存指向該內(nèi)存區(qū)域的指針。系統(tǒng)調(diào)用完成之后,返回值仍將保存在寄存器 eax 中。
由于只是需要一塊連續(xù)的內(nèi)存區(qū)域來保存系統(tǒng)調(diào)用的參數(shù),因此完全可以像普通的函數(shù)調(diào)用一樣使用棧(stack)來傳遞系統(tǒng)調(diào)用所需的參數(shù)。但要注意一點,Linux 采用的是 C 語言的調(diào)用模式,這就意味著所有參數(shù)必須以相反的順序進(jìn)棧,即最后一個參數(shù)先入棧,而第一個參數(shù)則最后入棧。如果采用棧來傳遞系統(tǒng)調(diào)用所需的參數(shù),在執(zhí)行 int 0x80 指令時還應(yīng)該將棧指針的當(dāng)前值復(fù)制到寄存器 ebx中。
六、命令行參數(shù)
在 Linux 操作系統(tǒng)中,當(dāng)一個可執(zhí)行程序通過命令行啟動時,其所需的參數(shù)將被保存到棧中:首先是 argc,然后是指向各個命令行參數(shù)的指針數(shù)組 argv,最后是指向環(huán)境變量的指針數(shù)據(jù) envp。在編寫匯編語言程序時,很多時候需要對這些參數(shù)進(jìn)行處理,下面的代碼示范了如何在匯編代碼中進(jìn)行命令行參數(shù)的處理:
例3. 處理命令行參數(shù)
# args.s .text .globl _start _start: popl %ecx # argc vnext: popl %ecx # argv test %ecx, %ecx # 空指針表明結(jié)束 jz exit movl %ecx, %ebx xorl %edx, %edx strlen: movb (%ebx), %al inc %edx inc %ebx test %al, %al jnz strlen movb $10, -1(%ebx) movl $4, %eax # 系統(tǒng)調(diào)用號(sys_write) movl $1, %ebx # 文件描述符(stdout) int $0x80 jmp vnext exit: movl $1,%eax # 系統(tǒng)調(diào)用號(sys_exit) xorl %ebx, %ebx # 退出代碼 int $0x80 ret
|
七、GCC 內(nèi)聯(lián)匯編
用匯編編寫的程序雖然運行速度快,但開發(fā)速度非常慢,效率也很低。如果只是想對關(guān)鍵代碼段進(jìn)行優(yōu)化,或許更好的辦法是將匯編指令嵌入到 C 語言程序中,從而充分利用高級語言和匯編語言各自的特點。但一般來講,在 C 代碼中嵌入?yún)R編語句要比"純粹"的匯編語言代碼復(fù)雜得多,因為需要解決如何分配寄存器,以及如何與C代碼中的變量相結(jié)合等問題。
GCC 提供了很好的內(nèi)聯(lián)匯編支持,最基本的格式是:
__asm__("asm statements");
|
例如:
如果需要同時執(zhí)行多條匯編語句,則應(yīng)該用"\\n\\t"將各個語句分隔開,例如:
__asm__( "pushl %%eax \\n\\t" "movl $0, %%eax \\n\\t" "popl %eax");
|
通常嵌入到 C 代碼中的匯編語句很難做到與其它部分沒有任何關(guān)系,因此更多時候需要用到完整的內(nèi)聯(lián)匯編格式:
__asm__("asm statements" : outputs : inputs : registers-modified);
|
插入到 C 代碼中的匯編語句是以":"分隔的四個部分,其中第一部分就是匯編代碼本身,通常稱為指令部,其格式和在匯編語言中使用的格式基本相同。指令部分是必須的,而其它部分則可以根據(jù)實際情況而省略。
在將匯編語句嵌入到C代碼中時,操作數(shù)如何與C代碼中的變量相結(jié)合是個很大的問題。GCC采用如下方法來解決這個問題:程序員提供具體的指令,而對寄存器的使用則只需給出"樣板"和約束條件就可以了,具體如何將寄存器與變量結(jié)合起來完全由GCC和GAS來負(fù)責(zé)。
在GCC內(nèi)聯(lián)匯編語句的指令部中,加上前綴‘%‘的數(shù)字(如%0,%1)表示的就是需要使用寄存器的"樣板"操作數(shù)。指令部中使用了幾個樣板操作數(shù),就表明有幾個變量需要與寄存器相結(jié)合,這樣GCC和GAS在編譯和匯編時會根據(jù)后面給定的約束條件進(jìn)行恰當(dāng)?shù)奶幚?。由于樣板操作?shù)也使用‘%‘作為前綴,因此在涉及到具體的寄存器時,寄存器名前面應(yīng)該加上兩個‘%‘,以免產(chǎn)生混淆。
緊跟在指令部后面的是輸出部,是規(guī)定輸出變量如何與樣板操作數(shù)進(jìn)行結(jié)合的條件,每個條件稱為一個"約束",必要時可以包含多個約束,相互之間用逗號分隔開就可以了。每個輸出約束都以‘=‘號開始,然后緊跟一個對操作數(shù)類型進(jìn)行說明的字后,最后是如何與變量相結(jié)合的約束。凡是與輸出部中說明的操作數(shù)相結(jié)合的寄存器或操作數(shù)本身,在執(zhí)行完嵌入的匯編代碼后均不保留執(zhí)行之前的內(nèi)容,這是GCC在調(diào)度寄存器時所使用的依據(jù)。
輸出部后面是輸入部,輸入約束的格式和輸出約束相似,但不帶‘=‘號。如果一個輸入約束要求使用寄存器,則GCC在預(yù)處理時就會為之分配一個寄存器,并插入必要的指令將操作數(shù)裝入該寄存器。與輸入部中說明的操作數(shù)結(jié)合的寄存器或操作數(shù)本身,在執(zhí)行完嵌入的匯編代碼后也不保留執(zhí)行之前的內(nèi)容。
有時在進(jìn)行某些操作時,除了要用到進(jìn)行數(shù)據(jù)輸入和輸出的寄存器外,還要使用多個寄存器來保存中間計算結(jié)果,這樣就難免會破壞原有寄存器的內(nèi)容。在GCC內(nèi)聯(lián)匯編格式中的最后一個部分中,可以對將產(chǎn)生副作用的寄存器進(jìn)行說明,以便GCC能夠采用相應(yīng)的措施。
下面是一個內(nèi)聯(lián)匯編的簡單例子:
例4.內(nèi)聯(lián)匯編
/* inline.c */ int main() { int a = 10, b = 0; __asm__ __volatile__("movl %1, %%eax;\\n\\r" "movl %%eax, %0;" :"=r"(b) /* 輸出 */ :"r"(a) /* 輸入 */ :"%eax"); /* 不受影響的寄存器 */ printf("Result: %d, %d\\n", a, b); }
|
上面的程序完成將變量a的值賦予變量b,有幾點需要說明:
- 變量b是輸出操作數(shù),通過%0來引用,而變量a是輸入操作數(shù),通過%1來引用。
- 輸入操作數(shù)和輸出操作數(shù)都使用r進(jìn)行約束,表示將變量a和變量b存儲在寄存器中。輸入約束和輸出約束的不同點在于輸出約束多一個約束修飾符‘=‘。
- 在內(nèi)聯(lián)匯編語句中使用寄存器eax時,寄存器名前應(yīng)該加兩個‘%‘,即%%eax。內(nèi)聯(lián)匯編中使用%0、%1等來標(biāo)識變量,任何只帶一個‘%‘的標(biāo)識符都看成是操作數(shù),而不是寄存器。
- 內(nèi)聯(lián)匯編語句的最后一個部分告訴GCC它將改變寄存器eax中的值,GCC在處理時不應(yīng)使用該寄存器來存儲任何其它的值。
- 由于變量b被指定成輸出操作數(shù),當(dāng)內(nèi)聯(lián)匯編語句執(zhí)行完畢后,它所保存的值將被更新。
在內(nèi)聯(lián)匯編中用到的操作數(shù)從輸出部的第一個約束開始編號,序號從0開始,每個約束記數(shù)一次,指令部要引用這些操作數(shù)時,只需在序號前加上‘%‘作為前綴就可以了。需要注意的是,內(nèi)聯(lián)匯編語句的指令部在引用一個操作數(shù)時總是將其作為32位的長字使用,但實際情況可能需要的是字或字節(jié),因此應(yīng)該在約束中指明正確的限定符:
限定符 |
意義 |
"m"、"v"、"o" |
內(nèi)存單元 |
"r" |
任何寄存器 |
"q" |
寄存器eax、ebx、ecx、edx之一 |
"i"、"h" |
直接操作數(shù) |
"E"和"F" |
浮點數(shù) |
"g" |
任意 |
"a"、"b"、"c"、"d" |
分別表示寄存器eax、ebx、ecx和edx |
"S"和"D" |
寄存器esi、edi |
"I" |
常數(shù)(0至31) |
八、小結(jié)
Linux操作系統(tǒng)是用C語言編寫的,匯編只在必要的時候才被人們想到,但它卻是減少代碼尺寸和優(yōu)化代碼性能的一種非常重要的手段,特別是在與硬件直接交互的時候,匯編可以說是最佳的選擇。Linux提供了非常優(yōu)秀的工具來支持匯編程序的開發(fā),使用GCC的內(nèi)聯(lián) 匯編能夠充分地發(fā)揮C語言和匯編語言各自的優(yōu)點。
九、參考資料
- 在網(wǎng)站http://linuxassembly.org上可以找到大量的Linux匯編資源。
- 軟件包binutils提供了as和ld等實用工具,其相關(guān)信息可以在網(wǎng)站http://sources.redhat.com/binutils/上找到。
- NASM是Intel格式的匯編器,其相關(guān)信息可以在網(wǎng)站http://nasm.sourceforge.net 上找到。
- ALD是一個短小精悍的匯編調(diào)試器,其相關(guān)信息可以在網(wǎng)站http://dunx1.irt.drexel.edu/~psa22/ald.html上找到。
- intel2gas是一個能夠?qū)ntel匯編格式轉(zhuǎn)換成ATAT&Tamp;T匯編格式的小工具,其相關(guān)信息可以在網(wǎng)站http://www.niksula.cs.hut.fi/~mtiihone/intel2gas/上找到。
- IBM developerWorks上有一篇介紹GCC內(nèi)聯(lián)匯編的文章( http://www-900.ibm.com/developerworks/cn/linux/sdk/assemble/inline/index_eng.shtml)。
- 本文代碼下載: 代碼。
關(guān)于作者 本文作者肖文鵬是北京理工大學(xué)計算機(jī)系的一名碩士研究生,主要從事操作系統(tǒng)和分布式計算環(huán)境的研究,喜愛Linux和Python。你可以通過xiaowp@263.net與他取得聯(lián)系。 |
|
ATAT&Tamp;T x86 asm 語法 |
http://www.chinaunix.net 作者:e4gle 發(fā)表于:2002-11-12 15:06:51 |
/////////////////////////////////////////////////////////////////////////////// linux下gcc的匯編格式是at&t格式的,和我們平時用的intel格式的匯編語法不一樣,所以 很多熟悉windows匯編的人到linux下有點無所適從,所以我貼了我以前寫的這篇文檔,幫助 大家理解 at&t匯編,做個參考手冊 ////////////////////////////////////////////////////////////////////////////////
AT&T x86 asm 語法
Author: e4gle Email:& nbsp; e4gle@whitecell.org Homepage:http://www.whitecell.org& nbsp;
DJGPP 使用ATAT&Tamp;T格式的匯編語法。和一般的intel格式的語法有點不同。主要不同點如下:
AT&T 語法顛倒了源和目的操作數(shù)的位置, 目的操作數(shù)在源操作數(shù)之后。寄存器操作數(shù)要有個%的前綴, 立即數(shù)操作數(shù)要有個$符號的前綴。 存儲器操作數(shù)的大小取決于操作碼的最后一個字符。 它們是b (8-bit), w& nbsp;(16-bit), 和 l (32-bit). 這里有一些例子。 左邊部分是intel指令格式,右邊是at&t格式。 movw %bx,& nbsp;%ax// mov ax, bx xorl % eax, %eax// xor eax, eax movw& nbsp;$1, %ax// mov ax,1 movb X, %ah// mov ah, byte ptr& nbsp;X movw X, %ax// mov ax, word ptr X movl X, %eax// mov eax, X 大部分操作指令,at%t和intel 都是差不多的,除了這些: movsSD // movsx& nbsp; movzSD // movz
S和D分辨代表源和目的操作數(shù)后綴。 movswl %ax, %ecx// movsx ecx, ax cbtw // cbw cwtl // cwde cwtd & nbsp; // cwd& nbsp; cltd & nbsp; // cdq lcall $S,$O& nbsp;// call far S:O ljmp $S, $O // jump far S:O lret $V //& nbsp;ret far V 操作嘛前綴不能與他們作用的指令寫在同一行。& nbsp;例如, rep 和stosd應(yīng)該是兩個相互獨立的指令, 存儲器 的情況也有一點不同。通常intel格式的如下:
section: [base + index*scale + disp]
被寫成:
section:disp(base, index, scale)
這里有些例子:
movl 4(%ebp), %eax // mov eax, [ebp+4]) addl (%eax,%eax,4), %ecx // add ecx, [eax + eax*4]) movb $4, %fs%eax) & nbsp; // mov& nbsp;fs:eax, 4) movl _array(,%eax,4), %eax // mov eax, [4*eax + array]) movw _array (%ebx,%eax,4), %cx// mov cx, [ebx& nbsp;+ 4*eax + array])
Jump& nbsp;指令通常是個短跳轉(zhuǎn)。 可是, 下面這些指令都是只能在一個字節(jié)的范圍內(nèi)跳轉(zhuǎn): jcxz, jecxz, loop, loopz, loope, loopnz 和loopne。象在線文檔所說的那樣,一個jcxz foo可以擴(kuò)展成以下工作: jcxz cx_zero jmp cx_nonzero cx_zero: jmp foo cx_nonzero: 文檔也注意到了mul和imul指令。 擴(kuò)展的乘法指令只用一個操作數(shù),例如, imul& nbsp;$ebx, $ebx將不會把結(jié) 果放入edx:eax。使用imul %ebx中的單操作數(shù)來獲得擴(kuò)展結(jié)果。
-------------------- ------------------------------------------------------------
Inline Asm 我將首先開始inline asm, 因為似乎關(guān)于這方面的疑問非常多。這是最基本的語法了, 就象在線幫助信息 中描述的: __asm__(asm statements : outputs :& nbsp;inputs : registers-modified);
這四個字段的含義是:
asm statements - AT&T 的結(jié)構(gòu), 每新行都是分開的。 outputs - 修飾符一定要用引號引起來, 用逗號分隔 inputs - 修飾符一定要用引號引起來,& nbsp;用逗號分隔 registers-modified - 名字用逗號分隔 一個小小的例子: __asm__(" pushl& nbsp;%eax\n movl $1, %eax\n popl %eax" ); 假如你不用到特別的輸入輸出變量或者修改任何寄存器的值,一般來說是不會使用到其他的三個字段的, 讓我們來分析一下輸入變量。
int i = 0;
__asm__(" pushl %%eax\n movl %0, %%eax\n addl $1, %%eax\n movl %%eax, %0\n popl %%eax" : : "g"& nbsp;(i) );// increment i 不要為上面的代碼所困擾! 我將盡力來解釋它。我們想讓輸入變量i加1,沒有任何輸出變量, 也沒有 改變寄存器值 (我們保存了eax值)。 因此,第二個和最后一個字段是空的。 因為指定了輸入字段, 我們 仍需要保留一個空的輸出字段, 但是沒有最后一個字段, 因為它沒被使用。在兩個空冒號之間留下一個新 行或者至少一個空格。
下面讓我們來看看輸入字段。 附加描述符可以修正指令來讓你給定的編譯器來正確處理這些變量。他們 一般被附上雙引號。 那么這個"g"是用來做什么的呢? 只要是合法的匯編指令,"g"就讓編譯器決定該 在哪里加載i的值。一般來說,你的大部分輸入變量都可以被賦予"g", 讓編譯器決定如何去加載它們 (gcc 甚至可以優(yōu)化它們!)。 其他描述符使用"r" (加載到任何可用的寄存器去), "a" (ax/eax), "b" (bx/ebx), "c" (cx/ecx), "d" (dx/edx), "D" (di/edi), "S" (si/esi), 等等。
我們將要提到一個在asm代碼里面的如%0的輸入變量。如果我們有兩個輸入, 他們會一個是%0一個是%1, 在輸入段里按順序排列 (如下一個例子)。假如N個輸入變量且沒有輸出變量, 從 %0 到%N-1將和輸入字段 里的變量相對應(yīng), 按順序排列。
如果任何的輸入, 輸出, 寄存器修改字段被使用, 匯編代碼里的寄存器名必須用兩個%來代替一個%。對應(yīng) 于第一個沒有使用最后三個字段的例子。
讓我們看看兩個輸入變量且引入了"volatile"的例子:
int i=0, j=1; __asm__ __volatile__(" pushl %%eax\n movl %0, %%eax\n addl %1, %%eax\n movl& nbsp;%%eax, %0\n popl %%eax" : : "g" (i), "g" (j) );// increment i by j Okay, 現(xiàn)在我們已經(jīng)有了兩個輸入變量了。沒問題了, 我們只需要記住%0對應(yīng)第一個輸入變量(在這個例 子中是i),& nbsp;%1對應(yīng)在i后面的列出的j。 Oh yeah, 這個volatile到底是什么意思呢? 它防止你的編譯器修改你的匯編代碼,就是不進(jìn)行優(yōu)化(紀(jì)錄 , 刪除, 結(jié)合,等等優(yōu)化手段。), 不改變代碼原樣來匯編它們。建議一般情況下使用volatile選項。
讓我們來看看輸出字段:
int i=0; __asm__ __volatile__(" pushl %%eax\n movl $1, %%eax\n movl %%eax, %0\n popl& nbsp;%%eax" : "=g" (i) );// assign 1 to i 這看起來非常象我們前面提到的輸入字段的例子; 確實也沒有很大的不同。所有的輸出修飾符前面都應(yīng)該 加上=字符,他們同樣在匯編代碼里面用%0到%N-1來表示, 在輸出字段按順序排列。你一定會問如果同時 有輸入和輸出字段會怎么排序的呢? 好,下面一個例子就是讓大家知道如何同時處理輸入輸出字段的。 int i=0, j=1, k=0; __asm__ __volatile__(" pushl %%eax\n movl %1, %%eax\n addl %2, %%eax\n movl %%eax, %0\n popl %%eax" : "=g" (k) : "g"& nbsp;(i), "g" (j) );// k =& nbsp;i + j Okay, 唯一個不清楚的地方就是匯編代碼中的變量的個數(shù)。我馬上來解釋一下。 當(dāng)同時使用輸入字段和輸出字段的時候:
%0 ... %K& nbsp;是輸出變量
%K+1 ... % N 是輸入變量
在我們的例子中, %0& nbsp;對應(yīng)k, %1 對應(yīng)i, %2對應(yīng)j。很簡單,是吧?
到現(xiàn)在為止我們都沒有使用最后一個字段(registers-modified)。如果我們要在我們的匯編代碼里使用 任何寄存器, 我們要明確的用push和pop指令來保存它們, 或者列到最后一個字段里面讓gcc來處理它們。
這是前面的一個例子, 沒有明確的保留和存貯eax。
int& nbsp;i=0, j=1, k=0; __asm__ __volatile__ (" pushl %%eax\n /*譯者注:好像原文說的有點問題,明明是保存了eax的值,*/ movl %1, %%eax\n addl& nbsp;%2, %%eax\n movl %%eax, %0\n popl %%eax" : "=g" (k) : "g" (i), "g" (j) : "ax", "memory" );// k = i& nbsp;+ j 我們讓gcc來保存和存貯eax, 如果必要的話。一個16-bit寄存器名代表了32-, 16-或8-bit寄存器。 如果 我們要改寫內(nèi)存 (寫入一個變量等。), 建議在register-modified字段里面來指定"memroy"修飾符。這意 味著除了第一個例子我們都應(yīng)該加上這個修飾符, 但是直到現(xiàn)在我才提出來, 是為了更簡單易懂。
在你的內(nèi)聯(lián)匯編里面定位標(biāo)號應(yīng)該使用b或f來作為終止符, 尤其是向后向前的跳轉(zhuǎn)。(譯者注:b 代表向 后跳轉(zhuǎn),f代表向前跳轉(zhuǎn))
For example,& nbsp;
__asm__ __volatile__(" 0:\n ... jmp 0b\n ... jmp 1f \n ... 1:\n ... ); 這里有個用c代碼和內(nèi)聯(lián)匯編代碼混合寫的跳轉(zhuǎn)程序的例子(thanks to Srikanth B.R for this tip).
void MyFunction( int x, int y { __asm__( "Start:" ; __asm__( ...do some comparison... ; __asm__( "jl Label_1" ;
CallFunction( &x, &y ; __asm__("jmp Start";
Label_1: return; }
------------------------- -------------------------------------------------------
External Asm Blah... Okay fine. Here‘s a clue: Get some of& nbsp;your C/C++ files, 且用gcc -S& nbsp;file.c來編譯。 然 后查看file.S文件?;窘Y(jié)構(gòu)如下: .file "myasm.S"
.data somedata: .word 0 ... .text .globl __myasmfunc __myasmfunc: ... ret Macros, macros! 頭文件libc/asmdefs.h便于你寫asm。 在你的匯編代碼最前面包含此頭文件然后就可以 使用宏了。一個例子: myasm.S: #include
.file "myasm.S"
. data .align 2 somedata: .word 0 ...
.text .align 4 FUNC(__MyExternalAsmFunc) ENTER movl ARG1, %eax ... jmp mylabel ... mylabel: ... LEAVE 這是一個很經(jīng)典的匯編代碼框架。
WSS(Whitecell Security Systems),一個非營利性民間技術(shù)組織,致力于各種系統(tǒng)安全技術(shù)的研究。堅持傳統(tǒng)的hacker精神,追求技術(shù)的精純。 WSS 主頁:http: //www.whitecell.org/ WSS 論壇:http://www.whitecell.org/forum/
|
|
微機(jī)原理與匯編語言基礎(chǔ)
C語言能實現(xiàn)匯編語言的大部分功能,能進(jìn)行位運算,可以直接對硬件進(jìn)行操作,例如可以允許直接訪問內(nèi)存或端口的物理地址。因此,學(xué)習(xí)C語言的人掌握一定的匯編語言基礎(chǔ)是必要的。
一、80x86系列CPU的編程結(jié)構(gòu)
寄存器在匯編語言中的地位類似于變量。寄存器變量的訪問時間遠(yuǎn)小于內(nèi)存變量的訪問時間。在匯編語言中大量的使用寄存器而不是直接訪問內(nèi)存。
1 寄存器堆
8086CPU是Intel系列的16位微處理器,有16根數(shù)據(jù)線和20根地址線,直接尋址空間為2^20即1MB。8088CPU的對外數(shù)據(jù)總線為8位,稱為準(zhǔn)16位微處理器。
8086/8088的內(nèi)部寄存器(register)共有14個,如下:
(1)通用寄存器:8個,包括數(shù)據(jù)寄存器、地址指針寄存器、變址寄存器。
數(shù)據(jù)寄存器4個:AX BX CX DX,它們又可作為8個8位的寄存器使用,即AH BH CH DH AL BL CL DL
AX稱為累加器,I/O指令均使用該寄存器,訪問外部硬件和接口。
BX稱為基址寄存器,在訪問內(nèi)存時用于存放基地址。
CX稱為計數(shù)寄存器,用于循環(huán)、字符串的循環(huán)控制。
DX稱為數(shù)據(jù)寄存器,在寄存器間接尋址的i/o指令中存放i/o地址,在作雙字運算時[DX][AX]構(gòu)成一個雙字。
地址指針寄存器2個:SP BP
SP稱為堆棧指針寄存器,BP稱為基址指針寄存器,在作數(shù)組和字符串運算時,用于存放內(nèi)存的偏移地址。
變址寄存器2個:SI DI
SI稱為源變址寄存器,DI稱為目的變址寄存器,用于數(shù)據(jù)塊操作的內(nèi)存尋址。
(2)段寄存器4個:CS DS ES SS
CS代碼段寄存器,DS數(shù)據(jù)段寄存器,ES附加段寄存器,SS堆棧段寄存器
用于存放段地址(段基址)
(3)指令指針I(yè)P:始終指向?qū)⒁獔?zhí)行的指令。用戶不能直接訪問和編程。
(4)標(biāo)志寄存器FLAGS:16位寄存器,8086/8088僅使用了九個標(biāo)志位。
2 標(biāo)志寄存器
CF:進(jìn)位標(biāo)志位
PF:奇偶標(biāo)志位
AF:輔助進(jìn)位位
ZF:零標(biāo)志位
SF:符號標(biāo)志位
OF:溢出標(biāo)志位
TF:跟蹤標(biāo)志位:單步標(biāo)志
IF:中斷標(biāo)志位
DF:方向標(biāo)志位
其中前六個為狀態(tài)標(biāo)志位,也叫條件碼,用作條件轉(zhuǎn)移指令中的判斷條件。
后三個為控制標(biāo)志位,對相關(guān)的操作起控制作用。
14個寄存器的內(nèi)容,將要執(zhí)行的指令,將要處理的數(shù)據(jù),被稱作CPU的“現(xiàn)場”,用debug的r命令可以清楚地看到“現(xiàn)場”。
二、內(nèi)存的分段組織
計算機(jī)的基本存儲單位是字節(jié),由8個二進(jìn)制位組成,8個位捆綁使用。可用一個兩位16進(jìn)制數(shù)表示其內(nèi)容。16位CPU一次可以處理兩個字節(jié)。
為了正確訪問內(nèi)存,每一個存儲器單位即字節(jié)必須給出一個地址。地址編號從0開始,依次加1,被稱為線性編址。
8086的地址線有20根,(詳述)能夠直接訪問的地址空間為2^20即1MB。即內(nèi)存的地址編號可以從0編到 1M。用16進(jìn)制數(shù)表示內(nèi)存的物理地址,其地址范圍為00000H~FFFFFH,為5位16進(jìn)制數(shù)。每一個內(nèi)存單元都有一個確定的20位物理地址。
但是,16位CPU的字長為16位,一次只能訪問2^16=64k內(nèi)存,如何訪問1M的內(nèi)存空間呢,在8086CPU中采用了地址分段的辦法。即每一個存儲單元的物理地址都有段地址和偏移地址兩部分構(gòu)成。
規(guī)定:(詳述)只有地址為16的整數(shù)倍的物理地址可以作為段地址。這樣,1MB的內(nèi)存空間被分為了 1M/16=64K個段。段地址的特征為xxxx0H。
我們知道了段地址和相對于段地址的段內(nèi)偏移量(偏移地址)后就可以確定一個內(nèi)存單元的物理地址了。所謂的偏移地址等于內(nèi)存單元的物理地址減去段地址,不得超過一段(即64k)。
段地址可以不用20位表示,而用16位表示,即xxxx0H=xxxxH*10H表示為xxxxH,用4位16進(jìn)制數(shù)表示。
物理地址的計算公式為:
物理地址=段地址*16+偏移地址
或者,物理地址=段地址*10H+偏移地址
乘以16相當(dāng)于左移4位。即段地址左移4位和偏移地址相加。按十六進(jìn)制數(shù)描述為,段地址左移一位和偏移地址相加。通常表示為
物理地址=段地址:偏移地址
例如:02002=0200:0002
可以看出,實際上偏移地址也是16位的,每一段的最大空間為2^16=64K,這樣,不同的段之間有重疊。也即意味著物理地址可以有不同的表示方法?;蛘哒f不同的表示方法可以表示同一個物理地址。
例如:02020=0200:0020=0100:1020=0000:2020=0202:0000=......
舉例說明:摩天大樓。
注意:實際上每個段并不一定占用64k的最大空間。
總結(jié):如此麻煩的做法帶來的好處是擴(kuò)大了內(nèi)存的表示空間,更重要的是,原本很麻煩的程序的再定位工作變得異常簡單,實際上一般的程序員以及高級語言并不關(guān)心段地址,段地址的分配工作交給操作系統(tǒng)了。
在高級語言中,變量有兩個含義:首先表示的是內(nèi)存的偏移地址,對于占用兩個以上存儲單元的變量,其地址是低地址,一般為偶數(shù)。其次,表示存儲的內(nèi)容,對于字?jǐn)?shù)據(jù)(兩個字節(jié)),其高位存入高地址,低位存入低地址,如
xxxx:0200 2b ...var
xxxx:0201 01
xxxx:0202 00
xxxx:0203 01
對于整型變量 var,地址為0200,內(nèi)容為01H*256+2BH=01H*100H+2BH=256+32+11
若為雙字長整型變量var,則地址一般為4的整數(shù)倍。var的地址為0200,其內(nèi)容為01H*1000000H+01H*100H+ 2BH=4096+256+32+11。
640K~1M 的內(nèi)存稱為 UMB (upper memory block)
它分為a000H,b000H,c000H,d000H,e000H,f000H六個段,f000H段為ROM。存放的是ROM- BIOS(加電自檢程序、固化子程序庫、硬件參數(shù)等)。
加電時,盡管主機(jī)板廠家可以不同,計算機(jī)總是從 ffff:0000開始運行,其中存放的總是jmp指令,指向加電自檢程序(post)真正的起始處。
ffff段除了前16個內(nèi)存單元(物理地址<1M)外,還可以訪問地址超過1M的部分內(nèi)存,這部分內(nèi)存稱為HMA。
三、尋址方式(略)
取得操作數(shù)地址的方式稱為尋址方式。
(1)數(shù)據(jù)尋址
立即尋址:mov al,5
寄存器尋址:mov ax,bx
直接尋址:mov ax,[2000H]
寄存器間接尋址:mov ax,[bx]
寄存器相對尋址:mov ax,offset[si]
基址變址尋址:mov ax,[bx][di]
相對基址變址尋址:mov offset[bx][si]
(2)指令尋址
段內(nèi)直接尋址:jmp near ptr label1 //near ptr|short
段內(nèi)間接尋址:jmp word ptr [offset][bp]
段間直接尋址:jmp far ptr label2
段間間接尋址:jmp dword ptr [offset][bx]
(3)端口尋址:
四、指令系統(tǒng)(略)
(一) 指令的執(zhí)行時間
若時鐘周期為T,則指令的基本執(zhí)行時間如下(最佳尋址方式):
傳送mov, 2T
加法add, 3T
整數(shù)乘法imul, 128T~154T
整數(shù)除法idiv, 165T~184T
移位(即乘以2或除以2), 2T
無條件轉(zhuǎn)移, 15T
條件轉(zhuǎn)移, 不轉(zhuǎn)移 4T 轉(zhuǎn)移 16T
采用不同方式尋址的加法指令執(zhí)行時間如下:
寄存器到寄存器3T
存儲器到寄存器9T+EA
寄存器到存儲器16T+EA(訪問兩次存儲器)
立即數(shù)到寄存器4T
立即數(shù)到存儲器17T+EA(訪問兩次存儲器)
不同尋址方式計算有效地址EA所需時間:
直接尋址 6T
寄存器間接尋址 5T
寄存器相對尋址 9T
基址尋址 7T~8T
相對基址變址尋址 11T~12T
總結(jié):從指令執(zhí)行時間上看,應(yīng)盡量采用加法,避免乘法,盡量用移位不用乘法
盡量使用寄存器,少用存儲器。盡量用簡單的尋址方式,少用復(fù)雜的尋址方式。
(二) 指令系統(tǒng)
1.1 mov push pop xchg
1.2 in out xlat
1.3 lea lds les
1.4 lahf sahf pushf popf
注意:mov 等傳送指令相當(dāng)于賦值語句。in/out為基本的端口輸入和輸出
2.1 add adc inc
2.2 sub sbb dec neg cmp
2.3 mul imul
2.4 div idiv cbw cwd
2.5a daa das
2.5b aaa aas aam aad
3.1 and or not xor test
3.2 shl sal shr sal rol ror rcl rcr
4 movs cmps scas lods stos... ...rep repe|repz repne|repnz
5.1 jmp
5.2 jz|je jnz|jne js jns jo jno jp|jpe jnp|jpo jb|jnae|jc jnb|jae|jnc
... ...jb|jnae|jc jnb|jae|jnc jbe|jna jnbe|ja jl|jnge jnl|jge jle|jng jnle|jg
... ...jcxz
5.3 loop loopz|loope loopnz|loopne
5.4 call ret
5.5 int into iret
6.1 clc cmc stc cld std cli sti
6.2 nop hlt wait esc lock
五、匯編程序的格式
(1)匯編語言的語句種類與格式
1 指令語句
標(biāo)號:指令助記符 操作數(shù)1,操作數(shù)2;注釋
2 偽指令語句
名字 偽指令 參數(shù)1,參數(shù)2,...;注釋
符號定義語句:equ =
數(shù)據(jù)塊定義語句:db dw dd dq dt dup(?)
標(biāo)號及其屬性:
分析符type length size offset seg
標(biāo)號類型label byte word dword near far
合成符ptr this
3 宏指令
4 段定義
segment ends
定位類型:para bye word page
組合類型:public common stack memory at
類別:code data stack
5 過程定義
proc endp
6 其他偽定義
assume org end
name title
even
radix
short high low
+ - * / mod
and or xor not
eq ne lt gt le ge
(2) com 文件格式(略)
code segment public ‘code‘
org 100H
assume cs:code,ds:data,es:data
main proc near
jmp start
message db ‘How are u?$‘
start:mov ah,9
mov dx,offse message
int 21H
int 20H
main endp
code ends
end main
(3) exe 文件格式(略)
stack segment stack ‘stack‘
db 256dup(?)
stack ends
data segment public ‘data‘
......
data ends
code segment public ‘code‘
assume cs:code,ds:data,es:data,ss:stack
main proc far
push ds ;保護(hù)psp前綴
xor ax,ax
push ax ;保護(hù)偏移0地址
mov ax,data
mov ds,ax
mov es,ax
......
ret
main endp
code ends
end main
六、BIOS中斷和DOS功能調(diào)用(略)
相當(dāng)于高級語言中的庫函數(shù)或者系統(tǒng)子程序。
七、debug和匯編語言上機(jī)(略)
微機(jī)原理與匯編語言基礎(chǔ)
C語言能實現(xiàn)匯編語言的大部分功能,能進(jìn)行位運算,可以直接對硬件進(jìn)行操作,例如可以允許直接訪問內(nèi)存或端口的物理地址。因此,學(xué)習(xí)C語言的人掌握一定的匯編語言基礎(chǔ)是必要的。
一、80x86系列CPU的編程結(jié)構(gòu)
寄存器在匯編語言中的地位類似于變量。寄存器變量的訪問時間遠(yuǎn)小于內(nèi)存變量的訪問時間。在匯編語言中大量的使用寄存器而不是直接訪問內(nèi)存。
1 寄存器堆
8086CPU是Intel系列的16位微處理器,有16根數(shù)據(jù)線和20根地址線,直接尋址空間為2^20即1MB。 8088CPU的對外數(shù)據(jù)總線為8位,稱為準(zhǔn)16位微處理器。
8086/8088的內(nèi)部寄存器(register)共有14個,如下:
(1)通用寄存器:8個,包括數(shù)據(jù)寄存器、地址指針寄存器、變址寄存器。
數(shù)據(jù)寄存器4個:AX BX CX DX,它們又可作為8個8位的寄存器使用,即AH BH CH DH AL BL CL DL
AX稱為累加器,I/O指令均使用該寄存器,訪問外部硬件和接口。
BX稱為基址寄存器,在訪問內(nèi)存時用于存放基地址。
CX稱為計數(shù)寄存器,用于循環(huán)、字符串的循環(huán)控制。
DX稱為數(shù)據(jù)寄存器,在寄存器間接尋址的i/o指令中存放i/o地址,在作雙字運算時[DX][AX]構(gòu)成一個雙字。
地址指針寄存器2個:SP BP
SP稱為堆棧指針寄存器,BP稱為基址指針寄存器,在作數(shù)組和字符串運算時,用于存放內(nèi)存的偏移地址。
變址寄存器2個:SI DI
SI稱為源變址寄存器,DI稱為目的變址寄存器,用于數(shù)據(jù)塊操作的內(nèi)存尋址。
(2)段寄存器4個:CS DS ES SS
CS代碼段寄存器,DS數(shù)據(jù)段寄存器,ES附加段寄存器,SS堆棧段寄存器
用于存放段地址(段基址)
(3)指令指針I(yè)P:始終指向?qū)⒁獔?zhí)行的指令。用戶不能直接訪問和編程。
(4)標(biāo)志寄存器FLAGS:16位寄存器,8086/8088僅使用了九個標(biāo)志位。
2 標(biāo)志寄存器
CF:進(jìn)位標(biāo)志位
PF:奇偶標(biāo)志位
AF:輔助進(jìn)位位
ZF:零標(biāo)志位
SF:符號標(biāo)志位
OF:溢出標(biāo)志位
TF:跟蹤標(biāo)志位:單步標(biāo)志
IF:中斷標(biāo)志位
DF:方向標(biāo)志位
其中前六個為狀態(tài)標(biāo)志位,也叫條件碼,用作條件轉(zhuǎn)移指令中的判斷條件。
后三個為控制標(biāo)志位,對相關(guān)的操作起控制作用。
14個寄存器的內(nèi)容,將要執(zhí)行的指令,將要處理的數(shù)據(jù),被稱作CPU的“現(xiàn)場”, 用debug的r命令可以清楚地看到“現(xiàn)場”。
二、內(nèi)存的分段組織
計算機(jī)的基本存儲單位是字節(jié),由8個二進(jìn)制位組成,8個位捆綁使用??捎靡粋€兩位16進(jìn)制數(shù)表示其內(nèi)容。16位CPU一次可以處理兩個字節(jié)。
為了正確訪問內(nèi)存,每一個存儲器單位即字節(jié)必須給出一個地址。地址編號從0開始,依次加1,被稱為線性編址。
8086的地址線有20根,(詳述)能夠直接訪問的地址空間為2^20即1MB。即內(nèi)存的地址編號可以從0編到 1M。用16進(jìn)制數(shù)表示內(nèi)存的物理地址,其地址范圍為00000H~FFFFFH,為5位16進(jìn)制數(shù)。每一個內(nèi)存單元都有一個確定的20位物理地址。
但是,16位CPU的字長為16位,一次只能訪問2^16=64k內(nèi)存,如何訪問1M的內(nèi)存空間呢,在8086CPU中采用了地址分段的辦法。即每一個存儲單元的物理地址都有段地址和偏移地址兩部分構(gòu)成。
規(guī)定:(詳述)只有地址為16的整數(shù)倍的物理地址可以作為段地址。這樣,1MB的內(nèi)存空間被分為了 1M/16=64K個段。段地址的特征為xxxx0H。
我們知道了段地址和相對于段地址的段內(nèi)偏移量(偏移地址)后就可以確定一個內(nèi)存單元的物理地址了。所謂的偏移地址等于內(nèi)存單元的物理地址減去段地址,不得超過一段(即64k)。
段地址可以不用20位表示,而用16位表示,即xxxx0H=xxxxH*10H表示為xxxxH,用4位16進(jìn)制數(shù)表示。
物理地址的計算公式為:
物理地址=段地址*16+偏移地址
或者,物理地址=段地址*10H+偏移地址
乘以16相當(dāng)于左移4位。即段地址左移4位和偏移地址相加。按十六進(jìn)制數(shù)描述為,段地址左移一位和偏移地址相加。通常表示為
物理地址=段地址:偏移地址
例如:02002=0200:0002
可以看出,實際上偏移地址也是16位的,每一段的最大空間為2^16=64K,這樣,不同的段之間有重疊。也即意味著物理地址可以有不同的表示方法。或者說不同的表示方法可以表示同一個物理地址。
例如:02020=0200:0020=0100:1020=0000:2020=0202:0000=......
舉例說明:摩天大樓。
注意:實際上每個段并不一定占用64k的最大空間。
總結(jié):如此麻煩的做法帶來的好處是擴(kuò)大了內(nèi)存的表示空間,更重要的是,原本很麻煩的程序的再定位工作變得異常簡單,實際上一般的程序員以及高級語言并不關(guān)心段地址,段地址的分配工作交給操作系統(tǒng)了。
在高級語言中,變量有兩個含義:首先表示的是內(nèi)存的偏移地址,對于占用兩個以上存儲單元的變量,其地址是低地址,一般為偶數(shù)。其次,表示存儲的內(nèi)容,對于字?jǐn)?shù)據(jù)(兩個字節(jié)),其高位存入高地址,低位存入低地址,如
xxxx:0200 2b ...var
xxxx:0201 01
xxxx:0202 00
xxxx:0203 01
對于整型變量 var,地址為0200,內(nèi)容為01H*256+2BH=01H*100H+2BH=256+32+11
若為雙字長整型變量var,則地址一般為4的整數(shù)倍。var的地址為0200,其內(nèi)容為01H*1000000H+ 01H*100H+2BH=4096+256+32+11。
640K~1M 的內(nèi)存稱為 UMB (upper memory block)
它分為a000H,b000H,c000H,d000H,e000H,f000H六個段,f000H段為ROM。存放的是ROM -BIOS(加電自檢程序、固化子程序庫、硬件參數(shù)等)。
加電時,盡管主機(jī)板廠家可以不同,計算機(jī)總是從 ffff:0000開始運行,其中存放的總是jmp指令,指向加電自檢程序(post)真正的起始處。
ffff段除了前16個內(nèi)存單元(物理地址<1M)外,還可以訪問地址超過1M的部分內(nèi)存,這部分內(nèi)存稱為 HMA。
三、尋址方式(略)
取得操作數(shù)地址的方式稱為尋址方式。
(1)數(shù)據(jù)尋址
立即尋址:mov al,5
寄存器尋址:mov ax,bx
直接尋址:mov ax,[2000H]
寄存器間接尋址:mov ax,[bx]
寄存器相對尋址:mov ax,offset[si]
基址變址尋址:mov ax,[bx][di]
相對基址變址尋址:mov offset[bx][si]
(2)指令尋址
段內(nèi)直接尋址:jmp near ptr label1 //near ptr|short
段內(nèi)間接尋址:jmp word ptr [offset][bp]
段間直接尋址:jmp far ptr label2
段間間接尋址:jmp dword ptr [offset][bx]
(3)端口尋址:
四、指令系統(tǒng)(略)
(一) 指令的執(zhí)行時間
若時鐘周期為T,則指令的基本執(zhí)行時間如下(最佳尋址方式):
傳送mov, 2T
加法add, 3T
整數(shù)乘法imul, 128T~154T
整數(shù)除法idiv, 165T~184T
移位(即乘以2或除以2), & nbsp; 2T
無條件轉(zhuǎn)移, 15T
條件轉(zhuǎn)移, 不轉(zhuǎn)移 4T 轉(zhuǎn)移 16T
采用不同方式尋址的加法指令執(zhí)行時間如下:
寄存器到寄存器3T
存儲器到寄存器9T+EA
寄存器到存儲器16T+EA(訪問兩次存儲器)
立即數(shù)到寄存器4T
立即數(shù)到存儲器17T+EA(訪問兩次存儲器)
不同尋址方式計算有效地址EA所需時間:
直接尋址 6T
寄存器間接尋址 5T
寄存器相對尋址 9T
基址尋址 7T~8T
相對基址變址尋址 11T~12T
總結(jié):從指令執(zhí)行時間上看,應(yīng)盡量采用加法,避免乘法,盡量用移位不用乘法
盡量使用寄存器,少用存儲器。盡量用簡單的尋址方式,少用復(fù)雜的尋址方式。
(二) 指令系統(tǒng)
1.1 mov push pop xchg
1.2 in out xlat
1.3 lea lds les
1.4 lahf sahf pushf popf
注意:mov 等傳送指令相當(dāng)于賦值語句。in/out為基本的端口輸入和輸出
2.1 add adc inc
2.2 sub sbb dec neg cmp
2.3 mul imul
2.4 div idiv cbw cwd
2.5a daa das
2.5b aaa aas aam aad
3.1 and or not xor test
3.2 shl sal shr sal rol ror rcl rcr
4 movs cmps scas lods stos... ...rep repe|repz repne|repnz
5.1 jmp
5.2 jz|je jnz|jne js jns jo jno jp|jpe jnp|jpo jb|jnae|jc jnb|jae|jnc
... ...jb|jnae|jc jnb|jae|jnc jbe|jna jnbe|ja jl|jnge jnl|jge jle|jng jnle|jg
... ...jcxz
5.3 loop loopz|loope loopnz|loopne
5.4 call ret
5.5 int into iret
6.1 clc cmc stc cld std cli sti
6.2 nop hlt wait esc lock
五、匯編程序的格式
(1)匯編語言的語句種類與格式
1 指令語句
標(biāo)號:指令助記符 操作數(shù)1,操作數(shù)2;注釋
2 偽指令語句
名字 偽指令 參數(shù)1,參數(shù)2,...;注釋
符號定義語句:equ =
數(shù)據(jù)塊定義語句:db dw dd dq dt dup(?)
標(biāo)號及其屬性:
分析符type length size offset seg
標(biāo)號類型label byte word dword near far
合成符ptr this
3 宏指令
4 段定義
segment ends
定位類型:para bye word page
組合類型:public common stack memory at
類別:code data stack
5 過程定義
proc endp
6 其他偽定義
assume org end
name title
even
radix
short high low
+ - * / mod
and or xor not
eq ne lt gt le ge
(2) com 文件格式(略)
code segment public ‘code‘
org 100H
assume cs:code,ds:data,es:data
main proc near
jmp start
message db ‘How are u?$‘
start:mov ah,9
mov dx,offse message
int 21H
int 20H
main endp
code ends
end main
(3) exe 文件格式(略)
stack segment stack ‘stack‘
db 256dup(?)
stack ends
data segment public ‘data‘
......
data ends
code segment public ‘code‘
assume cs:code,ds:data,es:data,ss:stack
main proc far
push ds ;保護(hù)psp前綴
xor ax,ax
push ax ;保護(hù)偏移0地址
mov ax,data
mov ds,ax
mov es,ax
......
ret
main endp
code ends
end main
六、BIOS中斷和DOS功能調(diào)用(略)
相當(dāng)于高級語言中的庫函數(shù)或者系統(tǒng)子程序。
七、debug和匯編語言上機(jī)(略)