1構建泛型宏 (./linux/include/linux/kernel.h)
#define min(x, y) ({ \
typeof(x) _min1 = (x); \
typeof(y) _min2 = (y); \
(void) (&_min1 == &_min2); \
_min1 < _min2 ? _min1 : _min2; })
大家看了就明白是什么意思了。但是我還有幾點疑問:
(1)
(void) (&_min1 == &_min2);這行代碼是用來干什么的?
(2)為什么{}的外面要加(),不加的時候編譯是不通過的,具體是什么原因?
2 范圍的擴展
(1) switch 語句
switch(a)
{
case 1 ... 3:
printf("fafadsf");
break;
case 4 ... 8:
printf("dsafaf");
break;
}
(2)數(shù)組的初始化
int widths[] = { [0 ... 9] = 1, [10 ... 99] = 2, [100] = 3 };
以上部分內核中用的很多。
3 零長度的數(shù)組
struct iso_block_store {
atomic_t refcount;
size_t data_size;
quadlet_t data[0];
};
這允許結構中的元素引用結構實例后面緊接著的內存。在需要數(shù)量可變的數(shù)組成員時,這個特性很有用
應用實例:
struct iso_block_store * p =(void *)malloc(sizeof(struct iso_block_store) + data_size);
4 獲得函數(shù)的返回地址
如下面的代碼所示,__builtin_return_address
接收一個稱為 level
的參數(shù)。這個參數(shù)定義希望獲取返回地址的調用堆棧級別。例如,如果指定 level
為 0
,那么就是請求當前函數(shù)的返回地址。如果指定 level
為 1
,那么就是請求進行調用的函數(shù)的返回地址,依此類推。
void * __builtin_turn_address( unsigned int level ); |
在下面的示例中(見 ./linux/kernel/softirq.c),local_bh_disable
函數(shù)在本地處理器上禁用軟中斷,從而禁止在當前處理器上運行 softirqs、tasklets 和 bottom halves。使用 __builtin_return_address
捕捉返回地址,以便在以后進行跟蹤時使用這個地址。
void local_bh_disable(void) |
在編譯時,可以使用 GCC 提供的一個內置函數(shù)判斷一個值是否是常量。這種信息非常有價值,因為可以構造出能夠通過常量疊算(constant folding)優(yōu)化的表達式。__builtin_constant_p
函數(shù)用來檢測常量。
__builtin_constant_p
的原型如下所示。注意,__builtin_constant_p
并不能檢測出所有常量,因為 GCC 不容易證明某些值是否是常量。
int __builtin_constant_p( exp ) |
Linux 相當頻繁地使用常量檢測。在清單 3 所示的示例中(見 ./linux/include/linux/log2.h),使用常量檢測優(yōu)化 roundup_pow_of_two
宏。如果發(fā)現(xiàn)表達式是常量,那么就使用可以優(yōu)化的常量表達式。如果表達式不是常量,就調用另一個宏函數(shù)把值向上取整到 2 的冪。
|
GCC 提供許多函數(shù)級屬性,可以通過它們向編譯器提供更多數(shù)據(jù),幫助編譯器執(zhí)行優(yōu)化。本節(jié)描述與功能相關聯(lián)的一些屬性。
屬性通過其他符號定義指定了別名??梢砸源藥椭喿x源代碼參考,了解屬性的使用方法(見 ./linux/include/linux/compiler-gcc3.h)。
|
定義是 GCC 中可用的一些函數(shù)屬性。它們也是在 Linux 內核中最有用的函數(shù)屬性。下面解釋如何使用這些屬性:
always_inline
讓 GCC 以內聯(lián)方式處理指定的函數(shù),無論是否啟用了優(yōu)化。deprecated
指出函數(shù)已經被廢棄,不應該再使用。如果試圖使用已經廢棄的函數(shù),就會收到警告。還可以對類型和變量應用這個屬性,促使開發(fā)人員盡可能少使用它們。__used__
告訴編譯器無論 GCC 是否發(fā)現(xiàn)這個函數(shù)的調用實例,都要使用這個函數(shù)。這對于從匯編代碼中調用 C 函數(shù)有幫助。__const__
告訴編譯器某個函數(shù)是無狀態(tài)的(也就是說,它使用傳遞給它的參數(shù)生成要返回的結果)。warn_unused_result
讓編譯器檢查所有調用者是否都檢查函數(shù)的結果。這確保調用者適當?shù)貦z驗函數(shù)結果,從而能夠適當?shù)靥幚礤e誤。下面是在 Linux 內核中使用這些屬性的示例。deprecated
示例來自與體系結構無關的內核(./linux/kernel/resource.c),const
示例來自 IA64 內核源代碼(./linux/arch/ia64/kernel/unwind.c)。
int __deprecated __check_region(struct resource |
在 Linux 內核中最常用的優(yōu)化技術之一是 __builtin_expect
。在開發(fā)人員使用有條件代碼時,常常知道最可能執(zhí)行哪個分支,而哪個分支很少執(zhí)行。如果編譯器知道這種預測信息,就可以圍繞最可能執(zhí)行的分支生成最優(yōu)的代碼。
如下所示,__builtin_expect
的使用方法基于兩個宏 likely
和 unlikely
(見 ./linux/include/linux/compiler.h)。
#define likely(x) __builtin_expect(!!(x), 1) |
通過使用 __builtin_expect
,編譯器可以做出符合提供的預測信息的指令選擇決策。這使執(zhí)行的代碼盡可能接近實際情況。它還可以改進緩存和指令流水線。
例如,如果一個條件標上了 “likely”,那么編譯器可以把代碼的 True部分直接放在分支指令后面(這樣就不需要執(zhí)行分支指令)。通過分支指令訪問條件結構的 False部分,這不是最優(yōu)的方式,但是訪問它的可能性不大。按照這種方式,代碼對于最可能出現(xiàn)的情況是最優(yōu)的。
下面給出一個使用 likely
和 unlikely
宏的函數(shù)(見 ./linux/net/core/datagram.c)。這個函數(shù)預測 sum
變量將是零(數(shù)據(jù)包的 checksum
是有效的),而且 ip_summed
變量不等于 CHECKSUM_HW
。
|
另一種重要的性能改進方法是把必需的數(shù)據(jù)緩存在接近處理器的地方。緩存可以顯著減少訪問數(shù)據(jù)花費的時間。大多數(shù)現(xiàn)代處理器都有三類內存:
為了盡可能減少訪問延時并由此提高性能,最好把數(shù)據(jù)放在最近的內存中。手工執(zhí)行這個任務稱為預抓取。GCC 通過內置函數(shù) __builtin_prefetch
支持數(shù)據(jù)的手工預抓取。在需要數(shù)據(jù)之前,使用這個函數(shù)把數(shù)據(jù)放到緩存中。如下所示,__builtin_prefetch
函數(shù)接收三個參數(shù):
rw
參數(shù),使用它指明預抓取數(shù)據(jù)是為了執(zhí)行讀操作,還是執(zhí)行寫操作locality
參數(shù),使用它指定在使用數(shù)據(jù)之后數(shù)據(jù)應該留在緩存中,還是應該清除 void __builtin_prefetch( const void *addr, int rw, int locality ); |
Linux 內核經常使用預抓取。通常是通過宏和包裝器函數(shù)使用預抓取。下面是一個輔助函數(shù)示例,它使用內置函數(shù)的包裝器(見./linux/include/linux/prefetch.h)。這個函數(shù)為流操作實現(xiàn)預抓取機制。使用這個函數(shù)通??梢詼p少緩存缺失和停頓,從而提高性能。
|
除了本文前面討論的函數(shù)屬性之外,GCC 還為變量和類型定義提供了屬性。最重要的屬性之一是 aligned
屬性,它用于在內存中實現(xiàn)對象對齊。除了對于性能很重要之外,某些設備或硬件配置也需要對象對齊。aligned
屬性有一個參數(shù),它指定所需的對齊類型。
下面的示例用于軟件暫停(見 ./linux/arch/i386/mm/init.c)。在需要頁面對齊時,定義 PAGE_SIZE
對象。
char __nosavedata swsusp_pg_dir[PAGE_SIZE] |
packed
屬性打包一個結構的元素,從而盡可能減少它們占用的空間。這意味著,如果定義一個 char
變量,它占用的空間不會超過一字節(jié)(8 位)。位字段壓縮為一位,而不會占用更多存儲空間。__attribute__
聲明進行優(yōu)化,它用逗號分隔的列表定義多個屬性。
|