国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
Linux操作系統(tǒng)網(wǎng)絡(luò)驅(qū)動程序編寫 - Ursa

------------------ Linux操作系統(tǒng)網(wǎng)絡(luò)驅(qū)動程序編寫 -------------------
------------ Contact the author by mailto:bordi@bordi.dhs.org ------

Linux操作系統(tǒng)網(wǎng)絡(luò)驅(qū)動程序編寫

一.Linux系統(tǒng)設(shè)備驅(qū)動程序概述
1.1 Linux設(shè)備驅(qū)動程序分類
1.2 編寫驅(qū)動程序的一些基本概念
二.Linux系統(tǒng)網(wǎng)絡(luò)設(shè)備驅(qū)動程序
2.1 網(wǎng)絡(luò)驅(qū)動程序的結(jié)構(gòu)
2.2 網(wǎng)絡(luò)驅(qū)動程序的基本方法
2.3 網(wǎng)絡(luò)驅(qū)動程序中用到的數(shù)據(jù)結(jié)構(gòu)
2.4 常用的系統(tǒng)支持
三.編寫Linux網(wǎng)絡(luò)驅(qū)動程序中可能遇到的問題
3.1 中斷共享
3.2 硬件發(fā)送忙時的處理
3.3 流量控制(flow control)
3.4 調(diào)試
四.進(jìn)一步的閱讀
五.雜項




一.Linux系統(tǒng)設(shè)備驅(qū)動程序概述
1.1 Linux設(shè)備驅(qū)動程序分類
Linux設(shè)備驅(qū)動程序在Linux的內(nèi)核源代碼中占有很大的比例,源代碼的長度日
益增加,主要是驅(qū)動程序的增加。在Linux內(nèi)核的不斷升級過程中,驅(qū)動程序的結(jié)構(gòu)
還是相對穩(wěn)定。在2.0.xx到2.2.xx的變動里,驅(qū)動程序的編寫做了一些改變,但是
從2.0.xx的驅(qū)動到2.2.xx的移植只需做少量的工作。

Linux系統(tǒng)的設(shè)備分為字符設(shè)備(char device),塊設(shè)備(block device)和網(wǎng)絡(luò)
設(shè)備(network device)三種。字符設(shè)備是指存取時沒有緩存的設(shè)備。塊設(shè)備的讀寫
都有緩存來支持,并且塊設(shè)備必須能夠隨機(jī)存取(random access),字符設(shè)備則沒有
這個要求。典型的字符設(shè)備包括鼠標(biāo),鍵盤,串行口等。塊設(shè)備主要包括硬盤軟盤
設(shè)備,CD-ROM等。一個文件系統(tǒng)要安裝進(jìn)入操作系統(tǒng)必須在塊設(shè)備上。

網(wǎng)絡(luò)設(shè)備在Linux里做專門的處理。Linux的網(wǎng)絡(luò)系統(tǒng)主要是基于BSD unix的socket
機(jī)制。在系統(tǒng)和驅(qū)動程序之間定義有專門的數(shù)據(jù)結(jié)構(gòu)(sk_buff)進(jìn)行數(shù)據(jù)的傳遞。系
統(tǒng)里支持對發(fā)送數(shù)據(jù)和接收數(shù)據(jù)的緩存,提供流量控制機(jī)制,提供對多協(xié)議的支持。


1.2 編寫驅(qū)動程序的一些基本概念
無論是什么操作系統(tǒng)的驅(qū)動程序,都有一些通用的概念。操作系統(tǒng)提供給驅(qū)動
程序的支持也大致相同。下面簡單介紹一下網(wǎng)絡(luò)設(shè)備驅(qū)動程序的一些基本要求。

1.2.1 發(fā)送和接收
這是一個網(wǎng)絡(luò)設(shè)備最基本的功能。一塊網(wǎng)卡所做的無非就是收發(fā)工作。所以驅(qū)
動程序里要告訴系統(tǒng)你的發(fā)送函數(shù)在哪里,系統(tǒng)在有數(shù)據(jù)要發(fā)送時就會調(diào)用你的發(fā)
送程序。還有驅(qū)動程序由于是直接操縱硬件的,所以網(wǎng)絡(luò)硬件有數(shù)據(jù)收到最先能得
到這個數(shù)據(jù)的也就是驅(qū)動程序,它負(fù)責(zé)把這些原始數(shù)據(jù)進(jìn)行必要的處理然后送給系
統(tǒng)。這里,操作系統(tǒng)必須要提供兩個機(jī)制,一個是找到驅(qū)動程序的發(fā)送函數(shù),一個
是驅(qū)動程序把收到的數(shù)據(jù)送給系統(tǒng)。

1.2.2 中斷
中斷在現(xiàn)代計算機(jī)結(jié)構(gòu)中有重要的地位。操作系統(tǒng)必須提供驅(qū)動程序響應(yīng)中斷
的能力。一般是把一個中斷處理程序注冊到系統(tǒng)中去。操作系統(tǒng)在硬件中斷發(fā)生后
調(diào)用驅(qū)動程序的處理程序。Linux支持中斷的共享,即多個設(shè)備共享一個中斷。

1.2.3 時鐘
在實現(xiàn)驅(qū)動程序時,很多地方會用到時鐘。如某些協(xié)議里的超時處理,沒有中
斷機(jī)制的硬件的輪詢等。操作系統(tǒng)應(yīng)為驅(qū)動程序提供定時機(jī)制。一般是在預(yù)定的時
間過了以后回調(diào)注冊的時鐘函數(shù)。在網(wǎng)絡(luò)驅(qū)動程序中,如果硬件沒有中斷功能,定
時器可以提供輪詢(poll)方式對硬件進(jìn)行存取?;蛘呤菍崿F(xiàn)某些協(xié)議時需要的超時
重傳等。

二.Linux系統(tǒng)網(wǎng)絡(luò)設(shè)備驅(qū)動程序

2.1 網(wǎng)絡(luò)驅(qū)動程序的結(jié)構(gòu)
所有的Linux網(wǎng)絡(luò)驅(qū)動程序遵循通用的接口。設(shè)計時采用的是面向?qū)ο蟮姆椒ā?
一個設(shè)備就是一個對象(device 結(jié)構(gòu)),它內(nèi)部有自己的數(shù)據(jù)和方法。每一個設(shè)備的
方法被調(diào)用時的第一個參數(shù)都是這個設(shè)備對象本身。這樣這個方法就可以存取自身
的數(shù)據(jù)(類似面向?qū)ο蟪绦蛟O(shè)計時的this引用)。
一個網(wǎng)絡(luò)設(shè)備最基本的方法有初始化、發(fā)送和接收。

------------------- ---------------------
|deliver packets | |receive packets queue|
|(dev_queue_xmit()) | |them(netif_rx()) |
------------------- ---------------------
| | / \\
\\ / | |
-------------------------------------------------------
| methods and variables(initialize,open,close,hard_xmit,|
| interrupt handler,config,resources,status...) |
-------------------------------------------------------
| | / \\
\\ / | |
----------------- ----------------------
|send to hardware | |receivce from hardware|
----------------- ----------------------
| | / \\
\\ / | |
-----------------------------------------------------
| hardware media |
-----------------------------------------------------

初始化程序完成硬件的初始化、device中變量的初始化和系統(tǒng)資源的申請。發(fā)送
程序是在驅(qū)動程序的上層協(xié)議層有數(shù)據(jù)要發(fā)送時自動調(diào)用的。一般驅(qū)動程序中不對發(fā)
送數(shù)據(jù)進(jìn)行緩存,而是直接使用硬件的發(fā)送功能把數(shù)據(jù)發(fā)送出去。接收數(shù)據(jù)一般是通
過硬件中斷來通知的。在中斷處理程序里,把硬件幀信息填入一個skbuff結(jié)構(gòu)中,然

------------------ Linux操作系統(tǒng)網(wǎng)絡(luò)驅(qū)動程序編寫 -------------------
------------ Contact the author by mailto:bordi@bordi.dhs.org ------

后調(diào)用netif_rx()傳遞給上層處理。


2.2 網(wǎng)絡(luò)驅(qū)動程序的基本方法
網(wǎng)絡(luò)設(shè)備做為一個對象,提供一些方法供系統(tǒng)訪問。正是這些有統(tǒng)一接口的方法,
掩蔽了硬件的具體細(xì)節(jié),讓系統(tǒng)對各種網(wǎng)絡(luò)設(shè)備的訪問都采用統(tǒng)一的形式,做到硬件
無關(guān)性。
下面解釋最基本的方法。
2.2.1 初始化(initialize)
驅(qū)動程序必須有一個初始化方法。在把驅(qū)動程序載入系統(tǒng)的時候會調(diào)用這個初
始化程序。它做以下幾方面的工作。檢測設(shè)備。在初始化程序里你可以根據(jù)硬件的
特征檢查硬件是否存在,然后決定是否啟動這個驅(qū)動程序。配置和初始化硬件。在
初始化程序里你可以完成對硬件資源的配置,比如即插即用的硬件就可以在這個時
候進(jìn)行配置(Linux內(nèi)核對PnP功能沒有很好的支持,可以在驅(qū)動程序里完成這個功
能)。配置或協(xié)商好硬件占用的資源以后,就可以向系統(tǒng)申請這些資源。有些資源是
可以和別的設(shè)備共享的,如中斷。有些是不能共享的,如IO、DMA。接下來你要初始
化device結(jié)構(gòu)中的變量。最后,你可以讓硬件正式開始工作。

2.2.2 打開(open)
open這個方法在網(wǎng)絡(luò)設(shè)備驅(qū)動程序里是網(wǎng)絡(luò)設(shè)備被激活的時候被調(diào)用(即設(shè)備狀
態(tài)由down-->up)。所以實際上很多在initialize中的工作可以放到這里來做。比如資
源的申請,硬件的激活。如果dev->open返回非0(error),則硬件的狀態(tài)還是down。
Open方法另一個作用是如果驅(qū)動程序做為一個模塊被裝入,則要防止模塊卸載時
設(shè)備處于打開狀態(tài)。在open方法里要調(diào)用MOD_INC_USE_COUNT宏。

2.2.3 關(guān)閉(stop)
close方法做和open相反的工作??梢葬尫拍承┵Y源以減少系統(tǒng)負(fù)擔(dān)。Close是在
設(shè)備狀態(tài)由up轉(zhuǎn)為down時被調(diào)用的。另外如果是做為模塊裝入的驅(qū)動程序,close里
應(yīng)該調(diào)用MOD_DEC_USE_COUNT,減少設(shè)備被引用的次數(shù),以使驅(qū)動程序可以被卸載。
另外close方法必須返回成功(0==success)。

2.2.4 發(fā)送(hard_start_xmit)
所有的網(wǎng)絡(luò)設(shè)備驅(qū)動程序都必須有這個發(fā)送方法。在系統(tǒng)調(diào)用驅(qū)動程序的xmit
時,發(fā)送的數(shù)據(jù)放在一個sk_buff結(jié)構(gòu)中。一般的驅(qū)動程序把數(shù)據(jù)傳給硬件發(fā)出去。
也有一些特殊的設(shè)備比如loopback把數(shù)據(jù)組成一個接收數(shù)據(jù)再回送給系統(tǒng),或者
dummy設(shè)備直接丟棄數(shù)據(jù)。
如果發(fā)送成功,hard_start_xmit方法里釋放sk_buff,返回0(發(fā)送成功)。如果
設(shè)備暫時無法處理,比如硬件忙,則返回1。這時如果dev->tbusy置為非0,則系統(tǒng)
認(rèn)為硬件忙,要等到dev->tbusy置0以后才會再次發(fā)送。Tbusy的置0任務(wù)一般由中斷
完成。硬件在發(fā)送結(jié)束后產(chǎn)生中斷,這時可以把tbusy置0,然后用mark_bh()調(diào)用通
知系統(tǒng)可以再次發(fā)送。在發(fā)送不成功的情況下,也可以不置dev->tbusy為非0,這樣
系統(tǒng)會不斷嘗試重發(fā)。如果hard_start_xmit發(fā)送不成功,則不要釋放sk_buff。
傳送下來的sk_buff中的數(shù)據(jù)已經(jīng)包含硬件需要的幀頭。所以在發(fā)送方法里不需
要再填充硬件幀頭,數(shù)據(jù)可以直接提交給硬件發(fā)送。Sk_buff是被鎖住的(locked),
確保其他程序不會存取它。

2.2.5 接收(reception)
驅(qū)動程序并不存在一個接收方法。有數(shù)據(jù)收到應(yīng)該是驅(qū)動程序來通知系統(tǒng)的。
一般設(shè)備收到數(shù)據(jù)后都會產(chǎn)生一個中斷,在中斷處理程序中驅(qū)動程序申請一塊
sk_buff(skb),從硬件讀出數(shù)據(jù)放置到申請好的緩沖區(qū)里。接下來填充sk_buff中
的一些信息。Skb->dev = dev,判斷收到幀的協(xié)議類型,填入skb->protocol(多協(xié)
議的支持)。把指針skb->mac.raw指向硬件數(shù)據(jù)然后丟棄硬件幀頭(skb_pull)。還要
設(shè)置skb->pkt_type,標(biāo)明第二層(鏈路層)數(shù)據(jù)類型??梢允且韵骂愋停?
PACKET_BROADCAST : 鏈路層廣播
PACKET_MULTICAST : 鏈路層組播
PACKET_SELF : 發(fā)給自己的幀
PACKET_OTHERHOST : 發(fā)給別人的幀(監(jiān)聽模式時會有這種幀)

最后調(diào)用netif_rx()把數(shù)據(jù)傳送給協(xié)議層。Netif_rx()里數(shù)據(jù)放入處理隊列然后返
回,真正的處理是在中斷返回以后,這樣可以減少中斷時間。調(diào)用netif_rx()以后,
驅(qū)動程序就不能再存取數(shù)據(jù)緩沖區(qū)skb。

2.2.6 硬件幀頭(hard_header)
硬件一般都會在上層數(shù)據(jù)發(fā)送之前加上自己的硬件幀頭,比如以太網(wǎng)(Ethernet)
就有14字節(jié)的幀頭。這個幀頭是加在上層ip、ipx等數(shù)據(jù)包的前面的。驅(qū)動程序提供
一個hard_header方法,協(xié)議層(ip、ipx、arp等)在發(fā)送數(shù)據(jù)之前會調(diào)用這段程序。
硬件幀頭的長度必須填在dev->hard_header_len,這樣協(xié)議層回在數(shù)據(jù)之前保留好
硬件幀頭的空間。這樣hard_header程序只要調(diào)用skb_push然后正確填入硬件幀頭就
可以了。
在協(xié)議層調(diào)用hard_header時,傳送的參數(shù)包括(2.0.xx):數(shù)據(jù)的sk_buff,
device指針,protocol,目的地址(daddr),源地址(saddr),數(shù)據(jù)長度(len)。數(shù)據(jù)
長度不要使用sk_buff中的參數(shù),因為調(diào)用hard_header時數(shù)據(jù)可能還沒完全組織好。
Saddr是NULL的話是使用缺省地址(default)。Daddr是NULL表明協(xié)議層不知道硬件目
的地址。如果hard_header完全填好了硬件幀頭,則返回添加的字節(jié)數(shù)。如果硬件幀
頭中的信息還不完全(比如daddr為NULL,但是幀頭中需要目的硬件地址。典型的情
況是以太網(wǎng)需要地址解析(arp)),則返回負(fù)字節(jié)數(shù)。Hard_header返回負(fù)數(shù)的情況
下,協(xié)議層會做進(jìn)一步的build header的工作。目前Linux系統(tǒng)里就是做arp
(如果hard_header返回正,dev->arp=1,表明不需要做arp,返回負(fù),dev->arp=0,
做arp)。
對hard_header的調(diào)用在每個協(xié)議層的處理程序里。如ip_output。

2.2.7 地址解析(xarp)
有些網(wǎng)絡(luò)有硬件地址(比如Ethernet),并且在發(fā)送硬件幀時需要知道目的硬件
地址。這樣就需要上層協(xié)議地址(ip、ipx)和硬件地址的對應(yīng)。這個對應(yīng)是通過地址
解析完成的。需要做arp的的設(shè)備在發(fā)送之前會調(diào)用驅(qū)動程序的rebuild_header方
法。調(diào)用的主要參數(shù)包括指向硬件幀頭的指針,協(xié)議層地址。如果驅(qū)動程序能夠解
析硬件地址,就返回1,如果不能,返回0。
對rebuild_header的調(diào)用在net/core/dev.c的do_dev_queue_xmit()里。

2.2.8 參數(shù)設(shè)置和統(tǒng)計數(shù)據(jù)
在驅(qū)動程序里還提供一些方法供系統(tǒng)對設(shè)備的參數(shù)進(jìn)行設(shè)置和讀取信息。一般
只有超級用戶(root)權(quán)限才能對設(shè)備參數(shù)進(jìn)行設(shè)置。設(shè)置方法有:
dev->set_mac_address()
當(dāng)用戶調(diào)用ioctl類型為SIOCSIFHWADDR時是要設(shè)置這個設(shè)備的mac地址。一般
對mac地址的設(shè)置沒有太大意義的。
Dev->set_config()

------------------ Linux操作系統(tǒng)網(wǎng)絡(luò)驅(qū)動程序編寫 -------------------
------------ Contact the author by mailto:bordi@bordi.dhs.org ------

當(dāng)用戶調(diào)用ioctl時類型為SIOCSIFMAP時,系統(tǒng)會調(diào)用驅(qū)動程序的set_config
方法。用戶會傳遞一個ifmap結(jié)構(gòu)包含需要的I/O、中斷等參數(shù)。
Dev->do_ioctl()
如果用戶調(diào)用ioctl時類型在SIOCDEVPRIVATE和SIOCDEVPRIVATE+15之間,系統(tǒng)
會調(diào)用驅(qū)動程序的這個方法。一般是設(shè)置設(shè)備的專用數(shù)據(jù)。
讀取信息也是通過ioctl調(diào)用進(jìn)行。除次之外驅(qū)動程序還可以提供一個
dev->get_stats方法,返回一個enet_statistics結(jié)構(gòu),包含發(fā)送接收的統(tǒng)計信息。
Ioctl的處理在net/core/dev.c的dev_ioctl()和dev_ifsioc()里。


2.3 網(wǎng)絡(luò)驅(qū)動程序中用到的數(shù)據(jù)結(jié)構(gòu)
最重要的是網(wǎng)絡(luò)設(shè)備的數(shù)據(jù)結(jié)構(gòu)。定義在include/linux/netdevice.h里。它
的注釋已經(jīng)足夠詳盡。
Struct device
{

/*
* This is the first field of the \"visible\" part of this structure
* (I.e. As seen by users in the \"Space.c\" file). It is the name
* the interface.
*/
char *name;

/* I/O specific fields - FIXME: Merge these and struct ifmap into one */
unsigned long rmem_end; /* shmem \"recv\" end */
unsigned long rmem_start; /* shmem \"recv\" start */
unsigned long mem_end; /* shared mem end */
unsigned long mem_start; /* shared mem start */
unsigned long base_addr; /* device I/O address */
unsigned char irq; /* device IRQ number */

/* Low-level status flags. */
volatile unsigned char start, /* start an operation */
interrupt; /* interrupt arrived */
/* 在處理中斷時interrupt設(shè)為1,處理完清0。 */
unsigned long tbusy; /* transmitter busy must be long for
bitops */

struct device *next;

/* The device initialization function. Called only once. */
/* 指向驅(qū)動程序的初始化方法。 */
int (*init)(struct device *dev);

/* Some hardware also needs these fields, but they are not part of the
usual set specified in Space.c. */
/* 一些硬件可以在一塊板上支持多個接口,可能用到if_port。 */
unsigned char if_port; /* Selectable AUI, TP,..*/
unsigned char dma; /* DMA channel */

struct enet_statistics* (*get_stats)(struct device *dev);

/*
* This marks the end of the \"visible\" part of the structure. All
* fields hereafter are internal to the system, and may change at
* will (read: may be cleaned up at will).
*/

/* These may be needed for future network-power-down code. */
/* trans_start記錄最后一次成功發(fā)送的時間??梢杂脕泶_定硬件是否工作正常。*/
unsigned long trans_start; /* Time (in jiffies) of last Tx */
unsigned long last_rx; /* Time of last Rx */

/* flags里面有很多內(nèi)容,定義在include/linux/if.h里。*/
unsigned short flags; /* interface flags (a la BSD) */
unsigned short family; /* address family ID (AF_INET) */
unsigned short metric; /* routing metric (not used) */
unsigned short mtu; /* interface MTU value */

/* type標(biāo)明物理硬件的類型。主要說明硬件是否需要arp。定義在
include/linux/if_arp.h里。 */
unsigned short type; /* interface hardware type */

/* 上層協(xié)議層根據(jù)hard_header_len在發(fā)送數(shù)據(jù)緩沖區(qū)前面預(yù)留硬件幀頭空間。*/
unsigned short hard_header_len; /* hardware hdr length */

/* priv指向驅(qū)動程序自己定義的一些參數(shù)。*/
void *priv; /* pointer to private data */

/* Interface address info. */
unsigned char broadcast[MAX_ADDR_LEN]; /* hw bcast add */
unsigned char pad; /* make dev_addr aligned to 8
bytes */
unsigned char dev_addr[MAX_ADDR_LEN]; /* hw address */
unsigned char addr_len; /* hardware address length */
unsigned long pa_addr; /* protocol address */
unsigned long pa_brdaddr; /* protocol broadcast addr */
unsigned long pa_dstaddr; /* protocol P-P other side addr */
unsigned long pa_mask; /* protocol netmask */
unsigned short pa_alen; /* protocol address length */

struct dev_mc_list *mc_list; /* Multicast mac addresses */
int mc_count; /* Number of installed mcasts */

struct ip_mc_list *ip_mc_list; /* IP multicast filter chain */
__u32 tx_queue_len; /* Max frames per queue allowed */


------------------ Linux操作系統(tǒng)網(wǎng)絡(luò)驅(qū)動程序編寫 -------------------
------------ Contact the author by mailto:bordi@bordi.dhs.org ------

/* For load balancing driver pair support */

unsigned long pkt_queue; /* Packets queued */
struct device *slave; /* Slave device */
struct net_alias_info *alias_info; /* main dev alias info */
struct net_alias *my_alias; /* alias devs */

/* Pointer to the interface buffers. */
struct sk_buff_head buffs[DEV_NUMBUFFS];

/* Pointers to interface service routines. */
int (*open)(struct device *dev);
int (*stop)(struct device *dev);
int (*hard_start_xmit) (struct sk_buff *skb,
struct device *dev);
int (*hard_header) (struct sk_buff *skb,
struct device *dev,
unsigned short type,
void *daddr,
void *saddr,
unsigned len);
int (*rebuild_header)(void *eth, struct device *dev,
unsigned long raddr, struct sk_buff *skb);
#define HAVE_MULTICAST
void (*set_multicast_list)(struct device *dev);
#define HAVE_SET_MAC_ADDR
int (*set_mac_address)(struct device *dev, void *addr);
#define HAVE_PRIVATE_IOCTL
int (*do_ioctl)(struct device *dev, struct ifreq *ifr, int cmd);
#define HAVE_SET_CONFIG
int (*set_config)(struct device *dev, struct ifmap *map);
#define HAVE_HEADER_CACHE
void (*header_cache_bind)(struct hh_cache **hhp, struct device
*dev, unsigned short htype, __u32 daddr);
void (*header_cache_update)(struct hh_cache *hh, struct device
*dev, unsigned char * haddr);
#define HAVE_CHANGE_MTU
int (*change_mtu)(struct device *dev, int new_mtu);

struct iw_statistics* (*get_wireless_stats)(struct device *dev);
};


2.4 常用的系統(tǒng)支持

2.4.1 內(nèi)存申請和釋放
include/linux/kernel.h里聲明了kmalloc()和kfree()。用于在內(nèi)核模式下申
請和釋放內(nèi)存。
Void *kmalloc(unsigned int len,int priority);
void kfree(void *__ptr);
與用戶模式下的malloc()不同,kmalloc()申請空間有大小限制。長度是2的整
次方??梢陨暾埖淖畲箝L度也有限制。另外kmalloc()有priority參數(shù),通常使用
時可以為GFP_KERNEL,如果在中斷里調(diào)用用GFP_ATOMIC參數(shù),因為使用GFP_KERNEL
則調(diào)用者可能進(jìn)入sleep狀態(tài),在處理中斷時是不允許的。
Kfree()釋放的內(nèi)存必須是kmalloc()申請的。如果知道內(nèi)存的大小,也可以用
kfree_s()釋放。

2.4.2 request_irq()、free_irq()
這是驅(qū)動程序申請中斷和釋放中斷的調(diào)用。在include/linux/sched.h里聲明。
Request_irq()調(diào)用的定義:
int request_irq(unsigned int irq,
void (*handler)(int irq, void *dev_id, struct pt_regs *regs),
unsigned long irqflags,
const char * devname,
void *dev_id);
irq是要申請的硬件中斷號。在Intel平臺,范圍0--15。Handler是向系統(tǒng)登記
的中斷處理函數(shù)。這是一個回調(diào)函數(shù),中斷發(fā)生時,系統(tǒng)調(diào)用這個函數(shù),傳入的參
數(shù)包括硬件中斷號,device id,寄存器值。Dev_id就是下面的request_irq時傳遞
給系統(tǒng)的參數(shù)dev_id。Irqflags是中斷處理的一些屬性。比較重要的有SA_INTERRUPT,
標(biāo)明中斷處理程序是快速處理程序(設(shè)置SA_INTERRUPT)還是慢速處理程序(不設(shè)置
SA_INTERRUPT)??焖偬幚沓绦虮徽{(diào)用時屏蔽所有中斷。慢速處理程序不屏蔽。還有
一個SA_SHIRQ屬性,設(shè)置了以后運行多個設(shè)備共享中斷。Dev_id在中斷共享時會用
到。一般設(shè)置為這個設(shè)備的device結(jié)構(gòu)本身或者NULL。中斷處理程序可以用dev_id
找到相應(yīng)的控制這個中斷的設(shè)備,或者用irq2dev_map找到中斷對應(yīng)的設(shè)備。
Void free_irq(unsigned int irq,void *dev_id);

2.4.3 時鐘
時鐘的處理類似中斷,也是登記一個時間處理函數(shù),在預(yù)定的時間過后,系統(tǒng)
會調(diào)用這個函數(shù)。在include/linux/timer.h里聲明。
Struct timer_list {
struct timer_list *next;
struct timer_list *prev;
unsigned long expires;
unsigned long data;
void (*function)(unsigned long);
};
void add_timer(struct timer_list * timer);
int del_timer(struct timer_list * timer);
void init_timer(struct timer_list * timer);
使用時鐘,先聲明一個timer_list結(jié)構(gòu),調(diào)用init_timer對它進(jìn)行初始化。
Time_list結(jié)構(gòu)里expires是標(biāo)明這個時鐘的周期,單位采用jiffies的單位。
Jiffies是Linux一個全局變量,代表時間。它的單位隨硬件平臺的不同而不同。
系統(tǒng)里定義了一個常數(shù)HZ,代表每秒種最小時間間隔的數(shù)目。這樣jiffies的單位
就是1/HZ。Intel平臺jiffies的單位是1/100秒,這就是系統(tǒng)所能分辨的最小時間
間隔了。所以expires/HZ就是以秒為單位的這個時鐘的周期。
Function就是時間到了以后的回調(diào)函數(shù),它的參數(shù)就是timer_list中的data。
Data這個參數(shù)在初始化時鐘的時候賦值,一般賦給它設(shè)備的device結(jié)構(gòu)指針。
在預(yù)置時間到系統(tǒng)調(diào)用function,同時系統(tǒng)把這個time_list從定時隊列里清
除。所以如果需要一直使用定時函數(shù),要在function里再次調(diào)用add_timer()把這

------------------ Linux操作系統(tǒng)網(wǎng)絡(luò)驅(qū)動程序編寫 -------------------
------------ Contact the author by mailto:bordi@bordi.dhs.org ------

個timer_list加進(jìn)定時隊列。

2.4.4 I/O
I/O端口的存取使用:
inline unsigned int inb(unsigned short port);
inline unsigned int inb_p(unsigned short port);
inline void outb(char value, unsigned short port);
inline void outb_p(char value, unsigned short port);
在include/adm/io.h里定義。
Inb_p()、outb_p()與inb()、outb_p()的不同在于前者在存取I/O時有等待
(pause)一適應(yīng)慢速的I/O設(shè)備。
為了防止存取I/O時發(fā)生沖突,Linux提供對端口使用情況的控制。在使用端口
之前,可以檢查需要的I/O是否正在被使用,如果沒有,則把端口標(biāo)記為正在使用,
使用完后再釋放。系統(tǒng)提供以下幾個函數(shù)做這些工作。
Int check_region(unsigned int from, unsigned int extent);
void request_region(unsigned int from, unsigned int extent,const char *name);
void release_region(unsigned int from, unsigned int extent);
其中的參數(shù)from表示用到的I/O端口的起始地址,extent標(biāo)明從from開始的端
口數(shù)目。Name為設(shè)備名稱。

2.4.5 中斷打開關(guān)閉
系統(tǒng)提供給驅(qū)動程序開放和關(guān)閉響應(yīng)中斷的能力。是在include/asm/system.h
中的兩個定義。
#define cli() __asm__ __volatile__ (\"cli\"::)
#define sti() __asm__ __volatile__ (\"sti\"::)

2.4.6 打印信息
類似普通程序里的printf(),驅(qū)動程序要輸出信息使用printk()。在include
/linux/kernel.h里聲明。
Int printk(const char* fmt, ...);
其中fmt是格式化字符串。...是參數(shù)。都是和printf()格式一樣的。

2.4.7 注冊驅(qū)動程序
如果使用模塊(module)方式加載驅(qū)動程序,需要在模塊初始化時把設(shè)備注冊
到系統(tǒng)設(shè)備表里去。不再使用時,把設(shè)備從系統(tǒng)中卸除。定義在drivers/net/net_init.h
里的兩個函數(shù)完成這個工作。
Int register_netdev(struct device *dev);
void unregister_netdev(struct device *dev);
dev就是要注冊進(jìn)系統(tǒng)的設(shè)備結(jié)構(gòu)指針。在register_netdev()時,dev結(jié)構(gòu)一
般填寫前面11項,即到init,后面的暫時可以不用初始化。最重要的是name指針和
init方法。Name指針空(NULL)或者內(nèi)容為\"\\0\"或者name[0]為空格(space),則系統(tǒng)
把你的設(shè)備做為以太網(wǎng)設(shè)備處理。以太網(wǎng)設(shè)備有統(tǒng)一的命名格式,ethX。對以太網(wǎng)
這么特別對待大概和Linux的歷史有關(guān)。
Init方法一定要提供,register_netdev()會調(diào)用這個方法讓你對硬件檢測和
設(shè)置。
Register_netdev()返回0表示成功,非0不成功。

2.4.8 sk_buff
Linux網(wǎng)絡(luò)各層之間的數(shù)據(jù)傳送都是通過sk_buff。Sk_buff提供一套管理緩沖
區(qū)的方法,是Linux系統(tǒng)網(wǎng)絡(luò)高效運行的關(guān)鍵。每個sk_buff包括一些控制方法和一
塊數(shù)據(jù)緩沖區(qū)??刂品椒ò垂δ芊譃閮煞N類型。一種是控制整個buffer鏈的方法,
另一種是控制數(shù)據(jù)緩沖區(qū)的方法。Sk_buff組織成雙向鏈表的形式,根據(jù)網(wǎng)絡(luò)應(yīng)用
的特點,對鏈表的操作主要是刪除鏈表頭的元素和添加到鏈表尾。Sk_buff的控制
方法都很短小以盡量減少系統(tǒng)負(fù)荷。(translated from article written by Alan
Cox)
常用的方法包括:
.alloc_skb() 申請一個sk_buff并對它初始化。返回就是申請到的sk_buff。
.dev_alloc_skb()類似alloc_skb,在申請好緩沖區(qū)后,保留16字節(jié)的幀頭空
間。主要用在Ethernet驅(qū)動程序。
.kfree_skb() 釋放一個sk_buff。
.skb_clone() 復(fù)制一個sk_buff,但不復(fù)制數(shù)據(jù)部分。
.skb_copy()完全復(fù)制一個sk_buff。
.skb_dequeue() 從一個sk_buff鏈表里取出第一個元素。返回取出的sk_buff,
如果鏈表空則返回NULL。這是常用的一個操作。
.skb_queue_head() 在一個sk_buff鏈表頭放入一個元素。
.skb_queue_tail() 在一個sk_buff鏈表尾放入一個元素。這也是常用的一個
操作。網(wǎng)絡(luò)數(shù)據(jù)的處理主要是對一個先進(jìn)先出隊列的管理,skb_queue_tail()
和skb_dequeue()完成這個工作。
.skb_insert() 在鏈表的某個元素前插入一個元素。
.skb_append() 在鏈表的某個元素后插入一個元素。一些協(xié)議(如TCP)對沒按
順序到達(dá)的數(shù)據(jù)進(jìn)行重組時用到skb_insert()和skb_append()。

.skb_reserve() 在一個申請好的sk_buff的緩沖區(qū)里保留一塊空間。這個空間
一般是用做下一層協(xié)議的頭空間的。
.skb_put() 在一個申請好的sk_buff的緩沖區(qū)里為數(shù)據(jù)保留一塊空間。在
alloc_skb以后,申請到的sk_buff的緩沖區(qū)都是處于空(free)狀態(tài),有一個
tail指針指向free空間,實際上開始時tail就指向緩沖區(qū)頭。Skb_reserve()
在free空間里申請協(xié)議頭空間,skb_put()申請數(shù)據(jù)空間。見下面的圖。
.skb_push() 把sk_buff緩沖區(qū)里數(shù)據(jù)空間往前移。即把Head room中的空間移
一部分到Data area。
.skb_pull() 把sk_buff緩沖區(qū)里Data area中的空間移一部分到Head room中。

--------------------------------------------------
| Tail room(free) |
--------------------------------------------------
After alloc_skb()

--------------------------------------------------
| Head room | Tail room(free) |
--------------------------------------------------
After skb_reserve()

--------------------------------------------------
| Head room | Data area | Tail room(free) |
--------------------------------------------------
After skb_put()

--------------------------------------------------
|Head| skb_ | Data | Tail room(free) |
|room| push | | |
| | Data area | |
--------------------------------------------------
After skb_push()

--------------------------------------------------
| Head | skb_ | Data area | Tail room(free) |
| | pull | | |
| Head room | | |
--------------------------------------------------
After skb_pull()


------------------ Linux操作系統(tǒng)網(wǎng)絡(luò)驅(qū)動程序編寫 -------------------
------------ Contact the author by mailto:bordi@bordi.dhs.org ------


三.編寫Linux網(wǎng)絡(luò)驅(qū)動程序中需要注意的問題

3.1 中斷共享
Linux系統(tǒng)運行幾個設(shè)備共享同一個中斷。需要共享的話,在申請的時候指明
共享方式。系統(tǒng)提供的request_irq()調(diào)用的定義:
int request_irq(unsigned int irq,
void (*handler)(int irq, void *dev_id, struct pt_regs *regs),
unsigned long irqflags,
const char * devname,
void *dev_id);
如果共享中斷,irqflags設(shè)置SA_SHIRQ屬性,這樣就允許別的設(shè)備申請同一個
中斷。需要注意所有用到這個中斷的設(shè)備在調(diào)用request_irq()都必須設(shè)置這個屬
性。系統(tǒng)在回調(diào)每個中斷處理程序時,可以用dev_id這個參數(shù)找到相應(yīng)的設(shè)備。一
般dev_id就設(shè)為device結(jié)構(gòu)本身。系統(tǒng)處理共享中斷是用各自的dev_id參數(shù)依次調(diào)
用每一個中斷處理程序。

3.2 硬件發(fā)送忙時的處理
主CPU的處理能力一般比網(wǎng)絡(luò)發(fā)送要快,所以經(jīng)常會遇到系統(tǒng)有數(shù)據(jù)要發(fā),但
上一包數(shù)據(jù)網(wǎng)絡(luò)設(shè)備還沒發(fā)送完。因為在Linux里網(wǎng)絡(luò)設(shè)備驅(qū)動程序一般不做數(shù)據(jù)
緩存,不能發(fā)送的數(shù)據(jù)都是通知系統(tǒng)發(fā)送不成功,所以必須要有一個機(jī)制在硬件不
忙時及時通知系統(tǒng)接著發(fā)送下面的數(shù)據(jù)。
一般對發(fā)送忙的處理在前面設(shè)備的發(fā)送方法(hard_start_xmit)里已經(jīng)描述過,
即如果發(fā)送忙,置tbusy為1。處理完發(fā)送數(shù)據(jù)后,在發(fā)送結(jié)束中斷里清tbusy,同
時用mark_bh()調(diào)用通知系統(tǒng)繼續(xù)發(fā)送。
但在具體實現(xiàn)我的驅(qū)動程序時發(fā)現(xiàn),這樣的處理系統(tǒng)好象并不能及時地知道硬
件已經(jīng)空閑了,即在mark_bh()以后,系統(tǒng)要等一段時間才會接著發(fā)送。造成發(fā)送
效率很低。2M線路只有10%不到的使用率。內(nèi)核版本為2.0.35。
我最后的實現(xiàn)是不把tbusy置1,讓系統(tǒng)始終認(rèn)為硬件空閑,但是報告發(fā)送不成
功。系統(tǒng)會一直嘗試重發(fā)。這樣處理就運行正常了。但是遍循內(nèi)核源碼中的網(wǎng)絡(luò)驅(qū)
動程序,似乎沒有這樣處理的。不知道癥結(jié)在哪里。

3.3 流量控制(flow control)
網(wǎng)絡(luò)數(shù)據(jù)的發(fā)送和接收都需要流量控制。這些控制是在系統(tǒng)里實現(xiàn)的,不需要
驅(qū)動程序做工作。每個設(shè)備數(shù)據(jù)結(jié)構(gòu)里都有一個參數(shù)dev->tx_queue_len,這個參數(shù)
標(biāo)明發(fā)送時最多緩存的數(shù)據(jù)包。在Linux系統(tǒng)里以太網(wǎng)設(shè)備(10/100Mbps)
tx_queue_len一般設(shè)置為100,串行線路(異步串口)為10。實際上如果看源碼可以
知道,設(shè)置了dev->tx_queue_len并不是為緩存這些數(shù)據(jù)申請了空間。這個參數(shù)只是
在收到協(xié)議層的數(shù)據(jù)包時判斷發(fā)送隊列里的數(shù)據(jù)是不是到了tx_queue_len的限度,
以決定這一包數(shù)據(jù)加不加進(jìn)發(fā)送隊列。發(fā)送時另一個方面的流控是更高層協(xié)議的發(fā)
送窗口(TCP協(xié)議里就有發(fā)送窗口)。達(dá)到了窗口大小,高層協(xié)議就不會再發(fā)送數(shù)據(jù)。
接收流控也分兩個層次。Netif_rx()緩存的數(shù)據(jù)包有限制。另外高層協(xié)議也會
有一個最大的等待處理的數(shù)據(jù)量。

發(fā)送和接收流控處理在net/core/dev.c的do_dev_queue_xmit()和netif_rx()
中。

3.4 調(diào)試
很多Linux的驅(qū)動程序都是編譯進(jìn)內(nèi)核的,形成一個大的內(nèi)核文件。但對調(diào)試
來說,這是相當(dāng)麻煩的。調(diào)試驅(qū)動程序可以用module方式加載。支持模塊方式的
驅(qū)動程序必須提供兩個函數(shù):int init_module(void)和void cleanup_module(void)。
Init_module()在加載此模塊時調(diào)用,在這個函數(shù)里可以register_netdev()注冊
設(shè)備。Init_module()返回0表示成功,返回負(fù)表示失敗。Cleanup_module()在驅(qū)動
程序被卸載時調(diào)用,清除占用的資源,調(diào)用unregister_netdev()。
模塊可以動態(tài)地加載、卸載。在2.0.xx版本里,還有kerneld自動加載模塊,
但是2.2.xx中已經(jīng)取消了kerneld。手工加載使用insmod命令,卸載用rmmod命令,
看內(nèi)核中的模塊用lsmod命令。
編譯驅(qū)動程序用gcc,主要命令行參數(shù)-DKERNEL -DMODULE。并且作為模塊加載
的驅(qū)動程序,只編譯成obj形式(加-c參數(shù))。編譯好的目標(biāo)文件放在/lib/modules
/2.x.xx/misc下,在啟動文件里用insmod加載。


四.進(jìn)一步的閱讀
Linux程序設(shè)計資料可以從網(wǎng)上獲得。這就是開放源代碼的好處。并且沒有什
么“未公開的秘密”。我編寫驅(qū)動程序時參閱的主要資料包括:
Linux內(nèi)核源代碼
<> by Michael K. Johnson
<> by Ori Pomerantz
<> by olly in BBS水木清華站 可以選擇一個模板作為開始,內(nèi)核源代碼里有一個網(wǎng)絡(luò)驅(qū)動程序的模板,
drivers/net/skeleton.c。里面包含了驅(qū)動程序的基本內(nèi)容。但這個模板是以以太
網(wǎng)設(shè)備為對象的,以太網(wǎng)的處理在Linux系統(tǒng)里有特殊“待遇”,所以如果不是以
太網(wǎng)設(shè)備,有些細(xì)節(jié)上要注意,主要在初始化程序里。
最后,多參照別人寫的程序,聽聽其他開發(fā)者的經(jīng)驗之談大概是最有效的幫助
了。



Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=660694

本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
Linux網(wǎng)卡驅(qū)動程序編寫
嵌入式Linux網(wǎng)絡(luò)驅(qū)動程序的開發(fā)及實現(xiàn)原理
十一、Linux驅(qū)動程序開發(fā)(2) - 字符設(shè)備驅(qū)動(1)
人家的文章 ,sk_buff ,再轉(zhuǎn)載,太經(jīng)典了 - 網(wǎng)絡(luò)協(xié)議棧分析 - 草本植物
Linux驅(qū)動開發(fā)庖丁解牛之三——揭開字符設(shè)備驅(qū)動程序的面紗
Linux設(shè)備驅(qū)動程序?qū)W習(xí)(1)-字符設(shè)備驅(qū)動程序 - Linux設(shè)備驅(qū)動程序 - Tek...
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服