以文本方式查看主題 - 曙海教育集團論壇 (http://www.xinguifushi.cn/bbs/index.asp) -- Linux驅(qū)動開發(fā) (http://www.xinguifushi.cn/bbs/list.asp?boardid=33) ---- 設(shè)計Linux系統(tǒng)網(wǎng)絡(luò)設(shè)備驅(qū)動程序 (http://www.xinguifushi.cn/bbs/dispbbs.asp?boardid=33&id=1733) |
-- 作者:wangxinxin -- 發(fā)布時間:2010-11-24 11:28:57 -- 設(shè)計Linux系統(tǒng)網(wǎng)絡(luò)設(shè)備驅(qū)動程序 Linux網(wǎng)絡(luò)設(shè)備驅(qū)動程序是Linux操作系統(tǒng)網(wǎng)絡(luò)應(yīng)用中的一個重要組成部分。分析其運行機理,對于設(shè)計Linux網(wǎng)絡(luò)應(yīng)用程序是很有幫助的。我們可以在網(wǎng)絡(luò)驅(qū)動程序這一級做一些與應(yīng)用相關(guān)聯(lián)的特殊事情,例如在設(shè)計Linux防火墻和網(wǎng)絡(luò)入侵檢測系統(tǒng)時,可以在網(wǎng)絡(luò)驅(qū)動程序的基礎(chǔ)上攔截網(wǎng)絡(luò)數(shù)據(jù)包,繼而對其進行分析。由于Linux是開放源代碼的,所以給我們提供了一個分析和改造網(wǎng)絡(luò)驅(qū)動程序,并使其滿足特殊應(yīng)用的絕好機會。本文對Linux內(nèi)核中的網(wǎng)絡(luò)驅(qū)動程序部分進行了詳細討論,并給出了實現(xiàn)Linux網(wǎng)絡(luò)驅(qū)動程序的重要過程、一種實現(xiàn)模式和具體實例。 運行機理 1.體系結(jié)構(gòu) Linux網(wǎng)絡(luò)驅(qū)動程序的體系結(jié)構(gòu)如圖1所示。可以劃分為四層,從上到下分別為協(xié)議接口層、網(wǎng)絡(luò)設(shè)備接口層、提供實際功能的設(shè)備驅(qū)動功能層,以及網(wǎng)絡(luò)設(shè)備和網(wǎng)絡(luò)媒介層。在設(shè)計網(wǎng)絡(luò)驅(qū)動程序時,最主要的工作就是完成設(shè)備驅(qū)動功能層,使其滿足我們自己所需的功能。在Linux中,把所有網(wǎng)絡(luò)設(shè)備都抽象為一個接口。這個接口提供了對所有網(wǎng)絡(luò)設(shè)備的操作集合。由數(shù)據(jù)結(jié)構(gòu) struct device來表示網(wǎng)絡(luò)設(shè)備在內(nèi)核中的運行情況,即網(wǎng)絡(luò)設(shè)備接口。它既包括純軟件網(wǎng)絡(luò)設(shè)備接口,如環(huán)路(Loopback),也可以包括硬件網(wǎng)絡(luò)設(shè)備接口,如以太網(wǎng)卡。它由以dev_base為頭指針的設(shè)備鏈表來集中管理所有網(wǎng)絡(luò)設(shè)備。該設(shè)備鏈表中的每個元素代表一個網(wǎng)絡(luò)設(shè)備接口。數(shù)據(jù)結(jié)構(gòu)device中有很多供系統(tǒng)訪問和協(xié)議層調(diào)用的設(shè)備方法,包括供設(shè)備初始化和往系統(tǒng)注冊用的init函數(shù)、打開和關(guān)閉網(wǎng)絡(luò)設(shè)備的open和stop函數(shù)、處理數(shù)據(jù)包發(fā)送的函數(shù)hard_ start_xmit,以及中斷處理函數(shù)等。有關(guān)device數(shù)據(jù)結(jié)構(gòu)(在內(nèi)核中也就是net_device)的詳細內(nèi)容,請參看/linux/include/linux/netdevice.h ![]() 2.初始化 網(wǎng)絡(luò)設(shè)備的初始化主要是由device數(shù)據(jù)結(jié)構(gòu)中的init函數(shù)指針所指的初始化函數(shù)來完成的。當內(nèi)核啟動或加載網(wǎng)絡(luò)驅(qū)動模塊的時候,就會調(diào)用初始化過程。這個過程將首先檢測網(wǎng)絡(luò)物理設(shè)備是否存在。它通過檢測物理設(shè)備的硬件特征來完成,然后再對設(shè)備進行資源配置。這些完成之后就要構(gòu)造設(shè)備的device數(shù)據(jù)結(jié)構(gòu),用檢測到的數(shù)值來對device中的變量初始化。這一步很重要。最后向Linux內(nèi)核注冊該設(shè)備并申請內(nèi)存空間。 3. 數(shù)據(jù)包的發(fā)送與接收 數(shù)據(jù)包的發(fā)送和接收是實現(xiàn)Linux網(wǎng)絡(luò)驅(qū)動程序中兩個最關(guān)鍵的過程。對這兩個過程處理的好壞將直接影響到驅(qū)動程序的整體運行質(zhì)量。圖1中也很明確地說明了網(wǎng)絡(luò)數(shù)據(jù)包的傳輸過程。首先在網(wǎng)絡(luò)設(shè)備驅(qū)動加載時,通過device域中的init函數(shù)指針調(diào)用網(wǎng)絡(luò)設(shè)備的初始化函數(shù),對設(shè)備進行初始化。如果操作成功就可以通過device域中的open函數(shù)指針調(diào)用網(wǎng)絡(luò)設(shè)備的打開函數(shù)打開設(shè)備,再通過device域中的建立硬件包頭函數(shù)指針hard_header來建立硬件包頭信息。最后通過協(xié)議接口層函數(shù)dev_queue_xmit(詳見/linux/net/core/dev.c)來調(diào)用device域中的hard_start_xmit函數(shù)指針,完成數(shù)據(jù)包的發(fā)送。該函數(shù)將把存放在套接字緩沖區(qū)中的數(shù)據(jù)發(fā)送到物理設(shè)備。該緩沖區(qū)是由數(shù)據(jù)結(jié)構(gòu)sk_buff (詳見/linux/include/linux/sk_buff.h)來表示的。 數(shù)據(jù)包的接收是通過中斷機制來完成的。當有數(shù)據(jù)到達時,就產(chǎn)生中斷信號,網(wǎng)絡(luò)設(shè)備驅(qū)動功能層就調(diào)用中斷處理程序,即數(shù)據(jù)包接收程序來處理數(shù)據(jù)包的接收。然后,網(wǎng)絡(luò)協(xié)議接口層調(diào)用netif_rx函數(shù)(詳見/linux/net/core/dev.c),把接收到的數(shù)據(jù)包傳輸?shù)骄W(wǎng)絡(luò)協(xié)議的上層進行處理。 實現(xiàn)模式 實現(xiàn)Linux網(wǎng)絡(luò)設(shè)備驅(qū)動功能主要有兩種形式:一是通過內(nèi)核來進行加載,當內(nèi)核啟動的時候,就開始加載網(wǎng)絡(luò)設(shè)備驅(qū)動程序,內(nèi)核啟動完成之后,網(wǎng)絡(luò)驅(qū)動功能也隨即實現(xiàn)了;再就是通過模塊加載的形式。比較兩者,第二種形式更加靈活。在此著重對模塊加載形式進行討論。 模塊設(shè)計是Linux中特有的技術(shù),它使Linux內(nèi)核功能更容易擴展。采用模塊來設(shè)計Linux網(wǎng)絡(luò)設(shè)備驅(qū)動程序會很輕松,并且能夠形成固定的模式。任何人只要依照這個模式去設(shè)計,都能設(shè)計出優(yōu)良的網(wǎng)絡(luò)驅(qū)動程序。先簡要介紹一下基于模塊加載網(wǎng)絡(luò)驅(qū)動程序的設(shè)計步驟,后面還結(jié)合具體實例來講解。首先通過模塊加載命令insmod來把網(wǎng)絡(luò)設(shè)備驅(qū)動程序插入到內(nèi)核之中。然后,insmod將調(diào)用init_module()函數(shù)首先對網(wǎng)絡(luò)設(shè)備的init函數(shù)指針初始化,再通過調(diào)用register_netdev()函數(shù)在Linux系統(tǒng)中注冊該網(wǎng)絡(luò)設(shè)備。如果成功,再調(diào)用init函數(shù)指針所指的網(wǎng)絡(luò)設(shè)備初始化函數(shù)來對設(shè)備初始化,將設(shè)備的device數(shù)據(jù)結(jié)構(gòu)插入到dev_base鏈表的末尾。最后可以通過執(zhí)行模塊卸載命令rmmod,來調(diào)用網(wǎng)絡(luò)驅(qū)動程序中的cleanup_module()函數(shù),對網(wǎng)絡(luò)驅(qū)動程序模塊進行卸載。具體實現(xiàn)過程見圖2所示。 ![]() 通過模塊初始化網(wǎng)絡(luò)接口是在編譯內(nèi)核時標記為編譯為模塊。系統(tǒng)在啟動時并不知道該接口的存在,需要用戶在/etc/rc.d/目錄中定義的初始啟動腳本中寫入命令或手動將模塊插入內(nèi)核空間來激活網(wǎng)絡(luò)接口。這也給我們在何時加載網(wǎng)絡(luò)設(shè)備驅(qū)動程序提供了靈活性。 應(yīng)用實例 我們以NE2000兼容網(wǎng)卡為例,來具體介紹基于模塊的網(wǎng)絡(luò)驅(qū)動程序的設(shè)計過程。可以參考文件linux/drivers/net/ne.c和linux/drivers/net/8390.c。 1.模塊加載和卸載 NE2000網(wǎng)卡的模塊加載功能由init_module()函數(shù)完成。具體過程及解釋如下: int init_module(void) { int this_dev, found = 0; //循環(huán)檢測ne2000類型的網(wǎng)絡(luò)設(shè)備接口 for (this_dev = 0; this_dev < MAX_NE_CARDS; this_dev++) { //獲得網(wǎng)絡(luò)接口對應(yīng)的net-device結(jié)構(gòu)指針 struct net_device *dev = &dev_ne[this_dev]; dev->irq = irq[this_dev]; //初始化該接口的中斷請求號 dev->mem_end = bad[this_dev]; //初始化接收緩沖區(qū)的終點位置 dev->base_addr = io[this_dev]; //初始化網(wǎng)絡(luò)接口的I/O基地址 dev->init = ne_probe; //初始化init為ne_probe,后面介紹此函數(shù) //調(diào)用registre_netdevice()向系統(tǒng)登記網(wǎng)絡(luò)接口,在這個函數(shù)中將分配給網(wǎng)絡(luò)接口在系統(tǒng)中惟一 的名稱。并且將該網(wǎng)絡(luò)接口設(shè)備添加到系統(tǒng)管理的鏈表dev-base中進行管理。 if (register_netdev(dev) == 0) { found++; continue; } … //省略 } return 0;} 模塊卸載功能由cleanup_module()函數(shù)來實現(xiàn)。如下所示: void cleanup_module(void) { int this_dev; //遍歷整個dev-ne數(shù)組 for (this_dev = 0; this_dev < MAX_NE_CARDS; this_dev++) { //獲得net-device結(jié)構(gòu)指針 struct net_device *dev = &dev_ne[this_dev]; if (dev->priv != NULL) { void *priv = dev->priv; struct pci_dev *idev = (struct pci_dev *)ei_status.priv; //調(diào)用函數(shù)指針 idev->deactive將已經(jīng)激活的網(wǎng)卡關(guān)閉使用 if (idev) idev->deactivate(idev); free_irq(dev->irq, dev); //調(diào)用函數(shù)release_region()釋放該網(wǎng)卡占用的I/O地址空間 release_region(dev->base_addr, NE_IO_EXTENT); //調(diào)用unregister_netdev()注銷 這個net_device()結(jié)構(gòu) unregister_netdev(dev); kfree(priv); //釋放priv空間 } } } 2.網(wǎng)絡(luò)接口初始化 實現(xiàn)此功能是由ne_probe()函數(shù)來完成的。前面已經(jīng)提到過,在init_module()函數(shù)中用它來初始化init函數(shù)指針。它主要對網(wǎng)卡進行檢測,并且初始化系統(tǒng)中網(wǎng)絡(luò)設(shè)備信息,用于后面的網(wǎng)絡(luò)數(shù)據(jù)的發(fā)送和接收。具體過程及解釋如下: int __init ne_probe(struct net_device *dev) { unsigned int base_addr = dev->base_addr; //初始化dev-owner成員,因為使用模塊類型驅(qū)動,會將dev-owner指向?qū)ο髆odules結(jié)構(gòu)指針。 SET_MODULE_OWNER(dev); //檢測dev->base_addr是否合法,是則執(zhí)行ne-probe1()函數(shù)檢測過程。不是,則需要自動檢測。 if (base_addr > 0x1ff) return ne_probe1(dev, base_addr); else if (base_addr != 0) return -ENXIO; //如果有ISAPnP設(shè)備,則調(diào)用ne_probe_isapnp()檢測這種類型的網(wǎng)卡。 if (isapnp_present() && (ne_probe_isapnp(dev) == 0)) return 0; …//省略 return -ENODEV; } 這其中兩個函數(shù)ne_probe_isapnp()和ne_probe19()的區(qū)別在于檢測中斷號上。PCI方式只需指定I/O基地址就可以自動獲得IRQ,是由BIOS自動分配的;而ISA方式需要獲得空閑的中斷資源才能分配。 3.網(wǎng)絡(luò)接口設(shè)備打開和關(guān)閉 網(wǎng)絡(luò)接口設(shè)備打開就是激活網(wǎng)絡(luò)接口,使它能接收來自網(wǎng)絡(luò)的數(shù)據(jù)并且傳遞到網(wǎng)絡(luò)協(xié)議棧的上面,也可以將數(shù)據(jù)發(fā)送到網(wǎng)絡(luò)上。設(shè)備關(guān)閉就是停止操作。 在NE2000網(wǎng)絡(luò)驅(qū)動程序中,網(wǎng)絡(luò)設(shè)備打開由dev_open()和ne_open()完成,設(shè)備關(guān)閉有dev_close()和ne_close()完成。它們相應(yīng)調(diào)用底層函數(shù)ei_open()和ei_close()來完成。其實現(xiàn)過程相對簡單,不再贅述。 |