嵌入式Linux內(nèi)核移植相關(guān)代碼分析 [轉(zhuǎn)載請注明出處,www.linuxforum.net,作者:張洪耿,patrick_zhg@hotmail.com] 本文通過整理之前研發(fā)的一個項目(ARM7TDMI +uCLinux),分析內(nèi)核啟動過程及需要修改的文件,以供內(nèi)核移植者參考。整理過程中 也同時參考了眾多網(wǎng)友的帖子,在此謝過。由于整理過程匆忙,難免錯誤及講解的不夠清楚之處,請各位網(wǎng)友指正,這里提前謝過。本文分以下部分進(jìn)行介紹: 1. Bootloader及內(nèi)核解壓 2. 內(nèi)核啟動方式介紹 3. 內(nèi)核啟動地址的確定 4. arch/armnommu/kernel/head-armv.S分析 5. start_kernel()函數(shù)分析 1. Bootloader及內(nèi)核解壓 Bootloader將內(nèi)核加載到內(nèi)存中,設(shè)定一些寄存器,然后將控制權(quán)交由內(nèi)核,該過程中,關(guān)閉MMU功能。通常,內(nèi)核都是以壓縮的方式存放,如zImage,這里有兩種解壓方法: 使用內(nèi)核自解壓程序。 arch/arm/boot/compressed/head.S或arch/arm/boot/compressed/head-xxxxx.S arch/arm/boot/compressed/misc.c 在Bootloader中增加解壓功能。 使用該方法時內(nèi)核不需要帶有自解壓功能,而使用Bootloader中的解壓程序代替內(nèi)核自解壓程序。其工作過程與內(nèi)核自解壓過程相似:Bootloader把壓縮方式的內(nèi)核解壓到內(nèi)存中,然后跳轉(zhuǎn)到內(nèi)核入口處開始執(zhí)行。 2. 幾種內(nèi)核啟動方式介紹 XIP (EXECUTE IN PLACE) 是指直接從存放代碼的位置上啟動運行。 2.1 非壓縮,非XIP 非XIP方式是指在運行之前需對代碼進(jìn)行重定位。該類型的內(nèi)核以非壓縮方式存放在Flash中,啟動時由Bootloader加載到內(nèi)存后運行。 2.2 非壓縮,XIP 該類型的內(nèi)核以非壓縮格式存放在ROM/Flash中,不需要加載到內(nèi)存就能運行,Bootloader直接跳轉(zhuǎn)到其存放地址執(zhí)行。Data段復(fù) 制和BSS段清零的工作由內(nèi)核自己完成。這種啟動方式常用于內(nèi)存空間有限的系統(tǒng)中,另外,程序在ROM/Flash中運行的速度相對較慢。 2.3 RAM自解壓 壓縮格式的內(nèi)核由開頭一段自解壓代碼和壓縮內(nèi)核數(shù)據(jù)組成,由于以壓縮格式存放,內(nèi)核只能以非XIP方式運行。RAM自解壓過程如下:壓縮內(nèi)核存放 于ROM/Flash中,Bootloader啟動后加載到內(nèi)存中的臨時空間,然后跳轉(zhuǎn)到壓縮內(nèi)核入口地址執(zhí)行自解壓代碼,內(nèi)核被解壓到最終的目的地址然 后運行。壓縮內(nèi)核所占據(jù)的臨時空間隨后被Linux回收利用。這種方式的內(nèi)核在嵌入式產(chǎn)品中較為常見。 2.4 ROM自解壓 解壓縮代碼也能夠以XIP的方式在ROM/Flash中運行。ROM自解壓過程如下:壓縮內(nèi)核存放在ROM/Flash中,不需要加載到內(nèi)存就能 運行,Bootloader直接跳轉(zhuǎn)到其存放地址執(zhí)行其自解壓代碼,將壓縮內(nèi)核解壓到最終的目的地址并運行。ROM自解壓方式存放的內(nèi)核解壓縮速度慢,而 且也不能節(jié)省內(nèi)存空間。 3. 內(nèi)核啟動地址的確定 內(nèi)核自解壓方式 Head.S/head-XXX.S獲得內(nèi)核解壓后首地址ZREALADDR,然后解壓內(nèi)核,并把解壓后的內(nèi)核放在ZREALADDR的位置上,最后跳轉(zhuǎn)到ZREALADDR地址上,開始真正的內(nèi)核啟動。 arch/armnommu/boot/Makefile,定義ZRELADDR和ZTEXTADDR。ZTEXTADDR是自解壓代碼的起始地 址,如果從內(nèi)存啟動內(nèi)核,設(shè)置為0即可,如果從Rom/Flash啟動,則設(shè)置ZTEXTADDR為相應(yīng)的值。ZRELADDR是內(nèi)核解壓縮后的執(zhí)行地 址。 arch/armnommu/boot/compressed/vmlinux.ld,引用LOAD_ADDR和TEXT_START。 arch/armnommu/boot/compressed/Makefile, 通過如下一行: SEDFLAGS = s/TEXT_START/$(ZTEXTADDR)/;s/LOAD_ADDR/$(ZRELADDR)/; 使得TEXT_START = ZTEXTADDR,LOAD_ADDR = ZRELADDR。 說明: 執(zhí)行完decompress_kernel函數(shù)后,代碼跳回head.S/head-XXX.S中,檢查解壓縮之后的kernel起始地址是否緊 挨著kernel image。如果是,beqcall_kernel,執(zhí)行解壓后的kernel。如果解壓縮之后的kernel起始地址不是緊挨著 kernelimage,則執(zhí)行relocate,將其拷貝到緊接著kernel image的地方,然后跳轉(zhuǎn),執(zhí)行解壓后的kernel。 Bootloader解壓方式 Bootloader把解壓后的內(nèi)核放在內(nèi)存的TEXTADDR位置上,然后跳轉(zhuǎn)到TEXTADDR位置上,開始內(nèi)核啟動。 arch/armnommu/Makefile,一般設(shè)置TEXTADDR為PAGE_OFF+0x8000,如定義為0x00008000, 0xC0008000等。 arch/armnommu/vmlinux.lds,引用TEXTADDR 4. arch/armnommu/kernel/head-armv.S 該文件是內(nèi)核最先執(zhí)行的一個文件,包括內(nèi)核入口ENTRY(stext)到start_kernel間的初始化代碼,主要作用是檢查CPUID, Architecture Type,初始化BSS等操作,并跳到start_kernel函數(shù)。在執(zhí)行前,處理器應(yīng)滿足以下狀態(tài): r0 - should be 0 r1 - unique architecture number MMU - off I-cache - on or off D-cache – off /* 部分源代碼分析 */ /* 內(nèi)核入口點 */ ENTRY(stext) /* 程序狀態(tài),禁止FIQ、IRQ,設(shè)定SVC模式 */ mov r0, #F_BIT | I_BIT | MODE_SVC@ make sure svc mode /* 置當(dāng)前程序狀態(tài)寄存器 */ msr cpsr_c, r0 @ and all irqs disabled /* 判斷CPU類型,查找運行的CPU ID值與Linux編譯支持的ID值是否支持 */ bl __lookup_processor_type /* 跳到__error */ teq r10, #0 @ invalid processor? moveq r0, #‘p‘ @ yes, error ‘p‘ beq __error /* 判斷體系類型,查看R1寄存器的Architecture Type值是否支持 */ bl __lookup_architecture_type /* 不支持,跳到出錯 */ teq r7, #0 @ invalid architecture? moveq r0, #‘a(chǎn)‘ @ yes, error ‘a(chǎn)‘ beq __error /* 創(chuàng)建核心頁表 */ bl __create_page_tables adr lr, __ret @ return address add pc, r10, #12 @ initialise processor /* 跳轉(zhuǎn)到start_kernel函數(shù) */ b start_kernel __lookup_processor_type這個函數(shù)根據(jù)芯片的ID從proc.info獲取proc_info_list結(jié)構(gòu), proc_info_list結(jié)構(gòu)定義在include/asm-armnommu/proginfo.h中,該結(jié)構(gòu)的數(shù)據(jù)定義在 arch/armnommu/mm/proc-arm*.S文件中,ARM7TDMI系列芯片的proc_info_list數(shù)據(jù)定義在 arch/armnommu/mm/proc-arm6,7.S文件中。函數(shù)__lookup_architecture_type從arch.info 獲取machine_desc結(jié)構(gòu),machine_desc結(jié)構(gòu)定義在include/asm-armnommu/mach/arch.h中,針對不同 arch的數(shù)據(jù)定義在arch/armnommu/mach-*/arch.c文件中。 在這里如果知道processor_type和architecture_type,可以直接對相應(yīng)寄存器進(jìn)行賦值。 5. start_kernel()函數(shù)分析 下面對start_kernel()函數(shù)及其相關(guān)函數(shù)進(jìn)行分析。 5.1 lock_kernel() /* Getting the big kernel lock. * This cannot happen asynchronously, * so we only need to worry about other * CPU‘s. */ extern __inline__ void lock_kernel(void) { if (!++current->lock_depth) spin_lock(&kernel_flag); } kernel_flag是一個內(nèi)核大自旋鎖,所有進(jìn)程都通過這個大鎖來實現(xiàn)向內(nèi)核態(tài)的遷移。只有獲得這個大自旋鎖的處理器可以進(jìn)入內(nèi)核,如中斷處 理程序等。在任何一對lock_kernel/unlock_kernel函數(shù)里至多可以有一個程序占用CPU。進(jìn)程的lock_depth成員初始化為 -1,在kerenl/fork.c文件中設(shè)置。在它小于0時(恒為-1),進(jìn)程不擁有內(nèi)核鎖;當(dāng)大于或等于0時,進(jìn)程得到內(nèi)核鎖。 5.2 setup_arch() setup_arch()函數(shù)做體系相關(guān)的初始化工作,函數(shù)的定義在arch/armnommu/kernel/setup.c文件中,主要涉及下列主要函數(shù)及代碼。 5.2.1 setup_processor() 該函數(shù)主要通過 for (list = &__proc_info_begin; list < &__proc_info_end ; list++) if ((processor_id & list->cpu_mask) == list->cpu_val) break; 這樣一個循環(huán)來在.proc.info段中尋找匹配的processor_id,processor_id在head_armv.S文件 中設(shè)置。 5.2.2 setup_architecture(machine_arch_type) 該函數(shù)獲得體系結(jié)構(gòu)的信息,返回mach-xxx/arch.c 文件中定義的machine結(jié)構(gòu)體的指針,包含以下內(nèi)容: MACHINE_START (xxx, “xxx”) MAINTAINER ("xxx") BOOT_MEM (xxx, xxx, xxx) FIXUP (xxx) MAPIO (xxx) INITIRQ (xxx) MACHINE_END 5.2.3內(nèi)存設(shè)置代碼 if (meminfo.nr_banks == 0) { meminfo.nr_banks = 1; meminfo.bank[0].start = PHYS_OFFSET; meminfo.bank[0].size = MEM_SIZE; } meminfo結(jié)構(gòu)表明內(nèi)存情況,是對物理內(nèi)存結(jié)構(gòu)meminfo的默認(rèn)初始化。nr_banks指定內(nèi)存塊的數(shù)量,bank指定每塊內(nèi)存的范 圍,PHYS_OFFSET指定某塊內(nèi)存塊的開始地址,MEM_SIZE指定某塊內(nèi)存塊長度。PHYS_OFFSET和MEM_SIZE都定義在 include/asm-armnommu/arch-XXX/memory.h文件中,其中PHYS_OFFSET是內(nèi)存的開始地址,MEM_SIZE 就是內(nèi)存的結(jié)束地址。這個結(jié)構(gòu)在接下來內(nèi)存的初始化代碼中起重要作用。 5.2.4 內(nèi)核內(nèi)存空間管理 init_mm.start_code = (unsigned long) &_text; 內(nèi)核代碼段開始 init_mm.end_code = (unsigned long) &_etext; 內(nèi)核代碼段結(jié)束 init_mm.end_data = (unsigned long) &_edata; 內(nèi)核數(shù)據(jù)段開始 init_mm.brk = (unsigned long) &_end; 內(nèi)核數(shù)據(jù)段結(jié)束 每一個任務(wù)都有一個mm_struct結(jié)構(gòu)管理其內(nèi)存空間,init_mm 是內(nèi)核的mm_struct。其中設(shè)置成員變量* mmap指向自己, 意味著內(nèi)核只有一個內(nèi)存管理結(jié)構(gòu),設(shè)置 pgd=swapper_pg_dir, swapper_pg_dir是內(nèi)核的頁目錄,ARM體系結(jié)構(gòu)的內(nèi)核頁目錄大小定義為16k。init_mm定義了整個內(nèi)核的內(nèi)存空間,內(nèi)核線程屬于內(nèi)核代碼,同樣使用內(nèi)核空間,其訪問內(nèi)存空間的權(quán)限與內(nèi)核一樣。 5.2.5 內(nèi)存結(jié)構(gòu)初始化 bootmem_init(&meminfo)函數(shù)根據(jù)meminfo進(jìn)行內(nèi)存結(jié)構(gòu)初始化。bootmem_init(& meminfo)函數(shù)中調(diào)用reserve_node_zero(bootmap_pfn, bootmap_pages)函數(shù),這個函數(shù)的作用是保留一 部分內(nèi)存使之不能被動態(tài)分配。這些內(nèi)存塊包括: reserve_bootmem_node(pgdat, __pa(&_stext), &_end - &_stext); /*內(nèi)核所占用地址空間*/ reserve_bootmem_node(pgdat, bootmap_pfn<<PAGE_SHIFT, bootmap_pages<<PAGE_SHIFT) /*bootmem結(jié)構(gòu)所占用地址空間*/ 5.2.6 paging_init(&meminfo, mdesc) 創(chuàng)建內(nèi)核頁表,映射所有物理內(nèi)存和IO空間,對于不同的處理器,該函數(shù)差別比較大。下面簡單描述一下ARM體系結(jié)構(gòu)的存儲系統(tǒng)及MMU相關(guān)的概念。 在ARM存儲系統(tǒng)中,使用內(nèi)存管理單元(MMU)實現(xiàn)虛擬地址到實際物理地址的映射。利用MMU,可把SDRAM的地址完全映射到0x0起始的一 片連續(xù)地址空間,而把原來占據(jù)這片空間的FLASH或者ROM映射到其他不相沖突的存儲空間位置。例如,F(xiàn)LASH的地址從 0x00000000~0x00FFFFFF,而SDRAM的地址范圍是0x3000 0000~0x3lFFFFFF,則可把SDRAM地址映射為 0x00000000~0xlFFFFFF,而FLASH的地址可以映射到0x90000000~0x90FFFFFF(此處地址空間為空閑,未被占 用)。映射完成后,如果處理器發(fā)生異常,假設(shè)依然為IRQ中斷,PC指針指向0xl8處的地址,而這個時候PC實際上是從位于物理地址的 0x30000018處讀取指令。通過MMU的映射,則可實現(xiàn)程序完全運行在SDRAM之中。在實際的應(yīng)用中.可能會把兩片不連續(xù)的物理地址空間分配給 SDRAM。而在操作系統(tǒng)中,習(xí)慣于把SDRAM的空間連續(xù)起來,方便內(nèi)存管理,且應(yīng)用程序申請大塊的內(nèi)存時,操作系統(tǒng)內(nèi)核也可方便地分配。通過MMU可 實現(xiàn)不連續(xù)的物理地址空間映射為連續(xù)的虛擬地址空間。操作系統(tǒng)內(nèi)核或者一些比較關(guān)鍵的代碼,一般是不希望被用戶應(yīng)用程序訪問。通過MMU可以控制地址空間 的訪問權(quán)限,從而保護(hù)這些代碼不被破壞。 MMU的實現(xiàn)過程,實際上就是一個查表映射的過程。建立頁表是實現(xiàn)MMU功能不可缺少的一步。頁表位于系統(tǒng)的內(nèi)存中,頁表的每一項對應(yīng)于一個虛 擬地址到物理地址的映射。每一項的長度即是一個字的長度(在ARM中,一個字的長度被定義為4Bytes)。頁表項除完成虛擬地址到物理地址的映射功能之 外,還定義了訪問權(quán)限和緩沖特性等。 MMU的映射分為兩種,一級頁表的變換和二級頁表變換。兩者的不同之處就是實現(xiàn)的變換地址空間大小不同。一級頁表變換支持1 M大小的存儲空間的映射,而二級可以支持64 kB,4 kB和1 kB大小地址空間的映射。 動態(tài)表(頁表)的大?。奖眄棓?shù)*每個表項所需的位數(shù),即為整個內(nèi)存空間建立索引表時,需要多大空間存放索引表本身。 表項數(shù)=虛擬地址空間/每頁大小 每個表項所需的位數(shù)=Log(實際頁表數(shù))+適當(dāng)控制位數(shù) 實際頁表數(shù) =物理地址空間/每頁大小 Send_linux 回復(fù)于:2007-03-06 15:44:27 下面分析paging_init()函數(shù)的代碼。 在paging_init中分配起始頁(即第0頁)地址: zero_page = 0xCXXXXXXX memtable_init(mi); 如果當(dāng)前微處理器帶有MMU,則為系統(tǒng)內(nèi)存創(chuàng)建頁表;如果當(dāng)前微處理器不支持MMU,比如 ARM7TDMI上移植uCLinux操作系統(tǒng)時,則不需要此類步驟??梢酝ㄟ^如下一個宏定義實現(xiàn)靈活控制,對于帶有MMU的微處理器而言, memtable_init(mi)是paging_init()中最重要的函數(shù)。 #ifndef CONFIG_UCLINUX /* initialise the page tables. */ memtable_init(mi); ……(此處省略若干代碼) free_area_init_node(node, pgdat, 0, zone_size, bdata->node_boot_start, zhole_size); } #else /* 針對不帶MMU微處理器 */ { /*****************************************************/ 定義物理內(nèi)存區(qū)域管理 /*****************************************************/ unsigned long zone_size[MAX_NR_ZONES] = {0,0,0}; zone_size[ZONE_DMA] = 0; zone_size[ZONE_NORMAL] = (END_MEM - PAGE_OFFSET) >> PAGE_SHIFT; free_area_init_node(0, NULL, NULL, zone_size, PAGE_OFFSET, NULL); } #endif uCLinux與其它嵌入式Linux最大的區(qū)別就是MMU管理這一塊,從上面代碼就明顯可以看到這點區(qū)別。下面繼續(xù)討論針對帶MMU的微處理器的內(nèi)存管理。 void __init memtable_init(struct meminfo *mi) { struct map_desc *init_maps, *p, *q; unsigned long address = 0; int i; init_maps = p = alloc_bootmem_low_pages(PAGE_SIZE); /*******************************************************/ 其中map_desc定義為: struct map_desc { unsigned long virtual; unsigned long physical; unsigned long length; int domain:4, // 頁表的domain prot_read:1, // 讀保護(hù)標(biāo)志 prot_write:1, // 寫保護(hù)標(biāo)志 cacheable:1, // 是否使用cache bufferable:1, // 是否使用write buffer last:1; //空 };init_maps /* map_desc是區(qū)段及其屬性的定義 */ 下面代碼對meminfo的區(qū)段進(jìn)行遍歷,在嵌入式系統(tǒng)中列舉所有可映射的內(nèi)存,例如32M SDRAM, 4M FLASH等,用meminfo記錄這些內(nèi)存區(qū)段。同時填寫init_maps 中的各項內(nèi)容。meminfo結(jié)構(gòu)如下: struct meminfo { int nr_banks; unsigned long end; struct { unsigned long start; unsigned long size; int node; } bank[NR_BANKS]; }; /********************************************************/ for (i = 0; i < mi->nr_banks; i++) { if (mi->bank.size == 0) continue; p->physical = mi->bank.start; p->virtual = __phys_to_virt(p->physical); p->length = mi->bank.size; p->domain = DOMAIN_KERNEL; p->prot_read = 0; p->prot_write = 1; p->cacheable = 1; //使用Cache p->bufferable = 1; //使用write buffer p ++; //下一個區(qū)段 } /* 如果系統(tǒng)存在FLASH,執(zhí)行以下代碼 */ #ifdef FLUSH_BASE p->physical = FLUSH_BASE_PHYS; p->virtual = FLUSH_BASE; p->length = PGDIR_SIZE; p->domain = DOMAIN_KERNEL; p->prot_read = 1; p->prot_write = 0; p->cacheable = 1; p->bufferable = 1; p ++; #endif /***********************************************************/ 接下來的代碼是逐個區(qū)段建立頁表 /***********************************************************/ q = init_maps; do { if (address < q->virtual || q == p) { /*******************************************************************************/ 由于內(nèi)核空間是從某個地址開始,如0xC0000000,所以0xC000 0000 以前的頁表項全部清空 clear_mapping在mm-armv.c中定義,其中clear_mapping()是個宏,根據(jù)處理器的不同,可以被展開為如下代碼 cpu_XXX_set_pmd(((pmd_t *)(((&init_mm )->pgd+ (( virt) >> 20 )))),((pmd_t){( 0 )})); 其中init_mm為內(nèi)核的mm_struct,pgd指向 swapper_pg_dir,在 arch/arm/kernel/init_task.c中定義。cpu_XXX_set_pmd定義在 proc_armXXX.S文件中,參見 ENTRY(cpu_XXX_set_pmd) 處代碼。 /*********************************************************************************/ clear_mapping(address); /* 每個表項增加1M */ address += PGDIR_SIZE; } else { /* 構(gòu)建內(nèi)存頁表 */ create_mapping(q); address = q->virtual + q->length; address = (address + PGDIR_SIZE - 1) & PGDIR_MASK; q ++; } } while (address != 0); / * create_mapping函數(shù)也在mm-armv.c中定義 */ static void __init create_mapping(struct map_desc *md) { unsigned long virt, length; int prot_sect, prot_pte; long off; /*******************************************************************************/ 大部分應(yīng)用中均采用1級section模式的地址映射,一個section的大小為1M,也就是說從邏輯地址到物理地址的轉(zhuǎn)變是這樣的一個過程: 一個32位的地址,高12位決定了該地址在頁表中的index,這個index的內(nèi)容決定了該邏輯section對應(yīng)的物理section;低 20位決定了該地址在section中的偏移(index)。例如:從0x0~0xFFFFFFFF的地址空間總共可以分成0x1000(4K)個 section(每個section大小為1M),頁表中每項的大小為32個bit,因此頁表的大小為0x4000(16K)。 每個頁表項的內(nèi)容如下: bit: 31 20 19 12 11 10 9 8 5 4 3 2 1 0 content: Section對應(yīng)的物理地址 NULL AP 0 Domain 1 C B 1 0 最低兩位(10)是section分頁的標(biāo)識。 AP:Access Permission,區(qū)分只讀、讀寫、SVC&其它模式。 Domain:每個section都屬于某個Domain,每個Domain的屬性由寄存器控制。一般都只要包含兩個Domain,一個可訪問地址空間; 另一個不可訪問地址空間。 C、B:這兩位決定了該section的cache&write buffer屬性,這與該段的用途(RO or RW)有密切關(guān)系。不同的用途要做不同的設(shè)置。 C B 具體含義 0 0 無cache,無寫緩沖,任何對memory的讀寫都反映到總線上。對 memory 的操作過程中CPU需要等待。 0 1 無cache,有寫緩沖,讀操作直接反映到總線上。寫操作CPU將數(shù)據(jù)寫入到寫緩沖后繼續(xù)運行,由寫緩沖進(jìn)行寫回操作。 1 0 有cache,寫通模式,讀操作首先考慮cache hit;寫操作時直接將數(shù)據(jù)寫入寫緩沖,如果同時出現(xiàn)cache hit,那么也更新cache。 1 1 有cache,寫回模式,讀操作首先考慮cache hit;寫操作也首先考慮cache hit。 由于ARM中section表項的權(quán)限位和page表項的位置不同, 以下代碼根據(jù)struct map_desc 中的保護(hù)標(biāo)志,分別計算頁表項中的AP, Domain和CB標(biāo)志位。 /*******************************************************************************/ prot_pte = L_PTE_PRESENT | L_PTE_YOUNG | L_PTE_DIRTY | (md->prot_read ? L_PTE_USER : 0) | (md->prot_write ? L_PTE_WRITE : 0) | (md->cacheable ? L_PTE_CACHEABLE : 0) | (md->bufferable ? L_PTE_BUFFERABLE : 0); prot_sect = PMD_TYPE_SECT | PMD_DOMAIN(md->domain) | (md->prot_read ? PMD_SECT_AP_READ : 0) | (md->prot_write ? PMD_SECT_AP_WRITE : 0) | (md->cacheable ? PMD_SECT_CACHEABLE : 0) | (md->bufferable ? PMD_SECT_BUFFERABLE : 0); /********************************************************************/ 設(shè)置虛擬地址,偏移地址和內(nèi)存length /********************************************************************/ virt = md->virtual; off = md->physical - virt; length = md->length; Send_linux 回復(fù)于:2007-03-06 15:45:16 /********************************************************************/ 建立虛擬地址到物理地址的映射 /********************************************************************/ while ((virt & 0xfffff || (virt + off) & 0xfffff) && length >= PAGE_SIZE) { alloc_init_page(virt, virt + off, md->domain, prot_pte); virt += PAGE_SIZE; length -= PAGE_SIZE; } while (length >= PGDIR_SIZE) { alloc_init_section(virt, virt + off, prot_sect); virt += PGDIR_SIZE; length -= PGDIR_SIZE; } while (length >= PAGE_SIZE) { alloc_init_page(virt, virt + off, md->domain, prot_pte); virt += PAGE_SIZE; length -= PAGE_SIZE; } /*************************************************************************/ create_mapping的作用是設(shè)置虛地址virt 到物理地址virt + off_set的映射頁目錄和頁表。 /*************************************************************************/ /* 映射中斷向量表區(qū)域 */ init_maps->physical = virt_to_phys(init_maps); init_maps->virtual = vectors_base(); init_maps->length = PAGE_SIZE; init_maps->domain = DOMAIN_USER; init_maps->prot_read = 0; init_maps->prot_write = 0; init_maps->cacheable = 1; init_maps->bufferable = 0; create_mapping(init_maps); 中斷向量表的虛地址init_maps,是用alloc_bootmem_low_pages分配的,通常是在PAGE_OFF+0x8000前 面的某一頁,vectors_base()是個宏,ARM規(guī)定中斷向量表的地址只能是0或0xFFFF0000,所以上述代碼映射一頁到0或 0xFFFF0000,中斷處理程序中的部分代碼也被拷貝到這一頁中。 5.3 parse_options() 分析由內(nèi)核引導(dǎo)程序發(fā)送給內(nèi)核的啟動選項,在初始化過程中按照某些選項運行,并將剩余部分傳送給init進(jìn)程。這些選項可能已經(jīng)存儲在配置文件中,也可能是由用戶在系統(tǒng)啟動時敲入的。但內(nèi)核并不關(guān)心這些,這些細(xì)節(jié)都是內(nèi)核引導(dǎo)程序關(guān)注的內(nèi)容,嵌入式系統(tǒng)更是如此。 5.4 trap_init() 這個函數(shù)用來做體系相關(guān)的中斷處理的初始化,在該函數(shù)中調(diào)用__trap_init((void*)vectors_base())函數(shù)將 exceptionvector設(shè)置到vectors_base開始的地址上。__trap_init函數(shù)位于entry-armv.S文件中,對于 ARM處理器,共有復(fù)位、未定義指令、SWI、預(yù)取終止、數(shù)據(jù)終止、IRQ和FIQ幾種方式。SWI主要用來實現(xiàn)系統(tǒng)調(diào)用,而產(chǎn)生了IRQ之后,通過 exceptionvector進(jìn)入中斷處理過程,執(zhí)行do_IRQ函數(shù)。 armnommu的trap_init()函數(shù)在arch/armnommu/kernel/traps.c文件中。vectors_base 是寫中斷向量的開始地址,在include/asm-armnommu/proc-armv/system.h文件中設(shè)置,地址為0或 0XFFFF0000。 ENTRY(__trap_init) stmfd sp!, {r4 - r6, lr} mrs r1, cpsr @ code from 2.0.38 bic r1, r1, #MODE_MASK @ clear mode bits /* 設(shè)置svc模式,disable IRQ,FIQ */ orr r1, r1, #I_BIT|F_BIT|MODE_SVC @ set SVC mode, disable IRQ,FIQ msr cpsr, r1 adr r1, .LCvectors @ set up the vectors ldmia r1, {r1, r2, r3, r4, r5, r6, ip, lr} stmia r0, {r1, r2, r3, r4, r5, r6, ip, lr} /* 拷貝異常向量 */ add r2, r0, #0x200 adr r0, __stubs_start @ copy stubs to 0x200 adr r1, __stubs_end 1: ldr r3, [r0], #4 str r3, [r2], #4 cmp r0, r1 blt 1b LOADREGS(fd, sp!, {r4 - r6, pc}) __stubs_start到__stubs_end的地址中包含了異常處理的代碼,因此拷貝到vectors_base+0x200的位置上。 5.5 init_IRQ() void __init init_IRQ(void) { extern void init_dma(void); int irq; for (irq = 0; irq < NR_IRQS; irq++) { irq_desc[irq].probe_ok = 0; irq_desc[irq].valid = 0; irq_desc[irq].noautoenable = 0; irq_desc[irq].mask_ack = dummy_mask_unmask_irq; irq_desc[irq].mask = dummy_mask_unmask_irq; irq_desc[irq].unmask = dummy_mask_unmask_irq; } CSR_WRITE(AIC_MDCR, 0x7FFFE); /* disable all interrupts */ CSR_WRITE(CAHCNF,0x0);/*Close Cache*/ CSR_WRITE(CAHCON,0x87);/*Flush Cache*/ while(CSR_READ(CAHCON)!=0); CSR_WRITE(CAHCNF,0x7);/*Open Cache*/ init_arch_irq(); init_dma(); } 這個函數(shù)用來做體系相關(guān)的irq處理的初始化,irq_desc數(shù)組是用來描述IRQ的請求隊列,每一個中斷號分配一個irq_desc結(jié)構(gòu),組 成了一個數(shù)組。NR_IRQS代表中斷數(shù)目,這里只是對中斷結(jié)構(gòu)irq_desc進(jìn)行了初始化。在默認(rèn)的初始化完成后調(diào)用初始化函數(shù) init_arch_irq,先執(zhí)行arch/armnommu/kernel/irq-arch.c文件中的函數(shù)genarch_init_irq (),然后就執(zhí)行include/asm-armnommu/arch-xxxx/irq.h中的inline函數(shù)irq_init_irq,在這里對 irq_desc進(jìn)行了實質(zhì)的初始化。其中mask用阻塞中斷;unmask用來取消阻塞;mask_ack的作用是阻塞中斷,同時還回應(yīng)ack給硬件表 示這個中斷已經(jīng)被處理了,否則硬件將再次發(fā)生同一個中斷。這里,不是所有硬件需要這個ack回應(yīng),所以很多時候mask_ack與mask用的是同一個函 數(shù)。 接下來執(zhí)行init_dma()函數(shù),如果不支持DMA,可以設(shè)置include/asm-armnommu/arch-xxxx/dma.h 中的MAX_DMA_CHANNELS為0,這樣在arch/armnommu/kernel/dma.c文件中會根據(jù)這個定義使用不同的函數(shù)。 5.6 sched_init() 初始化系統(tǒng)調(diào)度進(jìn)程,主要對定時器機(jī)制和時鐘中斷的BottomHalf的初始化函數(shù)進(jìn)行設(shè)置。與時間相關(guān)的初始化過程主要有兩步:(1)調(diào)用 init_timervecs()函數(shù)初始化內(nèi)核定時器機(jī)制;(2)調(diào)用init_bh()函數(shù)將BH向量TIMER_BH、TQUEUE_BH和 IMMEDIATE_BH所對應(yīng)的BH函數(shù)分別設(shè)置成timer_bh()、tqueue_bh()和immediate_bh()函數(shù) 5.7 softirq_init() 內(nèi)核的軟中斷機(jī)制初始化函數(shù)。調(diào)用tasklet_init初始化tasklet_struct結(jié)構(gòu),軟中斷的個數(shù)為32個。用于bh的 tasklet_struct結(jié)構(gòu)調(diào)用tasklet_init()以后,它們的函數(shù)指針func全都指向bh_action()。bh_action就 是tasklet實現(xiàn)bh機(jī)制的代碼,但此時具體的bh函數(shù)還沒有指定。 HI_SOFTIRQ用于實現(xiàn)bottom half,TASKLET_SOFTIRQ用于公共的tasklet。 open_softirq(TASKLET_SOFTIRQ, tasklet_action, NULL); /* 初始化公共的tasklet_struct要用到的軟中斷 */ open_softirq(HI_SOFTIRQ, tasklet_hi_action, NULL); /* 初始化tasklet_struct實現(xiàn)的bottom half調(diào)用 */ 這里順便講一下軟中斷的執(zhí)行函數(shù)do_softirq()。 軟中斷服務(wù)不允許在一個硬中斷服務(wù)程序內(nèi)部執(zhí)行,也不允許在一個軟中斷服務(wù)程序內(nèi)部執(zhí)行,所以通過in_interrupt()加以檢查。h- >action 就是串行化執(zhí)行軟中斷,當(dāng)bh 的tasklet_struct鏈入的時候,就能在這里執(zhí)行,在bh里重新鎖定了所有CPU,導(dǎo)致 一個時間只有一個CPU可以執(zhí)行bh函數(shù),但是do_softirq()是可以在多CPU上同時執(zhí)行的。而每個tasklet_struct在一個時間上 是不會出現(xiàn)在兩個CPU上的。另外,只有當(dāng)Linux初始化完成開啟中斷后,中斷系統(tǒng)才可以開始工作。 5.8 time_init() 這個函數(shù)用來做體系相關(guān)的timer的初始化,armnommu的在arch/armnommu/kernel/time.c。這里調(diào)用了在 include/asm-armnommu/arch-xxxx/time.h中的inline函數(shù)setup_timer,setup_timer() 函數(shù)的設(shè)計與硬件設(shè)計緊密相關(guān),主要是根據(jù)硬件設(shè)計情況設(shè)置時鐘中斷號和時鐘頻率等。 void __inline__ setup_timer (void) { /*----- disable timer -----*/ CSR_WRITE(TCR0, xxx); CSR_WRITE (AIC_SCR7, xxx); /* setting priority level to high */ /* timer 0: 100 ticks/sec */ CSR_WRITE(TICR0, xxx); timer_irq.handler = xxxxxx_timer_interrupt; setup_arm_irq(IRQ_TIMER, &timer_irq); /* IRQ_TIMER is the interrupt number */ INT_ENABLE(IRQ_TIMER); /* Clear interrupt flag */ CSR_WRITE(TISR, xxx); /* enable timer */ CSR_WRITE(TCR0, xxx); } 5.9 console_init() 控制臺初始化??刂婆_也是一種驅(qū)動程序,由于其特殊性,提前到該處完成初始化,主要是為了提前看到輸出信息,據(jù)此判斷內(nèi)核運行情況。很多嵌入式 Linux操作系統(tǒng)由于沒有在/dev目錄下正確配置console設(shè)備,造成啟動時發(fā)生諸如 unable to open an initialconsole的錯誤。 /*******************************************************************************/ init_modules()函數(shù)到smp_init()函數(shù)之間的代碼一般不需要作修改, 如果平臺具有特殊性,也只需對相關(guān)函數(shù)進(jìn)行必要修改。 這里簡單注明了一下各個函數(shù)的功能,以便了解。 /*******************************************************************************/ 5.10 init_modules() 模塊初始化。如果編譯內(nèi)核時使能該選項,則內(nèi)核支持模塊化加載/卸載功能 5.11 kmem_cache_init() 內(nèi)核Cache初始化。 5.12 sti() 使能中斷,這里開始,中斷系統(tǒng)開始正常工作。 Send_linux 回復(fù)于:2007-03-06 15:46:04 5.13 calibrate_delay() 近似計算BogoMIPS數(shù)字的內(nèi)核函數(shù)。作為第一次估算,calibrate_delay計算出在每一秒內(nèi)執(zhí)行多少次__delay循環(huán),也就 是每個定時器滴答(timer tick)―百分之一秒內(nèi)延時循環(huán)可以執(zhí)行多少次。這種計算只是一種估算,結(jié)果并不能精確到納秒,但這個數(shù)字供內(nèi)核使用已 經(jīng)足夠精確了。 BogoMIPS的數(shù)字由內(nèi)核計算并在系統(tǒng)初始化的時候打印。它近似的給出了每秒鐘CPU可以執(zhí)行一個短延遲循環(huán)的次數(shù)。在內(nèi)核中,這個結(jié)果主要用于需要等待非常短周期的設(shè)備驅(qū)動程序――例如,等待幾微秒并查看設(shè)備的某些信息是否已經(jīng)可用。 計算一個定時器滴答內(nèi)可以執(zhí)行多少次循環(huán)需要在滴答開始時就開始計數(shù),或者應(yīng)該盡可能與它接近。全局變量jiffies中存儲了從內(nèi)核開始保持跟 蹤時間開始到現(xiàn)在已經(jīng)經(jīng)過的定時器滴答數(shù), jiffies保持異步更新,在一個中斷內(nèi)——每秒一百次,內(nèi)核暫時掛起正在處理的內(nèi)容,更新變量,然后繼續(xù) 剛才的工作。 5.14 mem_init() 內(nèi)存初始化。本函數(shù)通過內(nèi)存碎片的重組等方法標(biāo)記當(dāng)前剩余內(nèi)存, 設(shè)置內(nèi)存上下界和頁表項初始值。 5.15 kmem_cache_sizes_init() 內(nèi)核內(nèi)存管理器的初始化,也就是初始化cache和SLAB分配機(jī)制。 5.16 pgtable_cache_init() 頁表cache初始化。 5.17 fork_init() 這里根據(jù)硬件的內(nèi)存情況,如果計算出的max_threads數(shù)量太大,可以自行定義。 5.18 proc_caches_init(); 為proc文件系統(tǒng)創(chuàng)建高速緩沖 5.19 vfs_caches_init(num_physpages); 為VFS創(chuàng)建SLAB高速緩沖 5.20 buffer_init(num_physpages); 初始化buffer 5.21 page_cache_init(num_physpages); 頁緩沖初始化 5.22 signals_init(); 創(chuàng)建信號隊列高速緩沖 5.23 proc_root_init(); 在內(nèi)存中創(chuàng)建包括根結(jié)點在內(nèi)的所有節(jié)點 5.24 check_bugs(); 檢查與處理器相關(guān)的bug 5.25 smp_init(); 5.26 rest_init(); 此函數(shù)調(diào)用kernel_thread(init, NULL, CLONE_FS | CLONE_FILES | CLONE_SIGNAL)函數(shù)。 5.26.1 kernel_thread()函數(shù)分析 這里調(diào)用了arch/armnommu/kernel/process.c中的函數(shù)kernel_thread,kernel_thread函數(shù) 中通過 __syscall(clone) 創(chuàng)建新線程。__syscall(clone)函數(shù)參見armnommu/kernel目錄下的entry- common.S文件。 5.26.2 init()完成下列功能: Init()函數(shù)通過kernel_thread(init, NULL, CLONE_FS | CLONE_FILES | CLONE_SIGNAL)的回調(diào)函數(shù)執(zhí)行,完成下列功能。 do_basic_setup() 在該函數(shù)里,sock_init()函數(shù)進(jìn)行網(wǎng)絡(luò)相關(guān)的初始化,占用相當(dāng)多的內(nèi)存,如果所開發(fā)系統(tǒng)不支持網(wǎng)絡(luò)功能,可以把該函數(shù)的執(zhí)行注釋掉。 do_initcalls()實現(xiàn)驅(qū)動的初始化, 這里需要與vmlinux.lds聯(lián)系起來看才能明白其中奧妙。? static void __init do_initcalls(void) { initcall_t *call; call = &__initcall_start; do { (*call)(); call++; } while (call < &__initcall_end); /* Make sure there is no pending stuff from the initcall sequence */ flush_scheduled_tasks(); } 查看 /arch/i386/vmlinux.lds,其中有一段代碼 __initcall_start = .; .initcall.init : { *(.initcall.init) } __initcall_end = .; 其含義是__initcall_start指向代碼節(jié).initcall.init的節(jié)首,而__initcall_end指向.initcall.init的節(jié)尾。 do_initcalls所作的是系統(tǒng)中有關(guān)驅(qū)動部分的初始化工作,那么這些函數(shù)指針數(shù)據(jù)是怎樣放到了.initcall.init節(jié)呢?在include/linux/init.h文件中有如下3個定義: 1. #define __init_call __attribute__ ((unused,__section__ (".initcall.init"))) __attribute__的含義就是構(gòu)建一個在.initcall.init節(jié)的指向初始函數(shù)的指針。 2. #define __initcall(fn) static initcall_t __initcall_##fn __init_call = fn ##意思就是在可變參數(shù)使用宏定義的時候構(gòu)建一個變量名稱為所指向的函數(shù)的名稱,并且在前面加上__initcall_ 3. #define module_init(x) __initcall(x); 很多驅(qū)動中都有類似module_init(usb_init)的代碼,通過該宏定義逐層解釋存放到.initcall.int節(jié)中。 blkmem相關(guān)的修改(do_initcalls()初始化驅(qū)動時執(zhí)行此代碼) 在blkmem_init()函數(shù)中,調(diào)用了blk_init_queue()函數(shù),blk_init_queue()函數(shù)調(diào)用了 blk_init_free_list()函數(shù),blk_init_free_list()函數(shù)又調(diào)用了blk_grow_request_list () 函數(shù),在這個函數(shù)中會kmem_cache_alloc出nr_requests個request結(jié)構(gòu)體。 這里如果nr_requests的值太大,則將占用過多的內(nèi)存,將造成硬件內(nèi)存不夠,因此可以根據(jù)實際情況將其替換成了較小的值,比如32、16等。 free_initmem 這個函數(shù)在arch/armnommu/mm/init.c文件中,其作用就是對init節(jié)的釋放,也可以通過修改代碼指定為不釋放。 5.26.3 init執(zhí)行過程 在內(nèi)核引導(dǎo)結(jié)束并啟動init之后,系統(tǒng)就轉(zhuǎn)入用戶態(tài)的運行,在這之后創(chuàng)建的一切進(jìn)程,都是在用戶態(tài)進(jìn)行。這里先要清楚一個概念:就是init進(jìn) 程雖然是從內(nèi)核開始的,即在前面所講的init/main.c中的init()函數(shù)在啟動后就已經(jīng)是一個核心線程,但在轉(zhuǎn)到執(zhí)行init程序(如 /sbin/init)之后,內(nèi)核中的init()就變成了/sbin/init程序,狀態(tài)也轉(zhuǎn)變成了用戶態(tài),也就是說核心線程變成了一個普通的進(jìn)程。 這樣一來,內(nèi)核中的init函數(shù)實際上只是用戶態(tài)init進(jìn)程的入口,它在執(zhí)行execve("/sbin/init",argv_init, envp_init)時改變成為一個普通的用戶進(jìn)程。這也就是exec函數(shù)的乾坤大挪移法,在exec函數(shù)調(diào)用其他程序時,當(dāng)前進(jìn)程被其他進(jìn)程“靈魂附 體”。 除此之外,它們的代碼來源也有差別,內(nèi)核中的init()函數(shù)的源代碼在/init/main.c中,是內(nèi)核的一部分。而/sbin/init程序的源代碼是應(yīng)用程序。 init程序啟動之后,要完成以下任務(wù):檢查文件系統(tǒng),啟動各種后臺服務(wù)進(jìn)程,最后為每個終端和虛擬控制臺啟動一個getty進(jìn)程供用戶登錄。由于所有其它用戶進(jìn)程都是由init派生的,因此它又是其它一切用戶進(jìn)程的父進(jìn)程。 init進(jìn)程啟動后,按照/etc/inittab的內(nèi)容進(jìn)程系統(tǒng)設(shè)置。很多嵌入式系統(tǒng)用的是BusyBox的init,它與一般所使用的init不一樣,會先執(zhí)行/etc/init.d/rcS而非/etc/rc.d/rc.sysinit。 小結(jié): 本想多整理一些相關(guān)資料,無奈又要開始新項目的奔波,start_kernel()函數(shù)也剛好差不多講完了,分析的不是很深入,希望對嵌入式Linux移植的網(wǎng)友們有一些幫助。最后列舉下面幾處未整理的知識點,有興趣的網(wǎng)友可作進(jìn)一步探討。 text.init和data.init說明 __init標(biāo)示符在gcc編譯器中指定將該函數(shù)置于內(nèi)核的特定區(qū)域。在內(nèi)核完成自身初始化之后,就試圖釋放這個特定區(qū)域。實際上,內(nèi)核中存在兩 個這樣的區(qū)域,.text.init和.data.init――第一個是代碼初始化使用的,另外一個是數(shù)據(jù)初始化使用的。另外也可以看到 __initfunc和__initdata標(biāo)志,前者和__init類似,標(biāo)志初始化專用代碼,后者則標(biāo)志初始化專用數(shù)據(jù)。 System.map內(nèi)核符號表 irq的處理過程 Linux內(nèi)核調(diào)度過程 |