一家化妝品公司將一批新產(chǎn)品的樣品,準(zhǔn)備發(fā)給某學(xué)校某個班的女生們免費試用。通常情況下,這件郵包的地址上可以這么寫:

收件人:全體女生。

地址:A省B市C學(xué)校,X級Y班。

但是,如果在描述地址的時候這樣寫呢:

收件人:全體女生。

地址:請打電話xxxxxxxx,找他們學(xué)校一個叫Lucy的女生,然后把東西送到她的班上。

       這種文字是相當(dāng)?shù)脑幃惏?_-!!!,但是并不等于就沒有表述清楚郵包的去向和地址。事實上郵局看到這樣的地址一定會發(fā)飆的,然而對于電腦,如果你的地址描述形式是他可以接受和執(zhí)行的,他就會老老實實的按你的要求去做……

        所以,如何描述地址不是問題的關(guān)鍵,關(guān)鍵在于這樣的表述是不是能夠表述清楚一個地址。一種更加通用的表達(dá)形式可能是這樣的:

收件人:全體女生。

地址:<一種地址描述方式>

        事實上,在socket的通用address描述結(jié)構(gòu)sockaddr中正是用這樣的方式來進(jìn)行地址描述的:

C++代碼
  1. struct sockaddr  
  2. {  
  3.     unsigned short sa_family;  
  4.     char sa_data[14];  
  5. };  

       這是一個16字節(jié)大小的結(jié)構(gòu)(2+14),sa_family可以認(rèn)為是socket address family的縮寫,也可能被簡寫成AF(Address Family),他就好像我們例子中那個“收件人:全體女生”一樣,雖然事實上有很多AF的種類,但是我們這個教程中只用得上大名鼎鼎的internet家族AF_INET。另外的14字節(jié)是用來描述地址的。這是一種通用結(jié)構(gòu),事實上,當(dāng)我們指定sa_family=AF_INET之后,sa_data的形式也就被固定了下來:最前端的2字節(jié)用于記錄16位的端口,緊接著的4字節(jié)用于記錄32位的IP地址,最后的8字節(jié)清空為零。這就是我們實際在構(gòu)造sockaddr時候用到的結(jié)構(gòu)sockaddr_in(意指socket address internet):

C++代碼
  1. struct sockaddr_in  
  2. {  
  3.     unsigned short sin_family;  
  4.     unsigned short sin_port;  
  5.     struct in_addr sin_addr;  
  6.     char sin_zero[8];  
  7. };  

       我想,sin_的意思,就是socket (address) internet吧,只不過把address省略掉了。sin_addr被定義成了一個結(jié)構(gòu),這個結(jié)構(gòu)實際上就是:

C++代碼
  1. struct in_addr  
  2. {  
  3.     unsigned long s_addr;  
  4. };  

       in_addr顯然是internet address了,s_addr是什么意思呢?說實話我沒猜出值得肯定的答案(根據(jù)下面網(wǎng)友的評論,其意思為source address,謝謝),也許就是socket address的意思吧,盡管跟更廣義的sockaddr結(jié)構(gòu)意思有所重復(fù)了。哎,這些都是歷史原因,也許我是沒有精力去考究了。

       sockaddr和sockaddr_in在Linux中的實現(xiàn)

       你可能還記得我之前說過,UNIX和Linux上的socket實現(xiàn)都是從BSD的socket實現(xiàn)演變過來的。事實上,socket這個詞本來的意思,就是Berkeley Socket interface的簡單說法。Linux上的socket與原本的socket的應(yīng)該是完全兼容的,不過發(fā)展到今天,在代碼實現(xiàn)上可能有些小的差別。我們就吹毛求疵的來看看這些區(qū)別在什么地方。

C++代碼
  1. #include <bits/socket.h>    
  2.     
  3. /* Structure describing a generic socket address.  */    
  4. struct sockaddr    
  5. {    
  6.     __SOCKADDR_COMMON (sa_);    /* Common data: address family and length.  */    
  7.     char sa_data[14];        /* Address data.  */    
  8.   };    
  9. //==============     
  10. /* POSIX.1g specifies this type name for the `sa_family' member.  */    
  11. typedef unsigned short int sa_family_t;
  12.     
  13. /* This macro is used to declare the initial common members   
  14.    of the data types used for socket addresses, `struct sockaddr',`struct sockaddr_in', `struct sockaddr_un', etc.  */    
  15.     
  16. #define    __SOCKADDR_COMMON(sa_prefix) \    
  17.    sa_family_t sa_prefix##family    
  18. #define __SOCKADDR_COMMON_SIZE    (sizeof (unsigned short int))    

       可以看到,轉(zhuǎn)了幾次typedef,幾次宏定義,實際效果是與標(biāo)準(zhǔn)socket一樣的。

C++代碼
  1. #include <netinet/in.h>  
  2.   
  3. /* Internet address.  */  
  4. typedef uint32_t in_addr_t;  
  5. struct in_addr  
  6. {  
  7.   
  8.     in_addr_t s_addr;  
  9.   
  10. };  
  11.   
  12. //=================  
  13. /* Structure describing an Internet socket address.  */  
  14.   
  15. struct sockaddr_in  
  16. {  
  17.     __SOCKADDR_COMMON (sin_);  
  18.     in_port_t sin_port;            /* Port number.  */  
  19.     struct in_addr sin_addr;        /* Internet address.  */  
  20.   
  21.     /* Pad to size of `struct sockaddr'.  */  
  22.     unsigned char sin_zero[sizeof (struct sockaddr) -  
  23.                __SOCKADDR_COMMON_SIZE -  
  24.                sizeof (in_port_t) -  
  25.                sizeof (struct in_addr)];  
  26. };  

       同樣的,看起來挺復(fù)雜,實際上與標(biāo)準(zhǔn)socket的定義是一樣的。

       頭文件依賴關(guān)系

       <bits/socket.h>是包含在<sys/socket.h>中的,<netinet/in.h>是包含在<arpa/inet.h>中的,實際上我們在程序中往往就是:

       #include <sys/socket.h>

       #include <arpa/inet.h>

       值得知道的是,ARPA是 Advanced research project agency(美國國防部高級研究計劃暑)的所寫,ARPANET是當(dāng)今互聯(lián)網(wǎng)的前身,所以我們就可以想象,為什么inet.h會在arpa目錄下了。