《Unix网络编程》卷一(简介TCP/IP、基础套接字编程)

通常说函数返回某个错误值,实际上是函数返回值为-1,而全局变量errno被置为指定的常值(即称函数返回这个错误值)。

exit终止进程,Unix在一个进程终止时总是关闭该进程所有打开的描述符

TCP三次握手完毕,accept返回其返回值是一个称为已连接描述符(connected descriptor)的新描述符。调用close关闭与客户的连接。

套接字API

TCP状态转移图,11种状态。

MSS,maximum segment size,最大分节大小。通常客户端主动打开时发送SYN的同时会发送MSS,服务端应答(SYN、ACK、MSS)时同样也发送一个MSS,不同方向上MSS可以不同

 

SCTP多宿特性,单个SCTP端点能支持多个IP地址。

SCTP的四路握手。验证标记、状态cookie。

 

IPv4数据报最大长度65535,包括IP首部,因为总长度字段是16位;IPv6数据报最大长度65575,包括40字节IPv6首部因为净长度字段是16位。

IPv4首部20字节(固定长度),另外还有最多40字节可选部分

 

套接字地址结构在内核和进程间传递,从进程传到内核,从内核传到进程,不是非常理解,应该就是参数传递进去和被写回吧?另外有一个值-结果参数以前很少碰到。

 每个文件套接字都有一个引用计数,引用计数在文件表项中维护。

存放在硬盘上的可执行程序文件能被Unix执行的唯一方法是:由一个现有进程调用六个exec函数中的一个。(理解)

六个exec函数区别在于:待执行程序由文件名还是路径名指定参数是一一列出还是指针数组把调用进程环境传递给新程序还是指定新环境

子进程调用exec时,子进程内存映像被替换成新程序文件,只有文件描述符(在socket中是已连接套接字描述符)跨exec继续保持开放

 

一个简单echo客户/服务器程序涉及到的一些细节(非常重要):

僵死子进程,通过捕获SIGCHLD信号加以处理;

信号处理函数必须调用waitpid而不是wait,因为unix信号是不排队的,当有多个子进程时wait函数只能处理第一个,后面的将变成僵死进程;

另一个问题是服务器进程终止时,客户进程没被告知,因为客户进程阻塞于等待用户输入而未接收到通知,这需要select或poll函数来处理,它们等待多个描述符中的任何一个就绪而不是阻塞于某个描述符。

select函数中间的三个参数(读、写、异常描述符集)都是值—结果参数,返回时,未就绪描述符对应的被置0,其他是1,重新调用时,将所关心位重置1

close函数有两个限制,shutdown函数可以克服,它关闭一半tcp连接(可参数选读或者写)。

pselect间参数结构不同另一个不同点是多了一个指向信号掩码的指针,从而运行程序先禁止提交某些信号。

 

拒绝服务(denial of service,DoS)型攻击。

 

UDP也可以使用connect函数,成为已连接UDP套接字,然后可以使用write和read函数读写,而不是sento和recvfrom。

 

DNS中的条目称为资源记录(resource record,RR)。常见RR类型有:A、AAAA、PTR、MX、CNAME。

 

gethostbyname和gehostbyaddr的返回值均为一个hostent(host entry缩写)结构:

struct    hostent {
    const char    *h_name;    // 主机的正式名称。 
    char    **h_aliases;    //  空字节-地址的预备名称的指针。
    short    h_addrtype;    // 地址类型; 通常是AF_INET。 
    short    h_length;    // 地址的比特长度
    char    **h_addr_list;    //  主机网络地址指针(只有IPV4
   #define    h_addr    h_addr_list[0]    // h_addr 为 h_addr_list中的第一地址。 
};

gethostbyname只能返回IPV4地址,而getaddrinfo能够同时处理IPV4和IPV6地址。

gethostbyname和gehostbyaddr用于主机名和地址的映射,而getservbyname和getservbyport则用于服务与端口之间的映射。

getaddrinfo能处理名字到地址、服务到端口的转换(由参数中列表中第一个为主机名,第二个为服务名可看出):

int getaddrinfo( const char *hostname, 
    const char *service, 
    const struct addrinfo *hints, 
    struct addrinfo **result );//返回结果保存到这里

其中,保存返回结果的struct addrinfo结构体详细信息如下:

表头文件: #include<netdb.h>

struct addrinfo
{ 
int ai_flags; 
int ai_family; //AF_INET,AF_INET6,UNIX etc
int ai_socktype; //STREAM,DATAGRAM,RAW
int ai_protocol; //IPPROTO_IP, IPPROTO_IPV4, IPPROTO_IPV6 etc
size_t ai_addrlen;//length of ai_addr
char* ai_canonname; //full hostname 
struct sockaddr* ai_addr; //addr of host
struct addrinfo* ai_next;
}

value of ai_falgs:
AI_PASSIVE: Socket address is intended for `bind'.
AI_CANONNAME:Request for canonical name.
AI_NUMERICHOST: Don't use name resolution.
AI_V4MAPPED: IPv4 mapped addresses are acceptable. 
AI_ALL: Return IPv4 mapped and IPv6 addresses. 
AI_ADDRCONFIG:Use configuration of this host to choose

定义函数: 
int getaddrinfo( const char *hostname, const char *service, const struct addrinfo *hints,
struct addrinfo **result );

函数说明:
      getaddrinfo函数能够处理名字到地址以及服务到端口这两种转换,返回的是一个sockaddr 结构的链而 不是一个地址清单。它具有协议无关性。
      hostname:一个主机名或者地址串(IPv4的点分十进制串或者IPv6的16进制串)
      service:一个服务名或者10进制端口号数串。
       hints:可以是一个空指针,也可以是一个指向某个addrinfo结构的指针,调用者在这个结构中填入关于期望返回的信息类型的暗示。举例来说:如果指定的服务既支持TCP也支持UDP,那么调用者可以把hints结构中的ai_socktype成员设置成SOCK_DGRAM使得返回的仅仅是适用于数据报套接口的信息。返回0: 成功,返回非0: 出错。

定义函数:const char *gai_strerror( int error );
函数说明:
      该函数以getaddrinfo返回的非0错误值的名字和含义为他的唯一参数,返回一个指向对应的出错信息串的指针。

定义函数: void freeaddrinfo( struct addrinfo *ai );
函数说明:
       由getaddrinfo返回的所有存储空间都是动态获取的,这些存储空间必须通过调用freeaddrinfo返回给系统。
struct addrinfo结构体

与getaddrinfo函数对应的是getnameinfo函数。

 

在linux环境下,结构体struct sockaddr在/usr/include/linux/socket.h中定义,具体如下:
typedef unsigned short sa_family_t;
struct sockaddr {
        sa_family_t     sa_family;    /* address family, AF_xxx       */
        char            sa_data[14];    /* 14 bytes of protocol address */

在linux环境下,结构体struct sockaddr_in在/usr/include/netinet/in.h中定义,具体如下:
/* Structure describing an Internet socket address. */
struct sockaddr_in
{
    __SOCKADDR_COMMON (sin_);
    in_port_t sin_port;                     /* Port number. */
    struct in_addr sin_addr;            /* Internet address. */

    /* Pad to size of `struct sockaddr'. */
    unsigned char sin_zero[sizeof (struct sockaddr) -
                           __SOCKADDR_COMMON_SIZE -
                           sizeof (in_port_t) -
                           sizeof (struct in_addr)];     
                           /* 字符数组sin_zero[8]的存在是为了保证结构体struct sockaddr_in的大小和结构体struct sockaddr的大小相等 */
};
struct sockaddr是通用的套接字地址,而struct sockaddr_in则是internet环境下套接字的地址形式,二者长度一样,都是16个字节。二者是并列结构,指向sockaddr_in结构的指针也可以指向sockaddr。一般情况下,需要把sockaddr_in结构强制转换成sockaddr结构再传入系统调用函数中。

下面是struct sockaddr_in中用到两个数据类型,具体定义如下:
/* Type to represent a port. */
typedef uint16_t in_port_t; 

struct in_addr其实就是32位IP地址
struct in_addr {
        unsigned long s_addr;
};

BSD网络软件中包含了两个函数,用来在二进制地址格式和点分十进制字符串格式之间相互转换,但是这两个函数仅仅支持IPv4。
       in_addr_t inet_addr(const char *cp);
       char *inet_ntoa(struct in_addr in);
功能相似的两个函数同时支持IPv4和IPv6
       const char *inet_ntop(int domain, const void *addr, char *str, socklen_t size);
       int inet_pton(int domain, const char *str, void *addr);

通常的用法是:
int sockfd;
struct sockaddr_in my_addr;
sockfd = socket(AF_INET, SOCK_STREAM, 0); 

my_addr.sin_family = AF_INET; /* 主机字节序 */
my_addr.sin_port = htons(MYPORT); /* short, 网络字节序 */

my_addr.sin_addr.s_addr = inet_addr("192.168.0.1");

bzero(&(my_addr.sin_zero), 8); /* zero the rest of the struct */
//memset(&my_addr.sin_zero, 0, 8);

bind(sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr));

#define UNIX_PATH_MAX 108

  struct sockaddr_un {

  sa_family_t sun_family; /*PF_UNIX或AF_UNIX */

  char sun_path[UNIX_PATH_MAX]; /* 路径名 */

  };

struct sockaddr结构类型是用来保存socket信息的:
   struct sockaddr {
   unsigned short sa_family; /* 地址族, AF_xxx */——地址的格式
  char sa_data[14]; /* 14 字节的协议地址 */——地址值(IP和端口号)
  };

Sockfd是调用socket函数返回的socket描述符,my_addr是一个指向包含有本机IP地址及端口号等信息的sockaddr类型的指针;addrlen常被设置为sizeof(struct sockaddr)。 
  struct sockaddr结构类型是用来保存socket信息的: 
  struct sockaddr { 
   unsigned short sa_family; /* 地址族, AF_xxx */ 
char sa_data[14]; /* 14 字节的协议地址 */ 
}; 
  sa_family一般为AF_INET,代表Internet(TCP/IP)地址族;sa_data则包含该socket的IP地址和端口号。 
  另外还有一种结构类型: 
  struct sockaddr_in { 
   short int sin_family; /* 地址族 */ 
   unsigned short int sin_port; /* 端口号 */ 
   struct in_addr sin_addr; /* IP地址 */ 
   unsigned char sin_zero[8]; /* 填充0 以保持与struct sockaddr同样大小 */ 
  }; 
   这个结构更方便使用。sin_zero用来将sockaddr_in结构填充到与struct sockaddr同样的长度,可以用bzero()或memset()函数将其置为零。指向sockaddr_in 的指针和指向sockaddr的指针可以相互转换,这意味着如果一个函数所需参数类型是sockaddr时,你可以在函数调用的时候将一个指向 sockaddr_in的指针转换为指向sockaddr的指针;或者相反。


你只要记住,填值的时候使用sockaddr_in结构,而作为函数的 
参数传入的时候转换成sockaddr结构就行了,毕竟都是16个字符 
长。


struct in_addr { 
union { 
struct { u_char s_b1,s_b2,s_b3,s_b4; } S_un_b; 
struct { u_short s_w1,s_w2; } S_un_w; 
u_long S_addr; 
} S_un };
struct sockaddr与struct sockaddr_in ,struct sockaddr_un的区别和联系

 

inet_pton函数将点分十进制格式IP地址转换为二进制整数,IPV4和IPV6都支持:

inet_pton:将“点分十进制” -> “二进制整数”
int inet_pton(int af, const char *src, void *dst);
这个函数转换字符串到网络地址,第一个参数af是地址簇,第二个参数*src是来源地址,第三个参数* dst接收转换后的数据。
inet_pton 是inet_addr的扩展,支持的多地址族有下列:
af = AF_INET
src为指向字符型的地址,即ASCII的地址的首地址(ddd.ddd.ddd.ddd格式的),函数将该地址转换为in_addr的结构体,并复制在*dst中。
af = AF_INET6
src为指向IPV6的地址,函数将该地址转换为in6_addr的结构体,并复制在*dst中。
如果函数出错将返回一个负值,并将errno设置为EAFNOSUPPORT,如果参数af指定的地址族和src格式不对,函数将返回0。

 

posted @ 2016-10-11 16:06  IT由零开始  阅读(3490)  评论(0编辑  收藏  举报