TCP/IP网络编程读书笔记1

本篇主干内容是TCP/IP网络编程1-9章学习笔记

1. linux文件描述符

描述符从3开始以由小到大的顺序编号，0,1,2,分配给标准I/O用作标准输入、标准输出和标准错误。

2. 协议族与套接字类型（socket函数第一、二个参数）

domain常用： IPv4协议族 PF_INET；

type: SOCK_STREAM（面向连接，TCP）， SOCK_DRGAM（面向消息， UDP）

选用TCP时，第三个参数可以为0。

3.地址族与数据序列

4字节IP地址分类：

A类地址：首字节范围0~127（首位以0开始）；

B类地址：首字节范围128~191（前两位以10开始）；

C类地址：首字节范围192~223（前3位以110开始）.

端口号：操作系统参考端口号把数据传输给相应端口的套接字。端口号范围0~65535，其中0~1023位知名端口。

4.IPv4地址结构体

struct sockaddr_in {
    sa_family_t     sin_family;     //地址族
    uint16_t        sin_port;       //16位TCP/UDP端口号
    struct in_addr  sin_addr;       //32位IP地址
    char            sin_zero[8];    //补位，不使用  
};

其中in_addr定义如下：

struct in_addr {
    in_addr_t     s_addr; //32位IPv4地址
}

注：1）sin_zero为了让sockaddr_in的大小与sockaddr结构体保持一致，便于传参的时候进行强制类型转换。

　　2）为什么不直接填写sockaddr而要填写sockaddr_in再强转是因为sockaddr定义中一个sa_data[14]表示地址信息，不好填入。

　　3）sockaddr_in是专为IPv4设计，但其仍然要传入地址族信息是由于sockaddr的要求，sockaddr中需要地址族信息（其不是为IPv4单独设计）。

5. 网络字节序

大端序：先保存高位字节，再保存低位字节；

例子存0x12345678，在大端序中，内存的分布为：

内存号	0x20号	0x21号	0x22号	0x23号
存储内容	0x12	0x34	0x56	0x78

小端序：先保存低位字节，再保存高位字节。

内存号	0x20号	0x21号	0x22号	0x23号
存储内容	0x78	0x56	0x34	0x12

CPU存储时多用小端序（Intel和AMD均是），网络字节序为大端序。

字节序转换函数：htons,htonl,ntohs,ntohl （h代表主机，n代表网络，l代表long，s代表short）。

注：除了向sockaddr_in结构体填充数据外，其余情况无需考虑字节序问题。

6. 网络地址初始化与分配

字符串形式的IP地址与32位整数型数据的转换：

#include <arpa/inet.h>

in_addr_t inet_addr(const char* s); 　　　　　　　　 //成功返回32位大端序整数，失败返回INADDR_NONE 

int inet_aton(const char* s, struct in_addr* add)  //成功返回1，失败返回0

二者功能相同，inet_addr需要将转换后的IP地址待遇sockaddr_in结构体声明的in_addr结构体变量中。

inet_aton则通过参数自动把结果填入该结构体遍历。

调用方法：

1 if (!inet_aton(addr, &addr_inet.sin_addr)) { //addr存放字符串形式的IP地址（点分十进制） 
2     error_handling("Conversion error");
3 }

INADDR_ANY可以自动获取IP地址，而不必手动输入。

7. TCP服务器端函数（listen与等待连接请求；accept与受理连接请求）

#include <sys/socket.h>
int listen(int sock, int backlog); //backlog表示连接请求等待队列的长度

客户端请求连接时，受理之前一直使请求处于等待状态。

#include <sys/socket.h>
int accept(int sock, struct sockaddr* addr, socklen_t* addrlen);

addr保存发起连接请求的客户端地址信息的变量地址值。

accept函数受理连接请求等待队列中待处理的客户端连接请求。

函数调用成功后，accept函数内部产生用于数据I/O的套接字，并返回其文件描述符，这个套接字创建是自动的，并自动与发起连接请求的客户端建立连接。

8. TCP客户端函数（connect与请求连接）

#include <sys/socket.h>
int connect(int sock, struct sockaddr* servaddr, socklen_t addrlen);

servaddr保持目标服务器端地址信息。

connect在服务器端接受连接请求后返回，但注意这里的接受连接是指把请求信息放在等待队列，所以connect函数返回后并不立即进行数据交换（等待accept）.

9. TCP的服务器端/客户端函数调用关系

注：客户端只能等到服务器调用listen之后才能调用connect。但是在客户端调用connect之前，服务端可能率先调用accept,这时服务端进入阻塞状态，只到客户端调用connect函数为止。

10. TCP套接字中的I/O缓冲

write函数调用，数据移至输出缓冲；read函数调用，从输入缓冲读取数据。

1）I/O缓冲在每个TCP套接字中单独存在；

2）I/O缓冲在创建套接字时自动生成；

3) 即使关闭套接字也会继续传递输出缓冲中遗留的数据；

4）关闭套接字将丢失输入缓冲中的数据。

11. TCP的半关闭

1）单方面断开可能带来的问题：

主机A调用close后，主机B传输给主机A的数据也无法接受。

2）

#include <sys/socket.h>
int shutdown(int sock, int howto);

howto取 SHUT_RD 断开输入流；SHUT_WR断开输出流； SHUT_RDWR同时断开I/O流

3）断开输出流时向对方主机传递EOF。

12 IP地址与域名的转换

IP地址比域名发生变更的频率高，利用IP域名编写程序是更好的选择，所以说，程序需要IP地址和域名之间的转换函数。

#include <netdb.h>
struct hostent* gethostbyname(const char* hostname);// 成果返回hostent结构体地址，失败返回NULL指针

关于hostent结构体：

struct hostent {
    char* h_name;         // official name
    char** h_aliases;     //alias list
    int h_addrtype;        //host address type
    int h_length;        //address length
    char** h_addr_list;    //address list
};

最重要的成员是 h_addr_list，可以通过此变量与整数形式保存域名对应的IP地址。用户较多的网站有可能分配多个IP给同一个域名。

h_addr_list指向字符串指针数组，字符串指针数组中的元素实际是in_addr结构体变量的地址值（声明为char*而不是in_addr*因为hostent不仅仅为IPv4准备）。

如下图：

13. 几个基础的套接字选项

1）如何获取和更改套接字选项：

#include <sys/socket.h>
int getsockopt(int sock, int level, int optname, const void* optval, socklen_t* optlen);

int setsockopt(int sock, int level, int optname, const void* optval, socklen_t* optlen);

sock：用于查看选项套接字的文件描述符；

level:要查看的可选项的协议层。有SOL_SOCKET（套接字相关）， IPPROTO_IP（IP相关）， IPPROTO_TCP（TCP协议相关）

optname：要查看的可选项名；

optval: 保持查看结果的缓冲地址值；

optlen：optval的缓冲大小。getsockopt调用函数后，保存可选项信息的字节数。

举例：（通过SO_TYPE查看套接字类型）

1 int sock_type;
2 int tcp_sock = socket(PF_INET, SOCK_STREAM, 0);
3 int state = getsockopt(tcp_sock, SOL_SOCKET, SO_TYPE, (void*)&sock_type, &optlen);
4 if (state) {
5     error_handling("getsocket() error");
6 } 
7 else {
8     printf("SOCKET_STREAM: %d \n", sock_type);
9 }

2） SO_SNDBUF & SO_REVBUF

SO_SNDBUF 是输入缓冲大小相关可选项；SO_REVBUF是输出缓冲大小相关可选项。

用这两个可选项既可以读取当前I/O缓冲大小，也可以进行修改。（注：修改时不会完全按照请求更改大小）

3） SO_REUSEADDR 和 Time_wait

Time_wait存在的原因:

四次挥手中最后一个ACK（A回复的）可能在途中丢失，这样主机B会重传FIN消息。

但如果没有Time_wait状态，则主机A已经处在完全终止的状态，这个重传的信息便永远无法到达A。

基于这些考虑，先传FIN消息的主机应经过Time_wait状态。

Time_wait可能带来的问题：

网络状态不理想时，Time_wait会一直持续；想要快速重启服务器时，Time_wait导致必须等待几分钟。

SO_REUSEADDR可以将Time_wait状态下的套接字端口号重新分配给新的套接字：

1 int optlen = sizeof(option);
2 int option = 1;
3 setcsockopt(serv_sock, SOL_SOCKET, SO_REUSEADDR, (void*)&option, optlen);

注：客户端套接字端口号任意指定，所以每次运行程序时会动态分配端口号，故无需过多关注客户端Time_wait

参考文献：

尹圣雨《TCP/IP网络编程》 https://book.douban.com/subject/25911735/

posted @ 2016-09-28 15:01 wangxiaobao1114 阅读(580) 评论(2) 编辑收藏举报

刷新页面返回顶部

wangxiaobao的博客

TCP/IP网络编程读书笔记1

公告

wangxiaobao的博客

TCP/IP网络编程 读书笔记1

公告

TCP/IP网络编程读书笔记1