实现 FTP 客户端和服务器程序所调用的系统函数

此文档是记录实现FTP服务器和客户端过程中所调用的系统函数,详细的设计请参考Linux 环境下使用 Socket 技术实现简化的 FTP服务器和客户端

socket()函数

在Linux中,一切都是文件,除了文本文件、源文件、二进制文件等,一个硬件设备也可以被映射为一个虚拟的文件,称为设备文件。例如,stdin 称为标准输入文件,它对应的硬件设备一般是键盘,stdout 称为标准输出文件,它对应的硬件设备一般是显示器。对于所有的文件,都可以使用 read() 函数读取数据,使用 write() 函数写入数据。

“一切都是文件”的思想极大地简化了程序员的理解和操作,使得对硬件设备的处理就像普通文件一样。所有在Linux中创建的文件都有一个 int 类型的编号,称为文件描述符(File Descriptor)。使用文件时,只要知道文件描述符就可以。例如,stdin 的描述符为 0,stdout 的描述符为 1。

在Linux中,socket 也被认为是文件的一种,和普通文件的操作没有区别,所以在网络数据传输过程中自然可以使用与文件 I/O 相关的函数。可以认为,两台计算机之间的通信,实际上是两个 socket 文件的相互读写

文件描述符有时也被称为文件句柄(File Handle),但“句柄”主要是 Windows 中术语,所以本教程中如果涉及到 Windows 平台将使用“句柄”,如果涉及到 Linux 平台将使用“描述符”。

在 Linux 下使用 <sys/socket.h> 头文件中 socket() 函数来创建套接字,原型为:

int socket(int af, int type, int protocol);
  1. af 为地址族(Address Family),也就是 IP 地址类型,常用的有 AF_INET 和 AF_INET6。AF 是“Address Family”的简写,INET是“Inetnet”的简写。AF_INET 表示 IPv4 地址,例如 127.0.0.1;AF_INET6 表示 IPv6 地址,例如 1030::C9B4:FF12:48AA:1A2B。

你也可以使用PF前缀,PF是“Protocol Family”的简写,它和AF是一样的。例如,PF_INET 等价于 AF_INET,PF_INET6 等价于 AF_INET6。

  1. type 为数据传输方式,常用的有 SOCK_STREAM 和 SOCK_DGRAcM,在《socket是什么意思》一节中已经进行了介绍。

  2. protocol 表示传输协议,常用的有 IPPROTO_TCP 和 IPPTOTO_UDP,分别表示 TCP 传输协议和 UDP 传输协议。

有了地址类型和数据传输方式,还不足以决定采用哪种协议吗?为什么还需要第三个参数呢?

正如大家所想,一般情况下有了 af 和 type 两个参数就可以创建套接字了,操作系统会自动推演出协议类型,除非遇到这样的情况:有两种不同的协议支持同一种地址类型和数据传输类型。如果我们不指明使用哪种协议,操作系统是没办法自动推演的。

这里使用 IPv4 地址,参数 af 的值为 PF_INET。如果使用 SOCK_STREAM 传输数据,那么满足这两个条件的协议只有 TCP,因此可以这样来调用 socket() 函数:

int tcp_socket = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);  //IPPROTO_TCP表示TCP协议

这种套接字称为 TCP 套接字。

如果使用 SOCK_DGRAM 传输方式,那么满足这两个条件的协议只有 UDP,因此可以这样来调用 socket() 函数:

int udp_socket = socket(AF_INET, SOCK_DGRAM, IPPROTO_UDP);  //IPPROTO_UDP表示UDP协议

这种套接字称为 UDP 套接字。

上面两种情况都只有一种协议满足条件,可以将 protocol 的值设为 0,系统会自动推演出应该使用什么协议,如下所示:

int tcp_socket = socket(AF_INET, SOCK_STREAM, 0);  //创建TCP套接字
int udp_socket = socket(AF_INET, SOCK_DGRAM, 0);  //创建UDP套接字

socket() 函数用来创建套接字,确定套接字的各种属性,然后服务器端要用 bind() 函数将套接字与特定的IP地址和端口绑定起来,只有这样,流经该IP地址和端口的数据才能交给套接字处理;而客户端要用 connect() 函数建立连接。

bind() 函数

bind() 函数的原型为:

int bind(int sock, struct sockaddr *addr, socklen_t addrlen);  //Linux
int bind(SOCKET sock, const struct sockaddr *addr, int addrlen);  //Windows

sock 为 socket 文件描述符,addr 为 sockaddr 结构体变量的指针,addrlen 为 addr 变量的大小,可由 sizeof() 计算得出。

下面的代码,将创建的套接字与IP地址 127.0.0.1、端口 1234 绑定:

//创建套接字
int serv_sock = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);
//创建sockaddr_in结构体变量

struct sockaddr_in serv_addr;memset(&serv_addr, 0, sizeof(serv_addr));  //每个字节都用0填充
serv_addr.sin_family = AF_INET;  //使用IPv4地址
serv_addr.sin_addr.s_addr = inet_addr("127.0.0.1");  //具体的IP地址
serv_addr.sin_port = htons(1234);  //端口

//将套接字和IP、端口绑定
bind(serv_sock, (struct sockaddr*)&serv_addr, sizeof(serv_addr));

这里我们使用 sockaddr_in 结构体,然后再强制转换为 sockaddr 类型,后边会讲解为什么这样做。

sockaddr_in 结构体

接下来不妨先看一下 sockaddr_in 结构体,它的成员变量如下:

struct sockaddr_in{    
	sa_family_t     sin_family;   //地址族(Address Family),也就是地址类型 
    uint16_t        sin_port;     //16位的端口号    
    struct in_addr  sin_addr;     //32位IP地址    
    char            sin_zero[8];  //不使用,一般用0填充
};
  1. sin_family 和 socket() 的第一个参数的含义相同,取值也要保持一致。

  2. sin_prot 为端口号。uint16_t 的长度为两个字节,理论上端口号的取值范围为 0~65536,但 0~1023 的端口一般由系统分配给特定的服务程序,例如 Web 服务的端口号为 80,FTP 服务的端口号为 21,所以我们的程序要尽量在 1024~65536 之间分配端口号。

    端口号需要用 htons() 函数转换。

  3. sin_addr 是 struct in_addr 结构体类型的变量,下面会详细讲解。

  4. sin_zero[8] 是多余的8个字节,没有用,一般使用 memset() 函数填充为 0。上面的代码中,先用 memset() 将结构体的全部字节填充为 0,再给前3个成员赋值,剩下的 sin_zero 自然就是 0 了。

in_addr 结构体

sockaddr_in 的第3个成员是 in_addr 类型的结构体,该结构体只包含一个成员,如下所示:

纯文本复制
struct in_addr{    in_addr_t  s_addr;  //32位的IP地址};

listen()函数

头文件:#include <sys/socket.h>

定义函数:

int listen(int s, int backlog);

函数说明:listen()用来等待参数s 的socket 连线.。参数backlog 指定同时能处理的最大连接要求,,如果连接数目达此上限则client 端将收到ECONNREFUSED 的错误。Listen()并未开始接收连线,只是设置socket 为listen 模式,真正接收client 端连线的是accept()。通常listen()会在socket(),bind()之后调用, 接着才调用accept()。

返回值:成功则返回0,失败返回-1,错误原因存于errno。

附加说明:listen()只适用SOCK_STREAM 或SOCK_SEQPACKET 的socket 类型。如果socket 为AF_INET 则参数backlog 最大值可设至128。

accept() 函数

当套接字处于监听状态时,可以通过 accept() 函数来接收客户端请求。它的原型为:

int accept(int sock, struct sockaddr *addr, socklen_t *addrlen); 

它的参数与 listen() 和 connect() 是相同的:sock 为服务器端套接字,addr 为 sockaddr_in 结构体变量,addrlen 为参数 addr 的长度,可由 sizeof() 求得。

accept() 返回一个新的套接字来和客户端通信,addr 保存了客户端的IP地址和端口号,而 sock 是服务器端的套接字,大家注意区分。后面和客户端通信时,要使用这个新生成的套接字,而不是原来服务器端的套接字。

最后需要说明的是:listen() 只是让套接字进入监听状态,并没有真正接收客户端请求,listen() 后面的代码会继续执行,直到遇到 accept()。accept() 会阻塞程序执行(后面代码不能被执行),直到有新的请求到来。

shutdown()函数

头文件:#include <sys/socket.h>

定义函数:

int shutdown(int s, int how);

函数说明:shutdown()用来终止参数s 所指定的socket 连线。参数s 是连线中的socket 处理代码,参数how在 Linux 下有以下取值:

  • SHUT_RD:断开输入流。套接字无法接收数据(即使输入缓冲区收到数据也被抹去),无法调用输入相关函数。
  • SHUT_WR:断开输出流。套接字无法发送数据,但如果输出缓冲区中还有未传输的数据,则将传递到目标主机。
  • SHUT_RDWR:同时断开 I/O 流。相当于分两次调用 shutdown(),其中一次以 SHUT_RD 为参数,另一次以 SHUT_WR 为参数。

返回值:成功则返回0,失败返回-1,错误原因存于errno。

perror()函数

函数perror()用于抛出最近的一次系统错误信息,其原型如下:

  void perror(char *string);

参数string为要输出的错误信息。

说明:perror()用来将上一个函数发生错误的原因输出到标准错误(stderr)。参数string所指的字符串会先打印出,后面再加上错误原因字符串,此错误原因依照全局变量errno 的值来决定要输出的字符串。

setsockopt()函数

头文件:#include <sys/types.h> #include <sys/socket.h>

定义函数:

int setsockopt(int s, int level, int optname, const void * optval, ,socklen_toptlen);

函数说明:setsockopt()用来设置参数s 所指定的socket 状态。

参数level 代表欲设置的网络层, 一般设成SOL_SOCKET 以存取socket 层。 参数optname 代表欲设置的选项,有下列几种数值:

SO_DEBUG 打开或关闭排错模式
SO_REUSEADDR 允许在bind ()过程中本地地址可重复使用
SO_TYPE 返回socket 形态.
SO_ERROR 返回socket 已发生的错误原因
SO_DONTROUTE 送出的数据包不要利用路由设备来传输.
SO_BROADCAST 使用广播方式传送
SO_SNDBUF 设置送出的暂存区大小
SO_RCVBUF 设置接收的暂存区大小
SO_KEEPALIVE 定期确定连线是否已终止.
SO_OOBINLINE 当接收到OOB 数据时会马上送至标准输入设备
SO_LINGER 确保数据安全且可靠的传送出去.

参数 optval 代表欲设置的值, 参数optlen 则为optval 的长度。

返回值:成功则返回0, 若有错误则返回-1, 错误原因存于errno.

bzero()函数

头文件:#include <string.h>

bzero() 会将内存块(字符串)的前n个字节清零,其原型为:

  void bzero(void *s, int n);

参数s为内存(字符串)指针,n 为需要清零的字节数。

bzero()会将参数s 所指的内存区域前n 个字节,全部设为零值。

实际上,bzero(void * s, int n) 等价于memset((void * )s, 0, size_tn),用来将内存块的前 n 个字节清零。

htons()函数

头文件:#include <netinet/in.h>

定义函数:

unsigned short int htons(unsigned short int hostshort);

函数说明:htons()用来将参数指定的16 位hostshort 转换成网络字符顺序.

返回值:返回对应的网络字符顺序.

memcpy()函数

头文件:#include <string.h>

memcpy() 用来复制内存,其原型为:

void * memcpy ( void * dest, const void * src, size_t num );

memcpy() 会复制 src 所指的内存内容的前 num 个字节到 dest 所指的内存地址上。

memcpy() 并不关心被复制的数据类型,只是逐字节地进行复制,这给函数的使用带来了很大的灵活性,可以面向任何数据类型进行复制。

需要注意的是:

  • dest 指针要分配足够的空间,也即大于等于 num 字节的空间。如果没有分配空间,会出现断错误。
  • dest 和 src 所指的内存空间不能重叠(如果发生了重叠,使用 memmove() 会更加安全)。与 strcpy() 不同的是,memcpy() 会完整的复制 num 个字节,不会因为遇到“\0”而结束。

pthread_create()函数

头文件:#include<pthread.h>

函数声明

int pthread_create(pthread_t *tidp, const pthread_attr_t *attr, void *(*start_rtn)(void*), void *arg);

编译链接参数:-lpthread

返回值:若线程创建成功,则返回0。若线程创建失败,则返回出错编号,并且*thread中的内容是未定义的。

返回成功时,由tidp指向的内存单元被设置为新创建线程的线程ID。attr参数用于指定各种不同的线程属性。新创建的线程从start_rtn函数的地址开始运行,该函数只有一个万能指针参数arg,如果需要向start_rtn函数传递的参数不止一个,那么需要把这些参数放到一个结构中,然后把这个结构的地址作为arg的参数传入。

参数

第一个参数为指向线程标识符和指针。

第二个参数用来设置线程属性。

第三个参数是线程运行函数的起始地址。

最后一个参数是运行函数的参数。

close()函数

头文件:#include <unistd.h>

定义函数:

int close(int fd);

函数说明:当使用完文件后若已不再需要则可使用 close()关闭该文件,二close()会让数据写回磁盘, 并释放该文件所占用的资源。参数fd 为先前由open()或creat()所返回的文件描述词。

返回值:若文件顺利关闭则返回0,发生错误时返回-1。

open函数

头文件:#include <sys/types.h> #include <sys/stat.h> #include <fcntl.h>

定义函数:

  int open(const char * pathname, int flags);
  int open(const char * pathname, int flags, mode_t mode);

函数说明:

参数 pathname 指向欲打开的文件路径字符串. 下列是参数flags 所能使用的旗标:
O_RDONLY 以只读方式打开文件
O_WRONLY 以只写方式打开文件
O_RDWR 以可读写方式打开文件。上述三种旗标是互斥的,也就是不可同时使用,但可与下列的旗标利用OR(|)运算符组合。
O_CREAT 若欲打开的文件不存在则自动建立该文件。
O_EXCL 如果O_CREAT 也被设置,此指令会去检查文件是否存在。文件若不存在则建立该文件,否则将导致打开文件错误。此外,若O_CREAT 与O_EXCL 同时设置, 并且欲打开的文件为符号连接, 则会打开文件失败。
O_NOCTTY 如果欲打开的文件为终端机设备时,则不会将该终端机当成进程控制终端机。
O_TRUNC 若文件存在并且以可写的方式打开时,此旗标会令文件长度清为0,而原来存于该文件的资料也会消失。
O_APPEND 当读写文件时会从文件尾开始移动,也就是所写入的数据会以附加的方式加入到文件后面。
O_NONBLOCK 以不可阻断的方式打开文件,也就是无论有无数据读取或等待,都会立即返回进程之中。
O_NDELAY 同O_NONBLOCK。
O_SYNC 以同步的方式打开文件。
O_NOFOLLOW 如果参数pathname 所指的文件为一符号连接,则会令打开文件失败。
O_DIRECTORY 如果参数pathname 所指的文件并非为一目录,则会令打开文件失败。注:此为Linux2. 2 以后特有的旗标,以避免一些系统安全问题。

参数mode 则有下列数种组合,只有在建立新文件时才会生效,此外真正建文件时的权限会受到umask 值所影响,因此该文件权限应该为 (mode-umaks)。

S_IRWXU00700 权限,代表该文件所有者具有可读、可写及可执行的权限。
S_IRUSR 或S_IREAD,00400 权限,代表该文件所有者具有可读取的权限。
S_IWUSR 或S_IWRITE,00200 权限,代表该文件所有者具有可写入的权限。
S_IXUSR 或S_IEXEC,00100 权限, 代表该文件所有者具有可执行的权限。
S_IRWXG 00070 权限,代表该文件用户组具有可读、可写及可执行的权限。
S_IRGRP 00040 权限,代表该文件用户组具有可读的权限。
S_IWGRP 00020 权限,代表该文件用户组具有可写入的权限。
S_IXGRP 00010 权限,代表该文件用户组具有可执行的权限。
S_IRWXO 00007 权限,代表其他用户具有可读、可写及可执行的权限。
S_IROTH 00004 权限,代表其他用户具有可读的权限。
S_IWOTH 00002 权限,代表其他用户具有可写入的权限。
S_IXOTH 00001 权限,代表其他用户具有可执行的权限。

返回值:若所有欲核查的权限都通过了检查则返回0 值,表示成功,只要有一个权限被禁止则返回-1。

inet_ntoa()函数

头文件:#include <sys/socket.h> #include <netinet/in.h> #include <arpa/inet.h>

定义函数:

char * inet_ntoa(struct in_addr in);

函数说明:inet_ntoa()用来将参数in所指的网络二进制的数字转换成网络地址, 然后将指向此网络地址字符串的指针返回.

返回值:成功则返回字符串指针, 失败则返回NULL.

send函数

头文件:#include <sys/types.h> #include <sys/socket.h>

定义函数:

int send(int s, const void * msg, int len, unsigned int falgs);

函数说明:send()用来将数据由指定的socket 传给对方主机. 参数s 为已建立好连接的socket. 参数msg 指向欲连线的数据内容, 参数len 则为数据长度. 参数flags 一般设0, 其他数值定义如下:

MSG_OOB 传送的数据以out-of-band 送出。
MSG_DONTROUTE 取消路由表查询。
MSG_DONTWAIT 设置为不可阻断运作。
MSG_NOSIGNAL 此动作不愿被SIGPIPE 信号中断。

返回值:成功则返回实际传送出去的字符数,失败返回-1。错误原因存于errno。

getcwd函数

头文件:#include <unistd.h>

定义函数:

char * getcwd(char * buf, size_t size);

函数说明:getcwd()会将当前的工作目录绝对路径复制到参数buf 所指的内存空间,参数size 为buf 的空间大小。

注:

  1. 在调用此函数时,buf 所指的内存空间要足够大。若工作目录绝对路径的字符串长度超过参数size 大小,则返回NULL,errno 的值则为ERANGE。
  2. 倘若参数buf 为NULL,getcwd()会依参数size 的大小自动配置内存(使用malloc()),如果参数size 也为0,则getcwd()会依工作目录绝对路径的字符串程度来决定所配置的内存大小,进程可以在使用完次字符串后利用free()来释放此空间。

返回值:执行成功则将结果复制到参数buf 所指的内存空间,或是返回自动配置的字符串指针。失败返回NULL,错误代码存于errno。

snprintf()函数

snprintf()函数用于将格式化的数据写入字符串,其原型为:

  int snprintf(char *str, int n, char * format [, argument, ...]);

参数:str为要写入的字符串;n为要写入的字符的最大数目,超过n会被截断;format为格式化字符串,与printf()函数相同;argument为变量。

返回值:成功则返回参数str 字符串长度,失败则返回-1,错误原因存于errno 中。

snprintf()可以认为是sprintf()的升级版,比sprintf()多了一个参数,能够控制要写入的字符串的长度,更加安全,只要稍加留意,不会造成缓冲区的溢出。

chdir()函数

头文件:#include <unistd.h>

定义函数:

int chdir(const char * path);

函数说明:chdir()用来将当前的工作目录改变成以参数path 所指的目录。

返回值执:行成功则返回0,失败返回-1,errno 为错误代码。

范例

#include <unistd.h>
main()
{
  chdir("/tmp");
  printf("current working directory: %s\n", getcwd(NULL, NULL));
}

sterror函数

头文件:#include <string.h>

定义函数:

char * strerror(int errnum);

函数说明:strerror()用来依参数errnum 的错误代码来查询其错误原因的描述字符串,然后将该字符串指针返回。

返回值:返回描述错误原因的字符串指针。

范例:

/* 显示错误代码0 至9 的错误原因描述 */
\#include <string.h>
main()
{
  int i;
  for(i = 0; i < 10; i++)
  printf("%d : %s\n", i, strerror(i));
}

执行:

0 : Success
1 : Operation not permitted
2 : No such file or directory
3 : No such process
4 : Interrupted system call
5 : Input/output error
6 : Device not configured
7 : Argument list too long
8 : Exec format error
9 : Bad file descriptor

在 C 语言中,对于存放错误码的全局变量 errno,相信大家都不陌生。为防止和正常的返回值混淆,系统调用一般并不直接返回错误码,而是将错误码(是一个整数值,不同的值代表不同的含义)存入一个名为 errno 的全局变量中,errno 不同数值所代表的错误消息定义在 <errno.h> 文件中。如果一个系统调用或库函数调用失败,可以通过读出 errno 的值来确定问题所在,推测程序出错的原因,这也是调试程序的一个重要方法。

remove()函数

头文件:#include <stdio.h>

remove()函数用于删除指定的文件,其原型如下:

  int remove(char * filename);

参数:filename为要删除的文件名,可以为一目录。如果参数filename 为一文件,则调用unlink()处理;若参数filename 为一目录,则调用rmdir()来处理。

返回值:成功则返回0,失败则返回-1,错误原因存于errno。

popen()函数

头文件:#include <stdio.h>

定义函数:

FILE * popen(const char * command, const char * type);

函数说明:建立管道I/O,popen()会调用fork()产生子进程,然后从子进程中调用/bin/sh -c 来执行参数command 的指令。

参数type 可使用 "r"代表读取,"w"代表写入。依照此type 值,popen()会建立管道连到子进程的标准输出设备或标准输入设备,然后返回一个文件指针。随后进程便可利用此文件指针来读取子进程的输出设备或是写入到子进程的标准输入设备中。

此外,所有使用文件指针(FILE*)操作的函数也都可以使用,除了fclose()以外。

返回值:若成功则返回文件指针,否则返回NULL,错误原因存于errno 中。

范例

\#include <stdio.h>
main()
{
  FILE * fp;
  char buffer[80];
  fp = popen("cat /etc/passwd", "r");
  fgets(buffer, sizeof(buffer), fp);
  printf("%s", buffer);
  pclose(fp);
}

执行:
root :x:0 0: root: /root: /bin/bash

fgets()函数

头文件:# include <stdio.h>

函数原型:

char *fgets(char *s, int size, FILE *stream);

fgets() 虽然比 gets() 安全,但安全是要付出代价的,代价就是它的使用比 gets() 要麻烦一点,有三个参数。它的功能是从 stream 流中读取 size 个字符存储到字符指针变量 s 所指向的内存空间。它的返回值是一个指针,指向字符串中第一个字符的地址。

其中:s 代表要保存到的内存空间的首地址,可以是字符数组名,也可以是指向字符数组的字符指针变量名。size 代表的是读取字符串的长度。stream 表示从何种流中读取,可以是标准输入流 stdin,也可以是文件流,即从某个文件中读取,这个在后面讲文件的时候再详细介绍。标准输入流就是前面讲的输入缓冲区。所以如果是从键盘读取数据的话就是从输入缓冲区中读取数据,即从标准输入流 stdin 中读取数据,所以第三个参数为 stdin。

fgetc()函数

头文件:include<stdio.h>

fgetc()函数用于从文件流中读取一个字符,其原型为:

  int fgetc(FILE * stream);

参数:stream为文件指针。

返回值:成功返回读取到的字符,读到文件结尾时返回EOF。

说明:fget() 返回的字符实际上是文件流( FILE 结构体)中位置指针所指向的字符。fgetc()读取错误时,返回EOF并设置文件错误标志位;ferror() 函数可检测此错误。

fgetc(stdin)等价于fgetchar()

write()函数

头文件:#include <unistd.h>

定义函数:ssize_t write (int fd, const void * buf, size_t count);

函数说明:write()会把参数buf 所指的内存写入count 个字节到参数fd 所指的文件内。当然,文件读写位置也会随之移动。

返回值:如果顺利write()会返回实际写入的字节数。当有错误发生时则返回-1,,错误代码存入errno 中。

inet_addr()函数

头文件:#include <sys/socket.h> #include <netinet/in.h> #include <arpa/inet.h>

定义函数:

unsigned long int inet_addr(const char *cp);

函数说明:inet_addr()用来将参数cp 所指的网络地址字符串转换成网络所使用的二进制数字. 网络地址字符串是以数字和点组成的字符串,,例如:"163. 13. 132. 68"。

返回值:成功则返回对应的网络二进制的数字, 失败返回-1。

strcat()函数

头文件:#include <string.h>

strcat() 函数用来连接字符串,其原型为:

char *strcat(char *dest, const char *src);

参数:dest 为目的字符串指针,src 为源字符串指针。

strcat() 会将参数 src 字符串复制到参数 dest 所指的字符串尾部;dest 最后的结束字符 NULL 会被覆盖掉,并在连接后的字符串的尾部再增加一个 NULL。

注意:dest 与 src 所指的内存空间不能重叠,且 dest 要有足够的空间来容纳要复制的字符串。

返回值:返回dest 字符串起始地址。

read()函数

头文件:#include <unistd.h>

定义函数:

ssize_t read(int fd, void * buf, size_t count);

函数说明:read()会把参数fd 所指的文件传送count 个字节到buf 指针所指的内存中. 若参数count 为0, 则read()不会有作用并返回0. 返回值为实际读取到的字节数, 如果返回0, 表示已到达文件尾或是无可读取的数据,此外文件读写位置会随读取到的字节移动.

附加说明:如果顺利 read()会返回实际读到的字节数,最好能将返回值与参数count 作比较,若返回的字节数比要求读取的字节数少,则有可能读到了文件尾。

当有错误发生时则返回-1,错误代码存入errno 中,而文件读写位置则无法预期。

fopen()函数

头文件:#include <stdio.h>

fopen()是一个常用的函数,用来以指定的方式打开文件,其原型为:

FILE * fopen(const char * path, const char * mode);

参数:path为包含了路径的文件名,mode为文件打开方式。

unlink()函数

头文件:#include <unistd.h>

定义函数:

int unlink(const char * pathname);

函数说明:unlink()会删除参数pathname 指定的文件。如果该文件名为最后连接点,但有其他进程打开了此文件,则在所有关于此文件的文件描述词皆关闭后才会删除。如果参数pathname 为一符号连接,则此连接会被删除。

返回值:成功则返回0,失败返回-1,错误原因存于errno。

hosten()函数

客户端中直接使用 IP 地址会有很大的弊端,一旦 IP 地址变化(IP 地址会经常变动),客户端软件就会出现错误。

而使用域名会方便很多,注册后的域名只要每年续费就永远属于自己的,更换 IP 地址时修改域名解析即可,不会影响软件的正常使用。

关于域名注册、域名解析、host 文件、DNS 服务器等本节并未详细讲解,请读者自行脑补。本节重点讲解如何使用域名。

通过域名获取IP地址

域名仅仅是 IP 地址的一个助记符,目的是方便记忆,通过域名并不能找到目标计算机,通信之前必须要将域名转换成 IP 地址。

gethostbyname() 函数可以完成这种转换,它的原型为:

struct hostent *gethostbyname(const char *hostname);

hostname 为主机名,也就是域名。使用该函数时,只要传递域名字符串,就会返回域名对应的 IP 地址。返回的地址信息会装入 hostent 结构体,该结构体的定义如下:

struct hostent{    
    char *h_name;  //official name    
    char **h_aliases;  //alias list    
    int  h_addrtype;  //host address type    
    int  h_length;  //address lenght    
    char **h_addr_list;  //addrescs list
};

从该结构体可以看出,不只返回 IP 地址,还会附带其他信息,各位读者只需关注最后一个成员 h_addr_list。下面是对各成员的说明:

  • h_name:官方域名(Official domain name)。官方域名代表某一主页,但实际上一些著名公司的域名并未用官方域名注册。
  • h_aliases:别名,可以通过多个域名访问同一主机。同一 IP 地址可以绑定多个域名,因此除了当前域名还可以指定其他域名。
  • h_addrtype:gethostbyname() 不仅支持 IPv4,还支持 IPv6,可以通过此成员获取IP地址的地址族(地址类型)信息,IPv4 对应 AF_INET,IPv6 对应 AF_INET6。
  • h_length:保存IP地址长度。IPv4 的长度为 4 个字节,IPv6 的长度为 16 个字节。
  • h_addr_list:这是最重要的成员。通过该成员以整数形式保存域名对应的 IP 地址。对于用户较多的服务器,可能会分配多个 IP 地址给同一域名,利用多个服务器进行均衡负载。

atoi()函数

头文件:#include <stdlib.h>

atoi() 函数用来将字符串转换成整数(int),其原型为:

int atoi (const char * str);

函数说明:atoi() 函数会扫描参数 str 字符串,跳过前面的空白字符(例如空格,tab缩进等,可以通过 isspace() 函数来检测),直到遇上数字或正负符号才开始做转换,而再遇到非数字或字符串结束时('\0')才结束转换,并将结果返回。

返回值:返回转换后的整型数;如果 str 不能转换成 int 或者 str 为空字符串,那么将返回 0。

strchr()函数

C语言 strchr() 函数用于查找给定字符串中某一个特定字符。

头文件:string.h

语法/原型:

char* strchr(const char* str, int c);

参数说明:

  • str:被查找的字符串。
  • c:要查找的字符。

strchr() 函数会依次检索字符串 str 中的每一个字符,直到遇见字符 c,或者到达字符串末尾(遇见\0)。

返回值:返回在字符串 str 中第一次出现字符 c 的位置,如果未找到该字符 c 则返回 NULL。

recv()函数

定义函数:

int recv(int s, void *buf, int len, unsigned int flags);

函数说明:recv()用来接收远端主机经指定的socket 传来的数据,并把数据存到由参数buf 指向的内存空间,参数len 为可接收数据的最大长度。

参数 flags 一般设0。其他数值定义如下:

  1. MSG_OOB 接收以out-of-band 送出的数据。
  2. MSG_PEEK 返回来的数据并不会在系统内删除, 如果再调用recv()会返回相同的数据内容。
  3. MSG_WAITALL 强迫接收到len 大小的数据后才能返回, 除非有错误或信号产生。
  4. MSG_NOSIGNAL 此操作不愿被SIGPIPE 信号中断返回值成功则返回接收到的字符数, 失败返回-1,错误原因存于errno 中。
posted @ 2020-06-18 19:47  DearLeslie  阅读(597)  评论(0编辑  收藏  举报