简单web服务器的实现(C++)【转载】

一、具体功能实现

  • GET方法请求解析
  • POST方法请求解析
  • 返回请求资源页面
  • 利用GET方法实现加减法
  • 利用POST方法实现加减法
  • HTTP请求行具体解析
  • 400、403、404错误码返回的处理

二、什么是web服务器

  • web服务器就是在物理服务器基础上的具有服务端功能的网络连接程序,简而言之就是处理客户端发来的各种请求然后根据服务器的逻辑处理返回一个结果给客户端。在web服务器和客户端之间的通信是基于HTTP协议进行的。而客户端可以是浏览器也可以是支持HTTP协议的APP。
  • 那么浏览器应该怎么连接上自己的web服务器呢,最简单的web服务器就是通过TCP三次握手建立连接后,服务器直接返回一个结果给浏览器。浏览器和服务器是通过TCP三路握手建立连接的。浏览器在通过URL(统一资源定位符,就是我们俗称的网络地址)去请求服务器的连接,并且通过URL中的路径请求服务器上的资源。举个栗子就是这样的:

最简单的web服务器:

  1. #include<stdio.h>
  2. #include<stdlib.h>
  3. #include<sys/socket.h>
  4. #include<sys/types.h>
  5. #include<sys/stat.h>
  6. #include<sys/sendfile.h>
  7. #include<fcntl.h>
  8. #include<netinet/in.h>
  9. #include<arpa/inet.h>
  10. #include<assert.h>
  11. #include<unistd.h>
  12. #include<string.h>
  13. const int port = 8888;
  14. int main(int argc,char *argv[])
  15. {
  16. if(argc<0)
  17. {
  18. printf("need two canshu\n");
  19. return 1;
  20. }
  21. int sock;
  22. int connfd;
  23. struct sockaddr_in sever_address;
  24. bzero(&sever_address,sizeof(sever_address));
  25. sever_address.sin_family = PF_INET;
  26. sever_address.sin_addr.s_addr = htons(INADDR_ANY);
  27. sever_address.sin_port = htons(8888);
  28. sock = socket(AF_INET,SOCK_STREAM,0);
  29. assert(sock>=0);
  30. int ret = bind(sock, (struct sockaddr*)&sever_address,sizeof(sever_address));
  31. assert(ret != -1);
  32. ret = listen(sock,1);
  33. assert(ret != -1);
  34. while(1)
  35. {
  36. struct sockaddr_in client;
  37. socklen_t client_addrlength = sizeof(client);
  38. connfd = accept(sock, (struct sockaddr*)&client, &client_addrlength);
  39. if(connfd<0)
  40. {
  41. printf("errno\n");
  42. }
  43. else{
  44. char request[1024];
  45. recv(connfd,request,1024,0);
  46. request[strlen(request)+1]='\0';
  47. printf("%s\n",request);
  48. printf("successeful!\n");
  49. char buf[520]="HTTP/1.1 200 ok\r\nconnection: close\r\n\r\n";//HTTP响应
  50. int s = send(connfd,buf,strlen(buf),0);//发送响应
  51. //printf("send=%d\n",s);
  52. int fd = open("hello.html",O_RDONLY);//消息体
  53. sendfile(connfd,fd,NULL,2500);//零拷贝发送消息体
  54. close(fd);
  55. close(connfd);
  56. }
  57. }
  58. return 0;
  59. }

最简单的html文件:

  1. <html>
  2. <body bgcolor="blue">
  3. this is the html.
  4. <hr>
  5. <p>hello word! waste young! </p><br>
  6. </body>
  7. </html>

 

运行web.c文件,生成执行文件a.out,在终端执行后,我们在浏览器的网址栏中输入:http://localhost:8888 然后确认后,就会返回hello.html的文件页面

这里的URL,localhost:实际就是hostname,然后8888是端口,如果在端口后面再加上比如/hello.html这样的路径就表示请求服务器上的一个hello.html,这里请求方法是GET,所以要求服务器返回该资源的页面。

那么此时再来看下服务器接收到的东西,就是HTTP请求。

第一行就是请求行,请求行的格式是这样的:请求方法+空格+URL+空格+协议版本+\r+\n 这里的请求方法是GET ,URL是/(在这里,URL就相当于资源的路径,若在网址栏输入的是http://localhost:8888/hello.html的话,这里浏览器发送过来的URL就是/hello.html),协议版本是HTTP/1.1(现在多数协议版本都是这个)。

第二行到最后一行都是请求头部,请求头部的格式是这样的: 头部字段:+空格+数值+\r+\n 然后多个头部子段组织起来就是请求头部,在最后的头部字段的格式中需要有两个换行符号,最后一行的格式是:头部字段:+空格+数值+\r+\n+\r+\n 因为在后面还要跟着请求数据,为了区分请求数据和请求头的结束,就多了一个换行符。

三、HTTP请求和响应

(1)HTTP请求

简而言之就是客户端发送给服务端的请求。请求格式上面略提到了一点点,大概的格式就如下所示:

其中的细节就很多了,但是主要的是请求方法。其中头部字段有很多,大家可以上网百度。主要实现的就是GET方法和POST方法,其中GET方法是请求资源,但是不改变服务器上资源的,POST方法的话就会请求更改服务器上的资源。除了这两个方法外,还有PUT,DELETE,HEAD,TRACE等等。对应增删查改的就是PUT、DELETE、POST、GET。

然后URL就是要请求的资源路径,协议版本为HTTP/1.1,头部字段根据每个头部字段名都代表着给服务器的一个信息,具体可以根据以下网址查看:https://blog.csdn.net/sinat_22840937/article/details/64438253

(2)HTTP响应

HTTP响应就是服务端返回给客户端的响应消息。响应格式大概如下:

其中响应首行格式如:HTTP/1.1+状态响应码+\r\n 状态响应码参考如下:https://baike.baidu.com/item/HTTP状态码/5053660?fr=aladdin

这里大概用的是200,400,403,404,其中头部字段需要注意content-length,在服务器中响应码若没有消息题的长度,浏览器就只能通过关闭客户端才可以得知消息体的长度,才可以显示出消息体的具体表现。而且消息体的长度必须要和消息体吻合。如果服务端发送的消息体长度不正确的话,会导致超时或者浏览器一直显示不了要的资源文件。详细可以参考博客:https://www.cnblogs.com/lovelacelee/p/5385683.html

四、如何写出小型 web服务器

1、代码预备知识

  • 了解TCP三次握手和TCP四次挥手
  • 线程同步机制包装类
  • 线程池创建
  • epoll多路复用

(1)TCP三次握手

  1. 服务器需要准备好接受外来连接,通过socket bind listen三个函数完成,然后我们称为被动打开。
  2. 客户则通过connect发起主动连接请求,这就导致客户TCP发送一个SYN(同步)分节去告诉服务器客户将在待建立的连接中发送的数据的初始序列号,通常SYN不携带数据,其所在IP数据只有一个IP首部,一个TCP首部以及可能有的TCP选项。
  3. 服务器确认客户的SYN后,同时自己也要发送一个SYN分节,它含有服务器将在同一个连接中发送的数据的初始化列序号,服务器在单个分节中发送SYN和对客户SYN的确认
  4. 客户必须去确认服务器的SYN

 

(2)TCP四次挥手

  1. 某一个应用进程首先调用close,称为该端执行主动关闭,该端的TCP会发送一个FIN分节,表示数据已经发送完毕
  2. 接到FIN的对端将执行被动关闭,这个FIN由TCP确认,它的接受也作为一个文件结束符传递给接收端应用进程(放在已排队等候该应用进程接收的任何其他数据之后),因为FIN的接收意味着接收端应用进程在相应连接上已无额外数据可以接收
  3. 一段时间后,接收到这个文件结束符的应用进程会调用close关闭它的套接字,这会导致它的TCP也要发送一个FIN
  4. 接收这个最终FIN的原发送端TCP(即执行主动关闭的那一端)确认这个FIN

参考网站:https://www.cnblogs.com/Andya/p/7272462.html

 (3)线程池的创建

我用的是半同步/半反应堆线程池。该线程池通用性比较高,主线程一般往工作队列中加入任务,然后工作线程等待后并通过竞争关系从工作队列中取出任务并且执行。而且应用到服务器程序中的话要保证客户请求都是无状态的,因为同一个连接上的不同请求可能会由不同的线程处理。

ps:若工作队列为空,则线程就处于等待状态,就需要同步机制的处理。 

代码:

  1. #ifndef _THREADPOOL_H
  2. #define _THREADPOOL_H
  3. #include<iostream>
  4. #include<list>
  5. #include<cstdio>
  6. #include<semaphore.h>
  7. #include<exception>
  8. #include<pthread.h>
  9. #include"myhttp_coon.h"
  10. #include"mylock.h"
  11. using namespace std;
  12. template<typename T>
  13. /*线程池的封装*/
  14. class threadpool
  15. {
  16. private:
  17. int max_thread;//线程池中的最大线程总数
  18. int max_job;//工作队列的最大总数
  19. pthread_t *pthread_poll;//线程池数组
  20. std::list<T*> m_myworkqueue;//请求队列
  21. mylocker m_queuelocker;//保护请求队列的互斥锁
  22. sem m_queuestat;//由信号量来判断是否有任务需要处理
  23. bool m_stop;;//是否结束线程
  24. public:
  25. threadpool();
  26. ~threadpool();
  27. bool addjob(T* request);
  28. private:
  29. static void* worker(void *arg);
  30. void run();
  31. };
  32. /*线程池的创建*/
  33. template <typename T>
  34. threadpool<T> :: threadpool()
  35. {
  36. max_thread = 8;
  37. max_job = 1000;
  38. m_stop = false;
  39. pthread_poll = new pthread_t[max_thread];//为线程池开辟空间
  40. if(!pthread_poll)
  41. {
  42. throw std::exception();
  43. }
  44. for(int i=0; i<max_thread; i++)
  45. {
  46. cout << "Create the pthread:" << i << endl;
  47. if(pthread_create(pthread_poll+i, NULL, worker, this)!=0)
  48. {
  49. delete [] pthread_poll;
  50. throw std::exception();
  51. }
  52. if(pthread_detach(pthread_poll[i]))//将线程分离
  53. {
  54. delete [] pthread_poll;
  55. throw std::exception();
  56. }
  57. }
  58. }
  59. template <typename T>
  60. threadpool<T>::~threadpool()
  61. {
  62. delete[] pthread_poll;
  63. m_stop = true;
  64. }
  65. template <typename T>
  66. bool threadpool<T>::addjob(T* request)
  67. {
  68. m_queuelocker.lock();
  69. if(m_myworkqueue.size()> max_job)//如果请求队列大于了最大请求队列,则出错
  70. {
  71. m_queuelocker.unlock();
  72. return false;
  73. }
  74. m_myworkqueue.push_back(request);//将请求加入到请求队列中
  75. m_queuelocker.unlock();
  76. m_queuestat.post();//将信号量增加1
  77. return true;
  78. }
  79. template <typename T>
  80. void* threadpool<T>::worker(void *arg)
  81. {
  82. threadpool *pool = (threadpool*)arg;
  83. pool->run();
  84. return pool;
  85. }
  86. template <typename T>
  87. void threadpool<T> :: run()
  88. {
  89. while(!m_stop)
  90. {
  91. m_queuestat.wait();//信号量减1,直到为0的时候线程挂起等待
  92. m_queuelocker.lock();
  93. if(m_myworkqueue.empty())
  94. {
  95. m_queuelocker.unlock();
  96. continue;
  97. }
  98. T* request = m_myworkqueue.front();
  99. m_myworkqueue.pop_front();
  100. m_queuelocker.unlock();
  101. if(!request)
  102. {
  103. continue;
  104. }
  105. request->doit();//执行工作队列
  106. }
  107. }
  108. #endif

 

(4)同步机制的包装类

因为采用了线程池,就相当于用了多线程编程,此时就需要考虑各个线程对公共资源的访问的限制,因为方便之后的代码采用了三种包装机制,分别是信号量的类,互斥锁的类和条件变量的类。在服务器中我使用的是信号量的类。其中信号量的原理和System V IPC信号量一样(不抄书了,直接拍照了。。。)

代码实现:

  1. #ifndef _MYLOCK_H
  2. #define _MYLOCK_H
  3. #include<iostream>
  4. #include<list>
  5. #include<cstdio>
  6. #include<semaphore.h>
  7. #include<exception>
  8. #include<pthread.h>
  9. #include"myhttp_coon.h"
  10. using namespace std;
  11. /*封装信号量*/
  12. class sem{
  13. private:
  14. sem_t m_sem;
  15. public:
  16. sem();
  17. ~sem();
  18. bool wait();//等待信号量
  19. bool post();//增加信号量
  20. };
  21. //创建信号量
  22. sem :: sem()
  23. {
  24. if(sem_init(&m_sem,0,0) != 0)
  25. {
  26. throw std ::exception();
  27. }
  28. }
  29. //销毁信号量
  30. sem :: ~sem()
  31. {
  32. sem_destroy(&m_sem);
  33. }
  34. //等待信号量
  35. bool sem::wait()
  36. {
  37. return sem_wait(&m_sem) == 0;
  38. }
  39. //增加信号量
  40. bool sem::post()
  41. {
  42. return sem_post(&m_sem) == 0;
  43. }
  44. /*封装互斥锁*/
  45. class mylocker{
  46. private:
  47. pthread_mutex_t m_mutex;
  48. public:
  49. mylocker();
  50. ~mylocker();
  51. bool lock();
  52. bool unlock();
  53. };
  54. mylocker::mylocker()
  55. {
  56. if(pthread_mutex_init(&m_mutex, NULL) != 0)
  57. {
  58. throw std::exception();
  59. }
  60. }
  61. mylocker::~mylocker()
  62. {
  63. pthread_mutex_destroy(&m_mutex);
  64. }
  65. /*上锁*/
  66. bool mylocker::lock()
  67. {
  68. return pthread_mutex_lock(&m_mutex)==0;
  69. }
  70. /*解除锁*/
  71. bool mylocker::unlock()
  72. {
  73. return pthread_mutex_unlock(&m_mutex) == 0;
  74. }
  75. /*封装条件变量*/
  76. class mycond{
  77. private:
  78. pthread_mutex_t m_mutex;
  79. pthread_cond_t m_cond;
  80. public:
  81. mycond();
  82. ~mycond();
  83. bool wait();
  84. bool signal();
  85. };
  86. mycond::mycond()
  87. {
  88. if(pthread_mutex_init(&m_mutex,NULL)!=0)
  89. {
  90. throw std::exception();
  91. }
  92. if(pthread_cond_init(&m_cond, NULL)!=0)
  93. {
  94. throw std::exception();
  95. }
  96. }
  97. mycond::~mycond()
  98. {
  99. pthread_mutex_destroy(&m_mutex);
  100. pthread_cond_destroy(&m_cond);
  101. }
  102. /*等待条件变量*/
  103. bool mycond::wait()
  104. {
  105. int ret;
  106. pthread_mutex_lock(&m_mutex);
  107. ret = pthread_cond_wait(&m_cond,&m_mutex);
  108. pthread_mutex_unlock(&m_mutex);
  109. return ret == 0;
  110. }
  111. /*唤醒等待条件变量的线程*/
  112. bool mycond::signal()
  113. {
  114. return pthread_cond_signal(&m_cond) == 0;
  115. }
  116. #endif

(5)epoll多路复用 

 epoll系列系统调用函数(#include<sys/epoll.h>):

int epoll_create(int size);创建内核事件表

int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);操作epoll的内核事件表

int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout);一段时间内等待一组文件描述符上的就绪事件

除此这些函数外,还需要了解epoll的LT模式和ET模式还有EPOLLONESHOT事件.

下面三篇博客了解下:👇

https://blog.csdn.net/davidsguo008/article/details/73556811

https://blog.csdn.net/men_wen/article/details/53456491

https://blog.csdn.net/yusiguyuan/article/details/15027821

代码:

  1. #include<iostream>
  2. #include<unistd.h>
  3. #include<sys/socket.h>
  4. #include<netinet/in.h>
  5. #include<arpa/inet.h>
  6. #include<stdio.h>
  7. #include<errno.h>
  8. #include<string.h>
  9. #include<fcntl.h>
  10. #include<stdlib.h>
  11. #include<assert.h>
  12. #include<sys/epoll.h>
  13. #include"threadpool.h"
  14. //#include"myhttp_coon.h"
  15. using namespace std;
  16. const int port = 8888;
  17. int setnonblocking(int fd)
  18. {
  19. int old_option = fcntl(fd, F_GETFL);
  20. int new_option = old_option | O_NONBLOCK;
  21. fcntl(fd, F_SETFL, new_option);
  22. return old_option;
  23. }
  24. void addfd(int epfd, int fd, bool flag)
  25. {
  26. epoll_event ev;
  27. ev.data.fd = fd;
  28. ev.events = EPOLLIN | EPOLLET | EPOLLRDHUP;
  29. if(flag)
  30. {
  31. ev.events = ev.events | EPOLLONESHOT;
  32. }
  33. epoll_ctl(epfd, EPOLL_CTL_ADD, fd, &ev);
  34. setnonblocking(fd);
  35. }
  36. int main(int argc, char *argv[])
  37. {
  38. threadpool<http_coon>* pool = NULL;
  39. pool = new threadpool<http_coon>;
  40. http_coon* users = new http_coon[100];
  41. assert(users);
  42. struct sockaddr_in address;
  43. bzero(&address, sizeof(address));
  44. address.sin_family = AF_INET;
  45. address.sin_port = htons(port);
  46. address.sin_addr.s_addr = htons(INADDR_ANY);
  47. int listenfd = socket(AF_INET,SOCK_STREAM,0);
  48. assert(listenfd >= 0);
  49. int ret;
  50. ret = bind(listenfd, (struct sockaddr*)&address, sizeof(address));
  51. assert(ret != -1);
  52. ret = listen(listenfd,5);
  53. assert(ret >= 0);
  54. int epfd;
  55. epoll_event events[1000];
  56. epfd = epoll_create(5);
  57. assert(epfd != -1);
  58. addfd(epfd, listenfd, false);//listen不能注册EPOLLONESHOT事件,否则只能处理一个客户连接
  59. while(true)
  60. {
  61. int number = epoll_wait(epfd, events, 1000, -1);
  62. if( (number < 0) && (errno != EINTR) )
  63. {
  64. printf("my epoll is failure!\n");
  65. break;
  66. }
  67. for(int i=0; i<number; i++)
  68. {
  69. int sockfd = events[i].data.fd;
  70. if(sockfd == listenfd)//有新用户连接
  71. {
  72. struct sockaddr_in client_address;
  73. socklen_t client_addresslength = sizeof(client_address);
  74. int client_fd = accept(listenfd,(struct sockaddr*)&client_address, &client_addresslength);
  75. if(client_fd < 0)
  76. {
  77. printf("errno is %d\n",errno);
  78. continue;
  79. }
  80. /*如果连接用户超过了预定于的用户总数,则抛出异常*/
  81. /* if(http_coon::m_user_count > MAX_FD)
  82. {
  83. show_error(client_fd, "Internal sever busy");
  84. continue;
  85. }*/
  86. //初始化客户连接
  87. cout << epfd << " " << client_fd << endl;
  88. addfd(epfd, client_fd, true);
  89. cout << "client_fd:" << client_fd << "****\n";
  90. users[client_fd].init(epfd,client_fd);
  91. }
  92. else if(events[i].events & (EPOLLRDHUP | EPOLLHUP | EPOLLERR))
  93. {
  94. /*出现异常则关闭客户端连接*/
  95. users[sockfd].close_coon();
  96. }
  97. else if(events[i].events & EPOLLIN)//可以读取
  98. {
  99. if(users[sockfd].myread())
  100. {
  101. /*读取成功则添加任务队列*/
  102. pool->addjob(users+sockfd);
  103. }
  104. else{
  105. users[sockfd].close_coon();
  106. }
  107. }
  108. else if(events[i].events & EPOLLOUT)//可写入
  109. {
  110. if(!users[sockfd].mywrite())
  111. {
  112. users[sockfd].close_coon();
  113. }
  114. }
  115. }
  116. }
  117. close(epfd);
  118. close(listenfd);
  119. delete[] users;
  120. delete pool;
  121. return 0;
  122. }

 

2、主要逻辑思路

  1. 首先创建和客户端的连接
  2. 服务器通过客户端的HTTP请求解析来判断返回何种结果.HTTP解析是以行为单位的,前提条件是根据\r\n来判断是否完整度入一行,若完整读入一行了那么就可以进行解析了。
  3. 通过HTTP请求的解析后,在写缓冲区写如HTTP响应,发送给客户端(HTTP应答包括一个状态行,多个头部字段,一个空行和资源内容,其中前三个部分的内容一般会被web服务器放置在一块内存中,而文档的内容通常会被放到另一个单独的内存中)
  4. 发送响应首行后,就可以发送主要的消息体了

主要就是封装在myhttp_coon.h中:

  1. #ifndef _MYHTTP_COON_H
  2. #define _MYHTTP_COON_H
  3. #include<iostream>
  4. #include<stdio.h>
  5. #include<string.h>
  6. #include<sys/wait.h>
  7. #include<sys/socket.h>
  8. #include<errno.h>
  9. #include<stdlib.h>
  10. #include<unistd.h>
  11. #include<assert.h>
  12. #include<sys/sendfile.h>
  13. #include<sys/epoll.h>
  14. #include<sys/fcntl.h>
  15. #include<sys/stat.h>
  16. #include<sys/types.h>
  17. using namespace std;
  18. #define READ_BUF 2000
  19. class http_coon{
  20. public:
  21. /*NO_REQUESTION是代表请求不完整,需要客户继续输入;BAD_REQUESTION是HTTP请求语法不正确;GET_REQUESTION代表获得并且解析了一个正确的HTTP请求;FORBIDDEN_REQUESTION是代表访问资源的权限有问题;FILE_REQUESTION代表GET方法资源请求;INTERNAL_ERROR代表服务器自身问题;NOT_FOUND代表请求的资源文件不存在;DYNAMIC_FILE表示是一个动态请求;POST_FILE表示获得一个以POST方式请求的HTTP请求*/
  22. enum HTTP_CODE{NO_REQUESTION, GET_REQUESTION, BAD_REQUESTION, FORBIDDEN_REQUESTION,FILE_REQUESTION,INTERNAL_ERROR,NOT_FOUND,DYNAMIC_FILE,POST_FILE};
  23. /*HTTP请求解析的状态转移。HEAD表示解析头部信息,REQUESTION表示解析请求行*/
  24. enum CHECK_STATUS{HEAD,REQUESTION};
  25. private:
  26. char requst_head_buf[1000];//响应头的填充
  27. char post_buf[1000];//Post请求的读缓冲区
  28. char read_buf[READ_BUF];//客户端的http请求读取
  29. char filename[250];//文件总目录
  30. int file_size;//文件大小
  31. int check_index;//目前检测到的位置
  32. int read_buf_len;//读取缓冲区的大小
  33. char *method;//请求方法
  34. char *url;//文件名称
  35. char *version;//协议版本
  36. char *argv;//动态请求参数
  37. bool m_linger;//是否保持连接
  38. int m_http_count;//http长度
  39. char *m_host;//主机名记录
  40. char path_400[17];//出错码400打开的文件名缓冲区
  41. char path_403[23];//出错码403打开返回的文件名缓冲区
  42. char path_404[40];//出错码404对应文件名缓冲区
  43. char message[1000];//响应消息体缓冲区
  44. char body[2000];//post响应消息体缓冲区
  45. CHECK_STATUS status;//状态转移
  46. bool m_flag;//true表示是动态请求,反之是静态请求
  47. public:
  48. int epfd;
  49. int client_fd;
  50. int read_count;
  51. http_coon();
  52. ~http_coon();
  53. void init(int e_fd, int c_fd);//初始化
  54. int myread();//读取请求
  55. bool mywrite();//响应发送
  56. void doit();//线程接口函数
  57. void close_coon();//关闭客户端链接
  58. private:
  59. HTTP_CODE analyse();//解析Http请求头的函数
  60. int jude_line(int &check_index, int &read_buf_len);//该请求是否是完整的以行\r\n
  61. HTTP_CODE head_analyse(char *temp);//http请求头解析
  62. HTTP_CODE requestion_analyse(char *temp);//http请求行解析
  63. HTTP_CODE do_post();//对post请求中的参数进行解析
  64. HTTP_CODE do_file();//对GET请求方法中的url 协议版本的分离
  65. void modfd(int epfd, int sock, int ev);//改变socket为状态
  66. void dynamic(char *filename, char *argv);//通过get方法进入的动态请求处理
  67. void post_respond();//POST请求响应填充
  68. bool bad_respond();//语法错误请求响应填充
  69. bool forbiden_respond();//资源权限限制请求响应的填充
  70. bool succeessful_respond();//解析成功请求响应填充
  71. bool not_found_request();//资源不存在请求响应填充
  72. };
  73. void http_coon::init(int e_fd, int c_fd)
  74. {
  75. epfd = e_fd;
  76. client_fd = c_fd;
  77. read_count = 0;
  78. m_flag = false;
  79. }
  80. http_coon::http_coon()
  81. {
  82. }
  83. http_coon::~http_coon()
  84. {
  85. }
  86. /*关闭客户端链接*/
  87. void http_coon::close_coon()
  88. {
  89. epoll_ctl(epfd, EPOLL_CTL_DEL, client_fd, 0);
  90. close(client_fd);
  91. client_fd = -1;
  92. }
  93. /*改变事件表中的事件属性*/
  94. void http_coon::modfd(int epfd, int client_fd, int ev)
  95. {
  96. epoll_event event;
  97. event.data.fd = client_fd;
  98. event.events = ev | EPOLLET | EPOLLONESHOT | EPOLLRDHUP;
  99. epoll_ctl(epfd, EPOLL_CTL_MOD, client_fd, &event);
  100. }
  101. /*read函数的封装*/
  102. int http_coon::myread()
  103. {
  104. bzero(&read_buf,sizeof(read_buf));
  105. while(true)
  106. {
  107. int ret = recv(client_fd, read_buf+read_count, READ_BUF-read_count, 0 );
  108. if(ret == -1)
  109. {
  110. if(errno == EAGAIN || errno == EWOULDBLOCK)//读取结束
  111. {
  112. break;
  113. }
  114. return 0;
  115. }
  116. else if(ret == 0)
  117. {
  118. return 0;
  119. }
  120. read_count = read_count + ret;
  121. }
  122. strcpy(post_buf,read_buf);
  123. return 1;
  124. }
  125. /*响应状态的填充,这里返回可以不为bool类型*/
  126. bool http_coon::succeessful_respond()//200
  127. {
  128. m_flag = false;
  129. bzero(requst_head_buf,sizeof(requst_head_buf));
  130. sprintf(requst_head_buf,"HTTP/1.1 200 ok\r\nConnection: close\r\ncontent-length:%d\r\n\r\n",file_size);
  131. }
  132. bool http_coon::bad_respond()//400
  133. {
  134. bzero(url, strlen(url));
  135. strcpy(path_400,"bad_respond.html");
  136. url = path_400;
  137. bzero(filename,sizeof(filename));
  138. sprintf(filename,"/home/jialuhu/linux_net/web_sever/%s",url);
  139. struct stat my_file;
  140. if(stat(filename,&my_file)<0)
  141. {
  142. cout << "文件不存在\n";
  143. }
  144. file_size = my_file.st_size;
  145. bzero(requst_head_buf,sizeof(requst_head_buf));
  146. sprintf(requst_head_buf,"HTTP/1.1 400 BAD_REQUESTION\r\nConnection: close\r\ncontent-length:%d\r\n\r\n",file_size);
  147. }
  148. bool http_coon::forbiden_respond()//403
  149. {
  150. bzero(url, strlen(url));
  151. strcpy(path_403,"forbidden_request.html");
  152. url = path_403;
  153. bzero(filename,sizeof(filename));
  154. sprintf(filename,"/home/jialuhu/linux_net/web_sever/%s",url);
  155. struct stat my_file;
  156. if(stat(filename,&my_file)<0)
  157. {
  158. cout << "失败\n";
  159. }
  160. file_size = my_file.st_size;
  161. bzero(requst_head_buf,sizeof(requst_head_buf));
  162. sprintf(requst_head_buf,"HTTP/1.1 403 FORBIDDEN\r\nConnection: close\r\ncontent-length:%d\r\n\r\n",file_size);
  163. }
  164. bool http_coon::not_found_request()//404
  165. {
  166. bzero(url, strlen(url));
  167. strcpy(path_404,"not_found_request.html");
  168. url = path_404;
  169. bzero(filename,sizeof(filename));
  170. sprintf(filename,"/home/jialuhu/linux_net/web_sever/%s",url);
  171. struct stat my_file;
  172. if(stat(filename,&my_file)<0)
  173. {
  174. cout << "草拟\n";
  175. }
  176. file_size = my_file.st_size;
  177. bzero(requst_head_buf,sizeof(requst_head_buf));
  178. sprintf(requst_head_buf,"HTTP/1.1 404 NOT_FOUND\r\nConnection: close\r\ncontent-length:%d\r\n\r\n",file_size);
  179. }
  180. /*动态请求处理*/
  181. void http_coon::dynamic(char *filename, char *argv)
  182. {
  183. int len = strlen(argv);
  184. int k = 0;
  185. int number[2];
  186. int sum=0;
  187. m_flag = true;
  188. bzero(requst_head_buf,sizeof(requst_head_buf));
  189. sscanf(argv,"a=%d&b=%d",&number[0],&number[1]);
  190. if(strcmp(filename,"/add")==0)
  191. {
  192. sum = number[0] + number[1];
  193. sprintf(body,"<html><body>\r\n<p>%d + %d = %d </p><hr>\r\n</body></html>\r\n",number[0],number[1],sum);
  194. sprintf(requst_head_buf,"HTTP/1.1 200 ok\r\nConnection: close\r\ncontent-length: %d\r\n\r\n",strlen(body));
  195. }
  196. else if(strcmp(filename,"/multiplication")==0)
  197. {
  198. cout << "\t\t\t\tmultiplication\n\n";
  199. sum = number[0]*number[1];
  200. sprintf(body,"<html><body>\r\n<p>%d * %d = %d </p><hr>\r\n</body></html>\r\n",number[0],number[1],sum);
  201. sprintf(requst_head_buf,"HTTP/1.1 200 ok\r\nConnection: close\r\ncontent-length: %d\r\n\r\n",strlen(body));
  202. }
  203. }
  204. /*POST请求处理*/
  205. void http_coon::post_respond()
  206. {
  207. if(fork()==0)
  208. {
  209. dup2(client_fd,STDOUT_FILENO);
  210. execl(filename,argv,NULL);
  211. }
  212. wait(NULL);
  213. }
  214. /*判断一行是否读取完整*/
  215. int http_coon::jude_line(int &check_index, int &read_buf_len)
  216. {
  217. cout << read_buf << endl;
  218. char ch;
  219. for( ; check_index<read_buf_len; check_index++)
  220. {
  221. ch = read_buf[check_index];
  222. if(ch == '\r' && check_index+1<read_buf_len && read_buf[check_index+1]=='\n')
  223. {
  224. read_buf[check_index++] = '\0';
  225. read_buf[check_index++] = '\0';
  226. return 1;//完整读入一行
  227. }
  228. if(ch == '\r' && check_index+1==read_buf_len)
  229. {
  230. return 0;
  231. }
  232. if(ch == '\n')
  233. {
  234. if(check_index>1 && read_buf[check_index-1]=='\r')
  235. {
  236. read_buf[check_index-1] = '\0';
  237. read_buf[check_index++] = '\0';
  238. return 1;
  239. }
  240. else{
  241. return 0;
  242. }
  243. }
  244. }
  245. return 0;
  246. }
  247. /*解析请求行*/
  248. http_coon::HTTP_CODE http_coon::requestion_analyse(char *temp)
  249. {
  250. char *p = temp;
  251. cout << "p=" << p << endl;
  252. for(int i=0; i<2; i++)
  253. {
  254. if(i==0)
  255. {
  256. method = p;//请求方法保存
  257. int j = 0;
  258. while((*p != ' ') && (*p != '\r'))
  259. {
  260. p++;
  261. }
  262. p[0] = '\0';
  263. p++;
  264. cout << "method:" <<method << endl;
  265. // method++;
  266. }
  267. if(i==1)
  268. {
  269. url = p;//文件路径保存
  270. while((*p != ' ') && (*p != '\r'))
  271. {
  272. p++;
  273. }
  274. p[0] = '\0';
  275. p++;
  276. cout << "url:" << url << endl;
  277. }
  278. }
  279. version = p;//请求协议保存
  280. while(*p != '\r')
  281. {
  282. p++;
  283. }
  284. p[0] = '\0';
  285. p++;
  286. p[0] = '\0';
  287. p++;
  288. cout << version << endl;
  289. if(strcmp(method,"GET")!=0&&strcmp(method,"POST")!=0)
  290. {
  291. return BAD_REQUESTION;
  292. }
  293. if(!url || url[0]!='/')
  294. {
  295. return BAD_REQUESTION;
  296. }
  297. if(strcmp(version,"HTTP/1.1")!=0)
  298. {
  299. return BAD_REQUESTION;
  300. }
  301. status = HEAD;//状态转移到解析头部
  302. return NO_REQUESTION;//继续解析
  303. }
  304. /*解析头部信息*/
  305. http_coon::HTTP_CODE http_coon::head_analyse(char *temp)
  306. {
  307. if(temp[0]=='\0')
  308. {
  309. //获得一个完整http请求
  310. return GET_REQUESTION;
  311. }
  312. //处理其他头部
  313. else if(strncasecmp(temp,"Connection:", 11) == 0)
  314. {
  315. temp = temp+11;
  316. while(*temp==' ')
  317. {
  318. temp++;
  319. }
  320. if(strcasecmp(temp, "keep-alive") == 0)
  321. {
  322. m_linger = true;
  323. }
  324. }
  325. else if(strncasecmp(temp,"Content-Length:", 15)==0)
  326. {
  327. temp = temp+15;
  328. while(*temp==' ')
  329. {
  330. cout << *temp << endl;
  331. temp++;
  332. }
  333. m_http_count = atol(temp);//content-length需要填充
  334. }
  335. else if(strncasecmp(temp,"Host:",5)==0)
  336. {
  337. temp = temp+5;
  338. while(*temp==' ')
  339. {
  340. temp++;
  341. }
  342. m_host = temp;
  343. }
  344. else{
  345. cout << "can't handle it's hand\n";
  346. }
  347. return NO_REQUESTION;
  348. }
  349. http_coon::HTTP_CODE http_coon::do_file()//GET方法请求,对其请求行进行解析,存写资源路径
  350. {
  351. char path[40]="/home/jialuhu/linux_net/web_sever";
  352. char* ch;
  353. if(ch=strchr(url,'?'))
  354. {
  355. argv = ch+1;
  356. *ch = '\0';
  357. strcpy(filename,url);
  358. return DYNAMIC_FILE;
  359. }
  360. else{
  361. strcpy(filename,path);
  362. strcat(filename,url);
  363. struct stat m_file_stat;
  364. if(stat(filename, &m_file_stat) < 0)
  365. {
  366. //cout << "打不开\n";
  367. return NOT_FOUND;//NOT_FOUND 404
  368. }
  369. if( !(m_file_stat.st_mode & S_IROTH))//FORBIDDEN_REQUESTION 403
  370. {
  371. return FORBIDDEN_REQUESTION;
  372. }
  373. if(S_ISDIR(m_file_stat.st_mode))
  374. {
  375. return BAD_REQUESTION;//BAD_REQUESTION 400
  376. }
  377. file_size = m_file_stat.st_size;
  378. return FILE_REQUESTION;
  379. }
  380. }
  381. http_coon::HTTP_CODE http_coon::do_post()//POST方法请求,分解并且存入参数
  382. {
  383. int k = 0;
  384. int star;
  385. char path[34]="/home/jialuhu/linux_net/web_sever";
  386. strcpy(filename,path);
  387. strcat(filename,url);
  388. star = read_buf_len-m_http_count;
  389. argv = post_buf + star;
  390. argv[strlen(argv)+1]='\0';
  391. if(filename!=NULL && argv!=NULL)
  392. {
  393. return POST_FILE;
  394. }
  395. return BAD_REQUESTION;
  396. }
  397. /*http请求解析*/
  398. http_coon::HTTP_CODE http_coon::analyse()
  399. {
  400. status = REQUESTION;
  401. int flag;
  402. char *temp = read_buf;
  403. int star_line = 0;
  404. check_index = 0;
  405. int star = 0;
  406. read_buf_len = strlen(read_buf);
  407. int len = read_buf_len;
  408. while((flag=jude_line(check_index, len))==1)
  409. {
  410. temp = read_buf + star_line;
  411. star_line = check_index;
  412. switch(status)
  413. {
  414. case REQUESTION://请求行分析,包括文件名称和请求方法
  415. {
  416. cout << "requestion\n";
  417. int ret;
  418. ret = requestion_analyse(temp);
  419. if(ret==BAD_REQUESTION)
  420. {
  421. cout << "ret == BAD_REQUESTION\n";
  422. //请求格式不正确
  423. return BAD_REQUESTION;
  424. }
  425. break;
  426. }
  427. case HEAD://请求头的分析
  428. {
  429. int ret;
  430. ret = head_analyse(temp);
  431. if(ret==GET_REQUESTION)//获取完整的HTTP请求
  432. {
  433. if(strcmp(method,"GET")==0)
  434. {
  435. return do_file();//GET请求文件名分离函数
  436. }
  437. else if(strcmp(method,"POST")==0)
  438. {
  439. return do_post();//POST请求参数分离函数
  440. }
  441. else{
  442. return BAD_REQUESTION;
  443. }
  444. }
  445. break;
  446. }
  447. default:
  448. {
  449. return INTERNAL_ERROR;
  450. }
  451. }
  452. }
  453. return NO_REQUESTION;//请求不完整,需要继续读入
  454. }
  455. /*线程取出工作任务的接口函数*/
  456. void http_coon::doit()
  457. {
  458. int choice = analyse();//根据解析请求头的结果做选择
  459. switch(choice)
  460. {
  461. case NO_REQUESTION://请求不完整
  462. {
  463. cout << "NO_REQUESTION\n";
  464. /*改变epoll的属性*/
  465. modfd(epfd, client_fd, EPOLLIN);
  466. return;
  467. }
  468. case BAD_REQUESTION: //400
  469. {
  470. cout << "BAD_REQUESTION\n";
  471. bad_respond();
  472. modfd(epfd, client_fd, EPOLLOUT);
  473. break;
  474. }
  475. case FORBIDDEN_REQUESTION://403
  476. {
  477. cout << "forbiden_respond\n";
  478. forbiden_respond();
  479. modfd(epfd, client_fd, EPOLLOUT);
  480. break;
  481. }
  482. case NOT_FOUND://404
  483. {
  484. cout<<"not_found_request"<< endl;
  485. not_found_request();
  486. modfd(epfd, client_fd, EPOLLOUT);
  487. break;
  488. }
  489. case FILE_REQUESTION://GET文件资源无问题
  490. {
  491. cout << "文件file request\n";
  492. succeessful_respond();
  493. modfd(epfd, client_fd, EPOLLOUT);
  494. break;
  495. }
  496. case DYNAMIC_FILE://动态请求处理
  497. {
  498. cout << "动态请求处理\n";
  499. cout << filename << " " << argv << endl;
  500. dynamic(filename, argv);
  501. modfd(epfd, client_fd, EPOLLOUT);
  502. break;
  503. }
  504. case POST_FILE://POST 方法处理
  505. {
  506. cout << "post_respond\n";
  507. post_respond();
  508. break;
  509. }
  510. default:
  511. {
  512. close_coon();
  513. }
  514. }
  515. }
  516. bool http_coon::mywrite()
  517. {
  518. if(m_flag)//如果是动态请求,返回填充体
  519. {
  520. int ret=send(client_fd,requst_head_buf,strlen(requst_head_buf),0);
  521. int r = send(client_fd,body,strlen(body),0);
  522. if(ret>0 && r>0)
  523. {
  524. return true;
  525. }
  526. }
  527. else{
  528. int fd = open(filename,O_RDONLY);
  529. assert(fd != -1);
  530. int ret;
  531. ret = write(client_fd,requst_head_buf,strlen(requst_head_buf));
  532. if(ret < 0)
  533. {
  534. close(fd);
  535. return false;
  536. }
  537. ret = sendfile(client_fd, fd, NULL, file_size);
  538. if(ret < 0)
  539. {
  540. close(fd);
  541. return false;
  542. }
  543. close(fd);
  544. return true;
  545. }
  546. return false;
  547. }
  548. #endif

其中两个附加功能加法和减法的实现(通过GET方法请求),以及POST方法请求的加法和减法的实现

  • 动态请求是什么样子(GET)

sum.html文件:

  1. <html>
  2. <head>
  3. <meta charset="utf-8">
  4. <title>sum</title>
  5. </head>
  6. <body>
  7. <form action="add">
  8. a: <input type="text" name="a"><br>
  9. b: <input type="text" name="b"><br>
  10. <input type="submit" value="提交">
  11. </form>
  12. <p>点击"提交"按钮,表单数据将被发送到服务器上的“add”程序上。</p>
  13. </body>
  14. </html>

服务器收到的请求是这样的,首先是打开sum.html文件

然后在表单上提交要相加的两个数字

点击提交后,此时服务器收到的请求是这样的:

看到了/add?a=33&b=33 这就是通过方法GET提交上来的参数a和b ,此时我们在解析请求行的时候就可以通过问好来判断是否是GET的动态请求,若是那么根据sscanf()函数,分离出参数a和b,进行相加后就可以填充HTTP响应发送给浏览器了。此处我根据提交的程序名称来选择函数,在函数中相加填充返回给浏览器。当然我觉得正确的做法是重新写一个add.c然后执行生产add文件,再在fork()一个子线程通过execl( )函数去执行。

  • 那么POST请求又是什么样子呢,其实POST请求将参数放在了请求

修改后的sum.html文件

  1. <html>
  2. <head>
  3. <meta charset="utf-8">
  4. <title>sum</title>
  5. </head>
  6. <body>
  7. <form action="add" method="post">
  8. a: <input type="text" name="a"><br>
  9. b: <input type="text" name="b"><br>
  10. <input type="submit" value="提交">
  11. </form>
  12. <p>点击"提交"按钮,表单数据将被发送到服务器上的“add”程序上。</p>
  13. </body>
  14. </html>

加入了属性method="post",此时打开sum.html文件依然是GET方法,只是点击提交表单后用的是POST方法。

和GET不同的是,参数被在请求的数据部分,也就是空行之后,此时若方法是POST的话,根据read_buf_len和Content_Length就可以求出参数在read_buf中的起始位置。然后又可以通过sscanf( )分离参数了,然后fork()一个进程,利用dup2函数,将标准输出重定向到浏览器的sockfd上,再执行execl( )函数。此时我们的add执行文件的.c文件如下:

  1. #include<stdio.h>
  2. #include<string.h>
  3. int main(int argc, char *argv[])
  4. {
  5. char re_head[1000];
  6. char message[1000];
  7. int ret;
  8. int a,b,result;
  9. ret = sscanf(argv[0],"a=%d&b=%d", &a, &b);
  10. //printf("a=%d\t b=%d\n",a,b);
  11. if(ret < 0 || ret != 2)
  12. {
  13. sprintf(message,"<html><body>\r\n");
  14. sprintf(message,"%s<p>failure</p>\r\n",message);
  15. sprintf(message,"%s</body></html>");
  16. sprintf(re_head,"HTTP/1.1 GET\r\n");
  17. sprintf(re_head,"%scontent-length: %d\r\n",re_head,strlen(message));
  18. sprintf(re_head,"%scontent-type: text/html\r\n",re_head);
  19. sprintf(re_head,"%sconection: close\r\n\r\n");
  20. /*错误提示消息*/
  21. }
  22. else{
  23. result = a+b;
  24. /*返回正确信息*/
  25. sprintf(message,"<html><body>\r\n");
  26. sprintf(message,"%s<p>%d + %d = %d</p><br>\r\n",message,a,b,result);
  27. sprintf(message,"%s<p>welcome to the word of jialuhu</p><br>\r\n",message);
  28. sprintf(message,"%s</body></html>\r\n",message);
  29. sprintf(re_head,"HTTP/1.1 200 ok\r\n");
  30. sprintf(re_head,"%sContent-length: %d\r\n",re_head,(int)strlen(message));
  31. sprintf(re_head,"%scontent-type: text/html\r\n\r\n",re_head);
  32. // sprintf(re_head,"%sconection: close\r\n\r\n");
  33. }
  34. printf("%s",re_head);
  35. printf("%s",message);
  36. fflush(stdout);
  37. return 0;
  38. }

当然除了加减法,还有很多功能可以去实现。此处就简单实现了这些功能。还有一些HTML文件,因为懒癌原因,所以随便写了几个。

五、总结

纵观博客其实感觉涉及的知识有点杂乱,但是很综合吧。首先满足代码上高性能的需求,利用了线城池和epoll多路复用,其中也包括同步机制的封装。其次就是HTTP这块的知识了,包括请求格式响应格式和请求方法和响应状态码,很多很多都是零零碎碎平凑一起的。而且感觉这个服务器的实现,也终于明白了浏览器和后台是怎么沟通交流的,有时候看不如动手实现下,很多东西就会突然明白了。大体模块就是epoll、线城池、同步机制、逻辑处理。代码里肯定也有很多没有测试出来的bug,但是实现大概三分之二后还是有丢丢开心的吧。

完整的代码在github上:https://github.com/jialuhu/2018/tree/master/minyweb_sever

 

 

 

 

 

posted @ 2019-07-31 17:42  xjyxp01  阅读(2007)  评论(0编辑  收藏  举报