手写一个简化版Tomcat

摘要: 我们很多时候都想知道Web容器Tomcat是如何工作的？它是如何处理我们传入http请求的？又是如何响应的？

Tomcat作为Web服务器深受市场欢迎，有必要对其进行深入的研究。在工作中，我们经常会把写好的代码打包放在Tomcat里并启动，然后在浏览器里就能愉快的调用我们写的代码来实现相应的功能了，那么Tomcat是如何工作的？

一、Tomcat工作原理

我们启动Tomcat时双击的startup.bat文件的主要作用是找到catalina.bat，并且把参数传递给它，而catalina.bat中有这样一段话：

Bootstrap.class是整个Tomcat 的入口，我们在Tomcat源码里找到这个类，其中就有我们经常使用的main方法：

这个类有两个作用：1.初始化一个守护进程变量、加载类和相应参数。2.解析命令，并执行。

源码不过多赘述，我们在这里只需要把握整体架构，有兴趣的同学可以自己研究下源码。Tomcat的server.xml配置文件中可以对应构架图中位置，多层的表示可以配置多个：

即一个由 Server->Service->Engine->Host->Context 组成的结构，从里层向外层分别是：

Server：服务器Tomcat的顶级元素，它包含了所有东西。
Service：一组 Engine(引擎) 的集合，包括线程池 Executor 和连接器 Connector 的定义。
Engine(引擎)：一个 Engine代表一个完整的 Servlet 引擎，它接收来自Connector的请求，并决定传给哪个Host来处理。
Container(容器)：Host、Context、Engine和Wraper都继承自Container接口，它们都是容器。
Connector(连接器)：将Service和Container连接起来，注册到一个Service，把来自客户端的请求转发到Container。
Host：即虚拟主机，所谓的”一个虚拟主机”可简单理解为”一个网站”。
Context(上下文 )：即 Web 应用程序，一个 Context 即对于一个 Web 应用程序。Context容器直接管理Servlet的运行，Servlet会被其给包装成一个StandardWrapper类去运行。Wrapper负责管理一个Servlet的装载、初始化、执行以及资源回收，它是最底层容器。

比如现在有以下网址，根据“/”切割的链接就会定位到具体的处理逻辑上，且每个容器都有过滤功能。

二、梳理自己的Tomcat实现思路

本文实现效果比较简单，仅供新手参考，大神勿喷。当浏览器访问对应地址时：

实现以上效果整体思路如下：

1.ServerSocket占用8080端口，用while（true）循环等待用户发请求。

2.拿到浏览器的请求，解析并返回URL地址，用I/O输入流读取本地磁盘上相应文件。

3.读取文件，不存在构建响应报文头、HTML正文内容，存在则写到浏览器端。

三、实现自己的Tomcat

工程文件结构和pom.xml文件：

1.HttpServer核心处理类，用于接受用户请求，传递HTTP请求头信息，关闭容器：

 1 public class HttpServer {
 2   // 用于判断是否需要关闭容器
 3   private boolean shutdown = false;
 4   
 5   public void acceptWait() {
 6     ServerSocket serverSocket = null;
 7     try {
 8         //端口号，最大链接数，ip地址
 9       serverSocket = new ServerSocket(8080, 1, InetAddress.getByName("127.0.0.1"));
10     }
11     catch (IOException e) {
12         e.printStackTrace();
13         System.exit(1); 
14     }
15     // 等待用户发请求
16     while (!shutdown) {
17       try {
18         Socket socket = serverSocket.accept();
19         InputStream is = socket.getInputStream();
20         OutputStream  os = socket.getOutputStream();
21         // 接受请求参数
22         Request request = new Request(is);
23         request.parse();
24         // 创建用于返回浏览器的对象
25         Response response = new Response(os);
26         response.setRequest(request);
27         response.sendStaticResource();
28         //关闭一次请求的socket,因为http请求就是采用短连接的方式
29         socket.close();
30         //如果请求地址是/shutdown  则关闭容器
31         if(null != request){
32              shutdown = request.getUrL().equals("/shutdown");
33         }
34       }
35       catch (Exception e) {
36           e.printStackTrace();
37           continue;
38       }
39     }
40   }
41   public static void main(String[] args) {
42         HttpServer server = new HttpServer();
43         server.acceptWait();
44   }
45 }

2.创建Request类，获取HTTP的请求头所有信息并截取URL地址返回：

 1 public class Request {
 2   private InputStream is;
 3   private String url;
 4 
 5   public Request(InputStream input) {
 6     this.is = input;
 7   }
 8   public void parse() {
 9     //从socket中读取一个2048长度字符
10     StringBuffer request = new StringBuffer(Response.BUFFER_SIZE);
11     int i;
12     byte[] buffer = new byte[Response.BUFFER_SIZE];
13     try {
14       i = is.read(buffer);
15     }
16     catch (IOException e) {
17       e.printStackTrace();
18       i = -1;
19     }
20     for (int j=0; j<i; j++) {
21       request.append((char) buffer[j]);
22     }
23     //打印读取的socket中的内容
24     System.out.print(request.toString());
25     url = parseUrL(request.toString());
26   }
27 
28   private String parseUrL(String requestString) {
29     int index1, index2;
30     index1 = requestString.indexOf(' ');//看socket获取请求头是否有值
31     if (index1 != -1) {
32       index2 = requestString.indexOf(' ', index1 + 1);
33       if (index2 > index1)
34         return requestString.substring(index1 + 1, index2);
35     }
36     return null;
37   }
38 
39   public String getUrL() {
40     return url;
41   }
42 
43 }

3.创建Response类，响应请求读取文件并写回到浏览器

public class Response {
  public static final int BUFFER_SIZE = 2048;
  //浏览器访问D盘的文件
  private static final String WEB_ROOT ="D:";
  private Request request;
  private OutputStream output;

  public Response(OutputStream output) {
    this.output = output;
  }
  public void setRequest(Request request) {
    this.request = request;
  }

  public void sendStaticResource() throws IOException {
    byte[] bytes = new byte[BUFFER_SIZE];
    FileInputStream fis = null;
    try {
        //拼接本地目录和浏览器端口号后面的目录
      File file = new File(WEB_ROOT, request.getUrL());
      //如果文件存在，且不是个目录
      if (file.exists() && !file.isDirectory()) {
        fis = new FileInputStream(file);
        int ch = fis.read(bytes, 0, BUFFER_SIZE);
        while (ch!=-1) {
          output.write(bytes, 0, ch);
          ch = fis.read(bytes, 0, BUFFER_SIZE);
        }
      }else {
           //文件不存在，返回给浏览器响应提示,这里可以拼接HTML任何元素
          String retMessage = "<h1>"+file.getName()+" file or directory not exists</h1>";
          String returnMessage ="HTTP/1.1 404 File Not Found\r\n" +
                  "Content-Type: text/html\r\n" +
                  "Content-Length: "+retMessage.length()+"\r\n" +
                  "\r\n" +
                  retMessage;
        output.write(returnMessage.getBytes());
      }
    }
    catch (Exception e) {
      System.out.println(e.toString() );
    }
    finally {
      if (fis!=null)
        fis.close();
    }
  }
}

四、读者可以自己做的优化，扩展的点

1.在WEB_INF文件夹下读取web.xml解析，通过请求名找到对应的类名，通过类名创建对象，用反射来初始化配置信息，如welcome页面，Servlet、servlet-mapping，filter，listener，启动加载级别等。

2.抽象Servlet类来转码处理请求和响应的业务。发过来的请求会有很多，也就意味着我们应该会有很多的Servlet，例如：RegisterServlet、LoginServlet等等还有很多其他的访问。可以用到类似于工厂模式的方法处理，随时产生很多的Servlet，来满足不同的功能性的请求。

3.使用多线程技术。本文的代码是死循环，且只能有一个链接，而现实中的情况是往往会有很多很多的客户端发请求，可以把每个浏览器的通信封装到一个线程当中。

参考文档：https://my.oschina.net/liughDevelop/blog/1790893

posted on 2018-05-21 14:41 布衣小工阅读(4944) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

布衣小工