Loading

Golang net/http 标准库原理解读与源码分析

本位为http的源码分析,如果在此之前你还不知道如何使用 golang 的 http 库,建议先看一个入门的例子:快速入门:创建第一个 Go Web 应用 | 快速入门 | Go Web 编程 (laravelacademy.org)

本文转载自:Go Web 编程入门--深入学习用 Go 编写 HTTP 服务器 | Go 技术论坛 (learnku.com)

前言

Go 是一门通用的编程语言,想要学习 Go 语言的 Web 开发,就必须知道如何用 Go 启动一个 HTTP 服务器用于接收和响应来自客户端的 HTTP 请求。用 Go 实现一个 http server 非常容易,Go 语言标准库 net/http 自带了一系列结构和方法来帮助开发者简化 HTTP 服务开发的相关流程。因此,我们不需要依赖任何第三方组件就能构建并启动一个高并发的 HTTP 服务器。这篇文章会学习如何用 net/http 自己编写实现一个 HTTP Server 并探究其实现原理,以此来学习了解网络编程的常见范式以及设计思路。

HTTP 服务处理流程

基于 HTTP 构建的服务标准模型包括两个端,客户端 (Client) 和服务端 (Server)。HTTP 请求从客户端发出,服务端接受到请求后进行处理然后将响应返回给客户端。所以 http 服务器的工作就在于如何接受来自客户端的请求,并向客户端返回响应。

典型的 HTTP 服务的处理流程如下图所示:

 

服务器在接收到请求时,首先会进入路由 (router),也成为服务复用器(Multiplexe),路由的工作在于请求找到对应的处理器 (handler),处理器对接收到的请求进行相应处理后构建响应并返回给客户端。Go 实现的 http server 同样遵循这样的处理流程。

我们先看看 Go 如何实现一个简单的返回 "Hello World" 的 http server

package main

import (
   "fmt"
   "net/http"
)

func HelloHandler(w http.ResponseWriter, r *http.Request) {
   fmt.Fprintf(w, "Hello World")
}

func main () {
   http.HandleFunc("/", HelloHandler)
   http.ListenAndServe(":8000", nil)
}

运行代码之后,在浏览器中打开 localhost:8000 就可以看到 Hello World。这段代码先利用 http.HandleFunc 在根路由 / 上注册了一个 HelloHandler, 然后利用 http.ListenAndServe 启动服务器并监听本地的 8000 端口。当有请求过来时,则根据路由执行对应的 handler 函数。

注意:http.ListenAndServe(":8000", nil的第一个参数本来应该是 ip: 端口号 的形式,但是这里省略了ip,那么默认为 0.0.0.0。因为根据源码一路可以追踪到:

我们再看一下另外一种常见的实现方式:

package main

import (
   "fmt"
   "net/http"
)

type HelloHandlerStruct struct {
   content string
}

func (handler *HelloHandlerStruct) ServeHTTP(w http.ResponseWriter, r *http.Request) {
   fmt.Fprintf(w, handler.content)
}

func main()  {
   http.Handle("/", &HelloHandlerStruct{content: "Hello World"})
   http.ListenAndServe(":8000", nil)
}

这段代码不再使用 http.HandleFunc 函数,取而代之的是直接调用 http.Handle 并传入我们自定义的 http.Handler 接口的实例。

Go 实现的 http 服务步骤非常简单,首先注册路由,然后创建服务并开启监听即可。下文我们将从注册路由、开启服务、处理请求,以及关闭服务这几个步骤了解 Go 如何实现 http 服务。

路由注册

http.HandleFunc 和 http.Handle 都是用于给路由规则指定处理器,http.HandleFunc 的第一个参数为路由的匹配规则 (pattern) 第二个参数是一个签名为 func(w http.ResponseWriter, r *http.Requests) 的函数。而 http.Handle 的第二个参数为实现了 http.Handler 接口的类型的实例。

http.HandleFunc 和 http.Handle 的源码如下:

func HandleFunc(pattern string, handler func(ResponseWriter, *Request)) {
    DefaultServeMux.HandleFunc(pattern, handler)
}

// HandleFunc registers the handler function for the given pattern.
func (mux *ServeMux) HandleFunc(pattern string, handler func(ResponseWriter, *Request)) {
    if handler == nil {
        panic("http: nil handler")
    }
    mux.Handle(pattern, HandlerFunc(handler))
}

func Handle(pattern string, handler Handler) { 
    DefaultServeMux.Handle(pattern, handler)
}

可以看到这两个函数最终都由 DefaultServeMux 调用 Handle 方法来完成路由处理器的注册。
这里我们遇到两种类型的对象:ServeMux 和 Handler

Handler

http.Handler 是 net/http 中定义的接口用来表示 HTTP 请求:

type Handler interface {
    ServeHTTP(ResponseWriter, *Request)
}

Handler 接口中声明了名为 ServeHTTP 的函数签名,也就是说任何结构只要实现了这个 ServeHTTP 方法,那么这个结构体就是一个 Handler 对象。其实 go 的 http 服务都是基于 Handler 进行处理,而 Handler 对象的 ServeHTTP 方法会读取 Request 进行逻辑处理然后向 ResponseWriter 中写入响应的头部信息和响应内容。

回到上面的 HandleFunc 函数,它调用了 *ServeMux.HandleFunc 将处理器注册到指定路由规则上:

func (mux *ServeMux) HandleFunc(pattern string, handler func(ResponseWriter, *Request)) {
    if handler == nil {
        panic("http: nil handler")
    }
    mux.Handle(pattern, HandlerFunc(handler))
}

注意一下这行代码:

mux.Handle(pattern, HandlerFunc(handler))

这里 HandlerFunc 实际上是将 handler 函数做了一个类型转换,将函数转换为了 http.HandlerFunc 类型(注意:注册路由时调用的是 http.HandleFunc,这里类型是 http.HandlerFunc)。看一下 HandlerFunc 的定义:

type HandlerFunc func(ResponseWriter, *Request)

// ServeHTTP calls f(w, r).
func (f HandlerFunc) ServeHTTP(w ResponseWriter, r *Request) {
    f(w, r)
}

HandlerFunc 类型表示的是一个具有 func(ResponseWriter, *Request) 签名的函数类型,并且这种类型实现了 ServeHTTP 方法(在其实现的 ServeHTTP 方法中又调用了被转换的函数自身)。也就是说这个类型的函数其实就是一个 Handler 类型的对象。利用这种类型转换,我们可以将将具有 func(ResponseWriter, *Request) 签名的普通函数转换为一个 Handler 对象,而不需要定义一个结构体,再让这个结构实现 ServeHTTP 方法。

ServeMux (服务复用器)

上面的代码中可以看到不论是使用 http.HandleFunc 还是 http.Handle 注册路由的处理函数时最后都会用到 ServerMux 结构的 Handle 方法去注册路由处理函数。

我们先来看一下 ServeMux 的定义:

type ServeMux struct {
    mu    sync.RWMutex
    m     map[string]muxEntry
    es    []muxEntry // slice of entries sorted from longest to shortest.
    hosts bool       // whether any patterns contain hostnames
}

type muxEntry struct {
    h       Handler
    pattern string
}

ServeMux 中的字段 m,是一个 mapkey 是路由表达式,value 是一个 muxEntry 结构,muxEntry 结构体存储了路由表达式和对应的 handler。字段 m 对应的 map 用于路由的精确匹配而 es 字段的 slice 会用于路由的部分匹配,这个到了路由匹配部分再细讲。

ServeMux 也实现了 ServeHTTP 方法:

func (mux *ServeMux) ServeHTTP(w ResponseWriter, r *Request) {
    if r.RequestURI == "*" {
        if r.ProtoAtLeast(1, 1) {
            w.Header().Set("Connection", "close")
        }
        w.WriteHeader(StatusBadRequest)
        return
    }
    h, _ := mux.Handler(r)
    h.ServeHTTP(w, r)
}

也就是说 ServeMux 结构体也是 Handler 对象,只不过 ServeMux 的 ServeHTTP 方法不是用来处理具体的 request 和构建 response,而是用来通过路由查找对应的路由处理器 Handler 对象,再去调用路由处理器的 ServeHTTP 方法去处理 request 和构建 reponse

注册路由

搞明白 Handler 和 ServeMux 之后,我们再回到之前的代码:

DefaultServeMux.Handle(pattern, handler)

这里的 DefaultServeMux 表示一个默认的 ServeMux 实例,在上面的例子中我们没有创建自定义的 ServeMux,所以会自动使用 DefaultServeMux

然后再看一下 ServeMux 的 Handle 方法是怎么注册路由的处理函数的:

func (mux *ServeMux) Handle(pattern string, handler Handler) {
    mux.mu.Lock()
    defer mux.mu.Unlock()

    if pattern == "" {
        panic("http: invalid pattern")
    }
    if handler == nil {
        panic("http: nil handler")
    }
  // 路由已经注册过处理器函数,直接panic
    if _, exist := mux.m[pattern]; exist {
        panic("http: multiple registrations for " + pattern)
    }

    if mux.m == nil {
        mux.m = make(map[string]muxEntry)
    }
  // 用路由的pattern和处理函数创建 muxEntry 对象
    e := muxEntry{h: handler, pattern: pattern}
  // 向ServeMux的m 字段增加新的路由匹配规则
    mux.m[pattern] = e
    if pattern[len(pattern)-1] == '/' {
  // 如果路由patterm以'/'结尾,则将对应的muxEntry对象加入到[]muxEntry中,路由长的位于切片的前面
        mux.es = appendSorted(mux.es, e)
    }

    if pattern[0] != '/' {
        mux.hosts = true
    }
}

Handle 方法注册路由时主要做了两件事情:一个就是向 ServeMux 的 map[string]muxEntry 增加给定的路由匹配规则;然后如果路由表达式以'/' 结尾,则将对应的 muxEntry 对象加入到 []muxEntry 中,按照路由表达式长度倒序排列。前者用于路由精确匹配,后者用于部分匹配,具体怎么匹配的后面再看。

自定义 ServeMux

通过 http.NewServeMux() 可以创建一个 ServeMux 实例取代默认的 DefaultServeMux

我们把上面输出 Hello World 的 http server 再次改造一下,使用自定义的 ServeMux 实例作为 ListenAndServe() 方法的第二个参数,并且增加一个 /welcome 路由(下面的代码主要是展示用 Handle 和 HandleFunc 注册路由,实际使用的时候不必这么麻烦,选一种就好):

package main

import (
    "fmt"
    "net/http"
)

type WelcomeHandlerStruct struct {

}

func HelloHandler(w http.ResponseWriter, r *http.Request) {
    fmt.Fprintf(w, "Hello World")
}

func (*WelcomeHandlerStruct) ServeHTTP(w http.ResponseWriter, r *http.Request) {
    fmt.Fprintf(w, "Welcome")
}

func main () {
    mux := http.NewServeMux()
    mux.HandleFunc("/", HelloHandler)
    mux.Handle("/welcome", &WelcomeHandlerStruct{})
    http.ListenAndServe(":8080", mux)
}

之前提到 ServeMux 也实现了 ServeHTTP 方法,因此 mux 也是一个 Handler 对象。对于 ListenAndServe() 方法,如果第二个参数是自定义 ServeMux 实例,那么 Server 实例接收到的 ServeMux 服务复用器对象将不再是 DefaultServeMux 而是 mux

启动服务

路由注册完成后,使用 http.ListenAndServe 方法就能启动服务器开始监听指定端口过来的请求。

func ListenAndServe(addr string, handler Handler) error {
    server := &Server{Addr: addr, Handler: handler}
    return server.ListenAndServe()
}

func (srv *Server) ListenAndServe() error {
    if srv.shuttingDown() {
        return ErrServerClosed
    }
    addr := srv.Addr
    if addr == "" {
        addr = ":http"
    }
    ln, err := net.Listen("tcp", addr)
    if err != nil {
        return err
    }
    return srv.Serve(tcpKeepAliveListener{ln.(*net.TCPListener)})
}

这先创建了一个 Server 对象,传入了地址和 handler 参数(这里的 handler 参数时 ServeMux 实例),然后调用 Server 对象 ListenAndServe() 方法。

Server(服务器对象)

先看一下 Server 这个结构体的定义,字段比较多,可以先大致了解一下:

type Server struct {
    Addr    string  // TCP address to listen on, ":http" if empty
    Handler Handler // handler to invoke, http.DefaultServeMux if nil
    TLSConfig *tls.Config
    ReadTimeout time.Duration
    ReadHeaderTimeout time.Duration
    WriteTimeout time.Duration
    IdleTimeout time.Duration
    MaxHeaderBytes int
    TLSNextProto map[string]func(*Server, *tls.Conn, Handler)
    ConnState func(net.Conn, ConnState)
    ErrorLog *log.Logger

    disableKeepAlives int32     // accessed atomically.
    inShutdown        int32     
    nextProtoOnce     sync.Once 
    nextProtoErr      error     

    mu         sync.Mutex
    listeners  map[*net.Listener]struct{}
    activeConn map[*conn]struct{}// 活跃连接
    doneChan   chan struct{}
    onShutdown []func()
}

在 Server 的 ListenAndServe 方法中,会初始化监听地址 Addr,同时调用 Listen 方法设置监听。最后将监听的 TCP 对象传入其 Serve 方法。Server 对象的 Serve 方法会接收 Listener 中过来的连接,为每个连接创建一个 goroutine,在 goroutine 中会用路由处理 Handler 对请求进行处理并构建响应。

func (srv *Server) Serve(l net.Listener) error {
......
   baseCtx := context.Background() // base is always background, per Issue 16220 
   ctx := context.WithValue(baseCtx, ServerContextKey, srv)
   for {
      rw, e := l.Accept()// 接收 listener 过来的网络连接请求
      ......
      c := srv.newConn(rw)
      c.setState(c.rwc, StateNew) // 将连接放在 Server.activeConn这个 map 中
      go c.serve(ctx)// 创建协程处理请求
   }
}

这里隐去了一些细节,以便了解 Serve 方法的主要逻辑。首先创建一个上下文对象,然后调用 Listener 的 Accept() 接收监听到的网络连接;一旦有新的连接建立,则调用 Server 的 newConn() 创建新的连接对象,并将连接的状态标志为 StateNew,然后开启一个 goroutine 处理连接请求。

处理连接

在开启的 goroutine 中 conn 的 serve() 会进行路由匹配找到路由处理函数然后调用处理函数。这个方法很长,我们保留关键逻辑。

func (c *conn) serve(ctx context.Context) {

    ...

    for {
        w, err := c.readRequest(ctx)
        if c.r.remain != c.server.initialReadLimitSize() {
            // If we read any bytes off the wire, we're active.
            c.setState(c.rwc, StateActive)
        }

        ...
        serverHandler{c.server}.ServeHTTP(w, w.req)
        w.cancelCtx()
        if c.hijacked() {
            return
        }
        w.finishRequest()
        if !w.shouldReuseConnection() {
            if w.requestBodyLimitHit || w.closedRequestBodyEarly() {
                c.closeWriteAndWait()
            }
            return
        }
        c.setState(c.rwc, StateIdle)
        c.curReq.Store((*response)(nil))

        ...
    }
}

当一个连接建立之后,该连接中所有的请求都将在这个协程中进行处理,直到连接被关闭。在 serve() 方法中会循环调用 readRequest() 方法读取下一个请求进行处理,其中最关键的逻辑是下面行代码:

serverHandler{c.server}.ServeHTTP(w, w.req)

serverHandler 是一个结构体类型,它会代理 Server 对象:

type serverHandler struct {
   srv *Server
}

func (sh serverHandler) ServeHTTP(rw ResponseWriter, req *Request) {
    handler := sh.srv.Handler
    if handler == nil {
        handler = DefaultServeMux
    }
    if req.RequestURI == "*" && req.Method == "OPTIONS" {
        handler = globalOptionsHandler{}
    }
    handler.ServeHTTP(rw, req)
}

在 serverHandler 实现的 ServeHTTP() 方法里的 sh.srv.Handler 就是我们最初在 http.ListenAndServe() 中传入的 Handler 参数,也就是我们自定义的 ServeMux 对象。如果该 Handler 对象为 nil,则会使用默认的 DefaultServeMux。最后调用 ServeMux 的 ServeHTTP() 方法匹配当前路由对应的 handler 方法。

func (mux *ServeMux) ServeHTTP(w ResponseWriter, r *Request) {
   if r.RequestURI == "*" {
      if r.ProtoAtLeast(1, 1) {
         w.Header().Set("Connection", "close")
      }
      w.WriteHeader(StatusBadRequest)
      return
   }
   h, _ := mux.Handler(r)
   h.ServeHTTP(w, r)
}

func (mux *ServeMux) Handler(r *Request) (h Handler, pattern string) {

    if r.Method == "CONNECT" {
        if u, ok := mux.redirectToPathSlash(r.URL.Host, r.URL.Path, r.URL); ok {
            return RedirectHandler(u.String(), StatusMovedPermanently), u.Path
        }

        return mux.handler(r.Host, r.URL.Path)
    }

    // All other requests have any port stripped and path cleaned
    // before passing to mux.handler.
    host := stripHostPort(r.Host)
    path := cleanPath(r.URL.Path)

    // If the given path is /tree and its handler is not registered,
    // redirect for /tree/.
    if u, ok := mux.redirectToPathSlash(host, path, r.URL); ok {
        return RedirectHandler(u.String(), StatusMovedPermanently), u.Path
    }

    if path != r.URL.Path {
        _, pattern = mux.handler(host, path)
        url := *r.URL
        url.Path = path
        return RedirectHandler(url.String(), StatusMovedPermanently), pattern
    }

    return mux.handler(host, r.URL.Path)
}

// handler is the main implementation of Handler.
// The path is known to be in canonical form, except for CONNECT methods.
func (mux *ServeMux) handler(host, path string) (h Handler, pattern string) {
    mux.mu.RLock()
    defer mux.mu.RUnlock()

    // Host-specific pattern takes precedence over generic ones
    if mux.hosts {
        h, pattern = mux.match(host + path)
    }
    if h == nil {
        h, pattern = mux.match(path)
    }
    if h == nil {
        h, pattern = NotFoundHandler(), ""
    }
    return
}

// Find a handler on a handler map given a path string.
// Most-specific (longest) pattern wins.
func (mux *ServeMux) match(path string) (h Handler, pattern string) {
    // Check for exact match first.
    v, ok := mux.m[path]
    if ok {
        return v.h, v.pattern
    }

    // Check for longest valid match.  mux.es contains all patterns
    // that end in / sorted from longest to shortest.
    for _, e := range mux.es {
        if strings.HasPrefix(path, e.pattern) {
            return e.h, e.pattern
        }
    }
    return nil, ""
}

在 match 方法里我们看到之前提到的 mux 的 m 字段 (类型为 map[string]muxEntry) 和 es(类型为 []muxEntry)。这个方法里首先会利用进行精确匹配,在 map[string]muxEntry 中查找是否有对应的路由规则存在;如果没有匹配的路由规则,则会利用 es 进行近似匹配。

之前提到在注册路由时会把以'/' 结尾的路由(可称为节点路由)加入到 es 字段的 []muxEntry 中。对于类似 /path1/path2/path3 这样的路由,如果不能找到精确匹配的路由规则,那么则会去匹配和当前路由最接近的已注册的父节点路由,所以如果路由 /path1/path2/ 已注册,那么该路由会被匹配,否则继续匹配下一个父节点路由,直到根路由 /

由于 []muxEntry 中的 muxEntry 按照路由表达式从长到短排序,所以进行近似匹配时匹配到的节点路由一定是已注册父节点路由中最相近的。

查找到路由实际的处理器 Handler 对象返回给调用者 ServerMux.ServeHTTP 方法后,最后在方法里就会调用处理器 Handler 的 ServeHTTP 方法处理请求、构建写入响应:

   h.ServeHTTP(w, r)

实际上如果根据路由查找不到处理器 Handler 那么也会返回 NotFoundHandler:

func NotFound(w ResponseWriter, r *Request) { Error(w, "404 page not found", StatusNotFound) }

func NotFoundHandler() Handler { return HandlerFunc(NotFound) }

这样标准统一,在调用 h.ServeHTTP(w, r) 后则会想响应中写入 404 的错误信息。

停止服务

我们写的 http server 已经能监听网络连接、把请求路由到处理器函数处理请求并返回响应了,但是还需要能优雅的关停服务,在生产环境中,当需要更新服务端程序时需要重启服务,但此时可能有一部分请求进行到一半,如果强行中断这些请求可能会导致意外的结果。

从 Go 1.8 版本开始,net/http 原生支持使用 http.ShutDown 来优雅的关停 HTTP 服务。这种方案同样要求用户创建自定义的 http.Server 对象,因为 Shutdown 方法无法通过其它途径调用。

我们来看下面的代码,这段代码通过结合捕捉系统信号(Signal)、goroutine 和管道(Channel)来实现服务器的优雅停止:

package main

import (
   "context"
   "fmt"
   "log"
   "net/http"
   "os"
   "os/signal"
   "syscall"
)

func main() {
   mux := http.NewServeMux()
   mux.Handle("/", &helloHandler{})

   server := &http.Server{
      Addr:    ":8081",
      Handler: mux,
   }

   // 创建系统信号接收器
   done := make(chan os.Signal)
   signal.Notify(done, os.Interrupt, syscall.SIGINT, syscall.SIGTERM)
   go func() {
      <-done

      if err := server.Shutdown(context.Background()); err != nil {
         log.Fatal("Shutdown server:", err)
      }
   }()

   log.Println("Starting HTTP server...")
   err := server.ListenAndServe()
   if err != nil {
      if err == http.ErrServerClosed {
         log.Print("Server closed under request")
      } else {
         log.Fatal("Server closed unexpected")
      }
   }
}

type helloHandler struct{}

func (*helloHandler) ServeHTTP(w http.ResponseWriter, r *http.Request) {
   fmt.Fprintf(w, "Hello World")
}

这段代码通过捕捉 os.Interrupt 信号(Ctrl+C)和 syscall,SIGTERM 信号(kill 进程时传递给进程的信号)然后调用 server.Shutdown 方法告知服务器应停止接受新的请求并在处理完当前已接受的请求后关闭服务器。为了与普通错误相区别,标准库提供了一个特定的错误类型 http.ErrServerClosed,我们可以在代码中通过判断是否为该错误类型来确定服务器是正常关闭的还是意外关闭的。

用 Go 编写 http server 的流程就大致学习完了,当然要写出一个高性能的服务器还有很多要学习的地方,net/http 标准库里还有很多结构和方法来完善 http server,学会这些最基本的方法后再看其他 Web 框架的代码时就清晰很多。甚至熟练了觉得框架用着太复杂也能自己封装一个 HTTP 服务的脚手架(我用 echo 和 gin 觉得还挺简单的,跟 PHP 的 Laravel 框架比起来他们也就算个脚手架吧,没黑 PHP,关注我的用 Laravel 的小伙伴可别取关【哈哈哈… 嗝】)。

参考文章

深入理解Golang之http server - 掘金 (juejin.cn)

building-web-applications-in-go/01.md at master · unknwon/building-web-applications-in-go (github.com)

Graceful shutdown in Go http server | by Sam Wang | honestbee-tw-engineering | Medium

posted @ 2021-11-27 17:05  拾月凄辰  阅读(2561)  评论(0编辑  收藏  举报