性能分析方法总结之pprof

1、代码实例

以下例子除了特别说明,都以这段代码为实例。

package main

import (
	"log"
	"time"
	"net/http"
	_ "net/http/pprof"
)

var datas []string

func main() {
	go func() {
		for {
			log.Printf("len: %d", Add("go-programming-tour-book"))
			time.Sleep(time.Millisecond * 10)
		}
	}()

	_ = http.ListenAndServe("0.0.0.0:6060", nil)
}

func Add(str string) int {
	data := []byte(str)
	datas = append(datas, string(data))
	return len(datas)
}

  

2、性能分析方法

2.1通过浏览器分析

运行程序后,在浏览器访问http://127.0.0.1:6060/debug/pprof/

2.2通过交互式终端分析

1)分析CPU资源占用情况

运行命令go tool pprof http://localhost:6060/debug/pprof/profile\?seconds\=60

执行该命令后,需等待 60 秒(可调整 seconds 的值),pprof 会进行 CPU Profiling,结束后将默认进入 pprof 的命令行交互式模式,可以对分析的结果进行查看或导出。另外如果你所启动的 HTTP Server 是 TLS 的方式,那么在调用 go tool pprof 时,需要将调用路径改为:go tool pprof https+insecure://localhost:6060/debug/pprof/profile\?seconds\=60。可以通过top 10命令查看资源占用前10的函数。

相关参数说明:

    • flat:函数自身的运行耗时。
    • flat%:函数自身在 CPU 运行耗时总比例。
    • sum%:函数自身累积使用 CPU 总比例。
    • cum:函数自身及其调用函数的运行总耗时。
    • cum%:函数自身及其调用函数的运行耗时总比例。
    • Name:函数名。
2)分析内存占用情况

执行命令go tool pprof http://localhost:6060/debug/pprof/heap

命令执行完毕显示内容如下图:

 执行该命令后,能够很快的拉取到其结果,因为它不需要像 CPU Profiling 做采样等待,这里需要注意的一点是 Type 这一个选项,你可以看到它默认显示的是 inuse_space,实际上可以针对多种内存概况进行分析,常用的类别如下:

    • inuse_space:分析应用程序的常驻内存占用情况。
    • alloc_objects:分析应用程序的内存临时分配情况。
    •  inuse_objects:查看每个函数所分别的对象数量
    • alloc_space:查看分配的内存空间大小
3)分析协程情况

执行命令go tool pprof http://localhost:6060/debug/pprof/goroutine

在查看 goroutine 时,我们可以使用 traces 命令,这个命令会打印出对应的所有调用栈。

4)分析mutex情况

执行命令go tool pprof http://localhost:6061/debug/pprof/mutex

可以调用 top 命令,查看互斥量的排名,也可以调用 list 命令,看到指定函数的代码情况(包含特定的指标信息,例如:耗时)。

注意:需要特别注意的是 runtime.SetMutexProfileFraction 语句,如果未来希望进行互斥锁的采集,那么需要通过调用该方法来设置采集频率,若不设置或没有设置大于 0 的数值,默认是不进行采集的。例如如下代码:

func init() {
	runtime.SetMutexProfileFraction(1)
}

func main() {
	var m sync.Mutex
	var datas = make(map[int]struct{})
	for i := 0; i < 999; i++ {
		go func(i int) {
			m.Lock()
			defer m.Unlock()
			datas[i] = struct{}{}
		}(i)
	}

	_ = http.ListenAndServe(":6061", nil)
}
5)分析block情况

执行命令go tool pprof http://localhost:6061/debug/pprof/block

可以调用 top 命令,查看阻塞的排名,也可以调用 list 命令,查看阻塞的具体情况。

注意:与 Mutex 的 runtime.SetMutexProfileFraction 相似,Block 也需要调用 runtime.SetBlockProfileRate() 进行采集量的设置,否则默认关闭,若设置的值小于等于 0 也会认为是关闭。

2.3查看可视化界面

首先,运行程序,然后从路由http://127.0.0.1:6060/debug/pprof/profile获取profile文件。

然后,执行go tool pprof -http=:6001 profile命令,如果出现错误提示 Could not execute dot; may need to install graphviz.,那么意味着你需要安装 graphviz 组件。

 

3、通过测试用例做分析

3.1代码

add.go

package main

func Add(str string) int {
	data := []byte(str)
	datas = append(datas, string(data))
	return len(datas)
}

add_test.go

package main

import (
	"testing"
)

func TestAdd(t *testing.T) {
	_ = Add("go-programming-tour-book")
}

func BenchmarkAdd(b *testing.B) {
	for i := 0; i < b.N; i++ {
		Add("go-programming-tour-book")
	}
}

3.2对CPU进行分析

首先,执行命令go test -bench=. -cpuprofile=cpu.profile,执行完毕后会在当前命令生成 cpu.profile 文件。

然后,执行命令go tool pprof -http=:6001 cpu.profile,即可在浏览器查看CPU情况。

3.3对内存进行分析

首先,执行命令go test -bench=. -memprofile=mem.profile执行完毕后会在当前命令生成mem.profile 文件。

然后,执行命令go tool pprof -http=:6001 mem.profile,即可在浏览器查看内存使用情况。

 

 4、通过lookup写入文件做分析

4.1代码

package main

import (
	"io"
	"net/http"
	"runtime"
	"os"
	"runtime/pprof"
)

type LookupType int8

const (
	LookupGoroutine LookupType = iota
	LookupThreadcreate
	LookupHeap
	LookupAllocs
	LookupBlock
	LookupMutex
)

func pprofLookup(lookupType LookupType, w io.Writer) error {
	var err error
	switch lookupType {
	case LookupGoroutine:
		p := pprof.Lookup("goroutine")
		err = p.WriteTo(w, 2)
	case LookupThreadcreate:
		p := pprof.Lookup("threadcreate")
		err = p.WriteTo(w, 2)
	case LookupHeap:
		p := pprof.Lookup("heap")
		err = p.WriteTo(w, 2)
	case LookupAllocs:
		p := pprof.Lookup("allocs")
		err = p.WriteTo(w, 2)
	case LookupBlock:
		p := pprof.Lookup("block")
		err = p.WriteTo(w, 2)
	case LookupMutex:
		p := pprof.Lookup("mutex")
		err = p.WriteTo(w, 2)
	}

	return err
}

func init() {
	runtime.SetMutexProfileFraction(1)
	runtime.SetBlockProfileRate(1)
}

func main() {
	http.HandleFunc("/lookup/heap", func(w http.ResponseWriter, r *http.Request) {
		_ = pprofLookup(LookupHeap, os.Stdout)
	})
	http.HandleFunc("/lookup/threadcreate", func(w http.ResponseWriter, r *http.Request) {
		_ = pprofLookup(LookupThreadcreate, os.Stdout)
	})
	http.HandleFunc("/lookup/block", func(w http.ResponseWriter, r *http.Request) {
		_ = pprofLookup(LookupBlock, os.Stdout)
	})
	http.HandleFunc("/lookup/goroutine", func(w http.ResponseWriter, r *http.Request) {
		_ = pprofLookup(LookupGoroutine, os.Stdout)
	})
	_ = http.ListenAndServe("0.0.0.0:6060", nil)
}

通过 runtime/pprof 所提供的 Lookup 方法来进行相关内容的采集和调用,其一共支持六种类型,分别是:goroutine、threadcreate、heap、block、mutex,其提供了 io.Writer 接口,也就是只要实现了对应的 Write 方法,我们可以将其写到任何支持地方去。

 

 

参考:Go 大杀器之性能剖析 PProf(上) | Go 语言编程之旅 (eddycjy.com)

 

posted @ 2023-02-17 11:57  ☞@_@  阅读(188)  评论(0编辑  收藏  举报