Golang html encoding解析
自动解析html页面的编码格式:
需要依赖 golang.org/x/text 和 golang.org/x/net 这两个外部库
package main import ( "net/http" "io/ioutil" "fmt" "golang.org/x/text/transform" "io" "golang.org/x/text/encoding" "bufio" "golang.org/x/net/html/charset" ) // encoding determine for html page , eg: gbk gb2312 GB18030 func determineEncoding(r io.Reader) encoding.Encoding { bytes, err := bufio.NewReader(r).Peek(1024) if err != nil { panic(err) } e, _, _ := charset.DetermineEncoding(bytes, "") return e } func main() { resp, err := http.Get("http://www.zhenai.com/zhenghun") if err != nil { panic(err) } defer resp.Body.Close() e := determineEncoding(resp.Body) reader := transform.NewReader(resp.Body, e.NewDecoder()) if resp.StatusCode == http.StatusOK { bodyBytes, err := ioutil.ReadAll(reader) if err != nil { panic(err) } fmt.Printf("%s\n", bodyBytes) } }
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步