GO-小爬虫
小爬虫百度
package main
import (
"net/http"
"fmt"
)
func main() {
response,err := http.Get("https://www.cnblogs.com/")
fmt.Println(err)
html := make([]byte,4*1024)
var text string
for {
n,err := response.Body.Read(html)
if n==0 {
fmt.Println(err)
break
}
text += string(html[:n])
}
fmt.Println(html)
fmt.Println(text)
}
小爬虫头条
package main
import (
"fmt"
"io/ioutil"
"log"
"net/http"
)
func main() {
client := &http.Client{}
req, err := http.NewRequest("GET", "https://profile.zjurl.cn/api/feed_backflow/profile_share/v1/?category=profile_all&visited_uid=4492956276&stream_api_version=82&request_source=1&offset=0&user_id=4492956276&media_id=4492956276&appId=1286&appType=mobile_detail_web&isAndroid=true&isIOS=false&isMobile=true&cookie_enabled=true&screen_width=360&screen_height=640&browser_language=zh-CN&browser_platform=MacIntel&browser_name=firefox&browser_version=86.0.4240.198&browser_online=true&timezone_name=Asia%2FShanghai&_signature=_02B4Z6wo00f01.B2THAAAIBDMzwCVjJYeoPwY0jAAKOz5JXVy3OFm4k-aHdT6AiigXlVpy45kcV6KjskZEAS7XQy7WA0lPFcufCvvuLciQUTc-wbErkTeTZb2qEIL2E2sAB-4w9P1bHT5syxeb", nil)
if err != nil {
log.Fatal(err)
}
req.Header.Set("authority", "profile.zjurl.cn")
req.Header.Set("pragma", "no-cache")
req.Header.Set("cache-control", "no-cache")
req.Header.Set("accept", "text/javascript, text/html, application/xml, text/xml, */*")
req.Header.Set("x-requested-with", "XMLHttpRequest")
req.Header.Set("user-agent", "Mozilla/5.0 (Linux; Android 6.0.1; Moto G (4)) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Mobile Safari/537.36")
req.Header.Set("content-type", "application/x-www-form-urlencoded")
req.Header.Set("sec-fetch-site", "same-origin")
req.Header.Set("sec-fetch-mode", "cors")
req.Header.Set("sec-fetch-dest", "empty")
req.Header.Set("referer", "https://profile.zjurl.cn/rogue/ugc/profile/?user_id=4492956276&media_id=4492956276&request_source=1")
req.Header.Set("accept-language", "zh-CN,zh;q=0.9")
req.Header.Set("cookie", "gftoken=MTk5MzAzMTMzMHwxNjA1NjA1NjE1ODV8fDAGBgYGBgY; s_v_web_id=verify_khls4mmz_lIx8FRXf_1oLb_4pfA_BFQp_MXI45BTMTftn; MONITOR_WEB_ID=41bd0cdb-d37e-4837-984d-8cea0a602167; tt_scid=HVkHoh30TyEopsYRtYQmPzLKkhG8-1Q5Ajn.phCrimoCdtgURQkAI3XzepXGkP45d4d6")
resp, err := client.Do(req)
if err != nil {
log.Fatal(err)
}
bodyText, err := ioutil.ReadAll(resp.Body)
if err != nil {
log.Fatal(err)
}
fmt.Printf("%s\n", bodyText)
}
选择了IT,必定终身学习
posted @ Jeff的技术栈 阅读 (9999+) 评论 (99) 点赞(99) 编辑 MD 收藏
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· winform 绘制太阳,地球,月球 运作规律
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人