python socket 网页爬虫

import socket

# 第一步 获取域名或ip地址
host = 'www.baidu.com'
port = 80
header = b'GET / HTTP/1.1\r\nHost: www.baidu.com\r\nConnection: close\r\n\r\n'

# 第二步 域名解析 将url(网址)转换为ip地址
for res in socket.getaddrinfo(host, port, socket.AF_UNSPEC, socket.SOCK_STREAM, 0, socket.AI_PASSIVE):
# print(res)
af, socktype, proto, canonname, sockaddr = res
print(af, socktype, proto, canonname, sockaddr)
s = socket.socket(af, socktype)
s.connect(sockaddr)

# 第三步 发送数据
with s:
s.send(header)
content = []
while 1:
t = s.recv(1024)
if t:
content.append(t.decode('utf-8'))
else:
break
c = ''.join(content).encode()
print(c.decode())



posted @   记录——去繁就简  阅读(155)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?
点击右上角即可分享
微信分享提示