python爬虫案列11:爬取双色球历史开奖记录并存储到mysql
开始之前要先在MySQL创建一个名为spider的数据库,在里面创建一个名caipiao的表,表里面三个字段,data,red,blue
点击查看代码
import requests
import pymysql
from lxml import etree
# 连接数据库
conn = pymysql.connect(
host='localhost', port=3306, user='root', password='root', database='spider'
)
# 创建游标
cursor = conn.cursor()
url = 'http://datachart.500.com/ssq/'
resp = requests.get(url).text
# 解析数据
tree = etree.HTML(resp)
trs = tree.xpath('//*[@id="tdata"]/tr')
for tr in trs:
if len(tr) != 1: # 判断是否为空
# 拿到想要的数据
data = tr.xpath('./td[@align="center"]/text()')[0].strip()
red = '_'.join(tr.xpath('./td[@class="chartBall01"]/text()'))
blue = tr.xpath('./td[@class="chartBall02"]/text()')[0]
# 执行sql语句
sql = "insert into caipiao(data, red, blue) values(%s, %s, %s)"
cursor.execute(sql, (data, red, blue))
print("OK!")
# 关闭数据库连接
conn.close()
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 25岁的心里话
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 零经验选手,Compose 一天开发一款小游戏!
· 因为Apifox不支持离线,我果断选择了Apipost!
· 通过 API 将Deepseek响应流式内容输出到前端