从500彩票网站下载历史数据

复制代码
#从500彩票网站下载双色球历史数据,网页另存为01.txt
data = []
file = open('01.txt')
for line in file:
    line = line.lstrip()
    line = line.strip('\n')
    line = line.split(' ')[0]
    if len(line)==19 or len(line)==20 or len(line)==21:
        data.append(line)
newFile = open('彩票数据.txt','w')

for i in data:
    newFile.write(i)
    newFile.write('\n')
newFile.close()

##for k in data:
##    print('20%s%s: %s %s %s %s %s %s--%s'%\
##          (k[0:2],k[2:5],k[5:7],k[7:9],k[9:11],k[11:13],k[13:15],k[15:17],k[17:19]))
    
复制代码

 

复制代码
import urllib.request
import re

url = 'http://datachart.500.com/ssq/history/newinc/history.php?start=16110&end=16120'
html = urllib.request.urlopen(url).read()
html = html.decode('utf-8')

s1 = r'\d{5}</td><td class="t_cfont2">\d\d</td><td class="t_cfont2">\d\d</td><td class="t_cfont2">\d\d</td><td class="t_cfont2">\d\d</td><td class="t_cfont2">\d\d</td><td class="t_cfont2">\d\d</td><td class="t_cfont4">\d\d</td><td'
s2 = r'(.*?)</td><td class="t_cfont2">(.*?)</td><td class="t_cfont2">(.*?)</td><td class="t_cfont2">(.*?)</td><td class="t_cfont2">(.*?)</td><td class="t_cfont2">(.*?)</td><td class="t_cfont2">(.*?)</td><td class="t_cfont4">(.*?)</td><td'
pat1 = re.compile(s1)

t1 = pat1.findall(html)

allData = []
tempList = []

for i in t1:
    pat2 = re.compile(s2)
    t2 = pat2.findall(i)
    tempList.append(t2)
print(tempList)
复制代码

 

posted @   疯陈演义  阅读(2402)  评论(0编辑  收藏  举报
编辑推荐:
· 开发中对象命名的一点思考
· .NET Core内存结构体系(Windows环境)底层原理浅谈
· C# 深度学习:对抗生成网络(GAN)训练头像生成模型
· .NET 适配 HarmonyOS 进展
· .NET 进程 stackoverflow异常后,还可以接收 TCP 连接请求吗?
阅读排行:
· 本地部署 DeepSeek:小白也能轻松搞定!
· 基于DeepSeek R1 满血版大模型的个人知识库,回答都源自对你专属文件的深度学习。
· 在缓慢中沉淀,在挑战中重生!2024个人总结!
· 大人,时代变了! 赶快把自有业务的本地AI“模型”训练起来!
· Tinyfox 简易教程-1:Hello World!
点击右上角即可分享
微信分享提示