2017年中国主要城市房价工资比排行榜
2017房价
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 | import requests import bs4 import re import openpyxl def open_url(url): headers = { "User-Agent" : "Mozilla / 5.0 (Windows NT 10.0 ; WOW64) AppleWebKit / 537.36 (KHTML, like Gecko) \ Chrome / 86.0 . 4240.198 Safari / 537.36 "} res = requests.get(url,headers = headers) return res def find_infor(res) - > object : data = [] soup = bs4.BeautifulSoup(res.text, 'html.parser' ) content = soup.find( id = "C-Main-Article-QQ" ) targets = content.find_all( 'p' ,style = "TEXT-INDENT: 2em" ) targets = iter (targets) #因为targets是一个列表,是一个可迭代对象;可以用for循环来迭代它,但是它本身不是一个迭代器;直接用的话会提示: ##'XXX' object is not an iterator.判断断一个对象是不是一个迭代器,可以用next()函数来迭代它/作用它; ##targets=iter(targets)行是通过用iter()函数吧targets转换为了迭代器,所以在下面的for循环中对targets可以直接应用next()函数了。 for each in targets: # print(each.text) # if each.text.isnumeric(): # for i in range(4): # data.append(next(targets).text) if each.text.isnumeric(): data.append([re.search(r '\[(.+)\]' , next (targets).text).group( 1 ), re.search(r '\d.*' , next (targets).text).group(), re.search(r '\d.*' , next (targets).text).group(), re.search(r '\d.*' , next (targets).text).group()]) return data # return content def to_excel(data): wb = openpyxl.Workbook() wb.guess_types = True ws = wb.active ws.append([ '城市' , '平均房价' , '平均工资' , '房价工资比' ]) for each in data: ws.append(each) wb.save( "2017年中国主要城市房价工资比排行榜.xlsx" ) def main(): url = 'https://news.house.qq.com/a/20170702/003985.htm' res = open_url(url) data = find_infor(res) to_excel(data) # print(data) # content=find_infor(res) # with open("2017各城市房价1.txt",'w',encoding='utf-8') as f: # f.write(content.text) if __name__ = = "__main__" : main() |
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix