python爬虫---链家网二手房价采集
代码:
import requests from lxml import etree import pandas as pd from pyecharts.charts import Bar from pyecharts.charts import WordCloud from pyecharts import options as opts import os # resp = requests.get("https://sjz.lianjia.com/ershoufang/").text ---->str from pyecharts.globals import ThemeType resp = requests.get("https://sjz.lianjia.com/ershoufang/").content.decode() # ---->bytes 字节 html = etree.HTML(resp) div_list = html.xpath(".//div[@class='info clear']") # 设置一个空列表保存小区和小区房价 ershoufang = [] for div in div_list: # 小区名称 name = div.xpath(".//div[@class='positionInfo']/a/text()")[0] # 小区单价 price = div.xpath(".//div[@class='unitPrice']/span/text()")[0].replace("元/平", "").replace(",", "") ershoufang.append([name, float(price)]) print(ershoufang) title = ['小区名称', '元/平'] table = pd.DataFrame(ershoufang, columns=title) bar = Bar(init_opts=opts.InitOpts(width="100%",theme=ThemeType.LIGHT)) bar.add_xaxis(list(table["小区名称"])) bar.add_yaxis("石家庄二手房价信息",list(table["元/平"])) bar.set_series_opts(label_opts=opts.LabelOpts(is_show=True)) bar.set_global_opts(title_opts=opts.TitleOpts(title="石家庄二手房价信息")) bar.render("ershoufang.html") os.system("ershoufang.html")
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 周边上新:园子的第一款马克杯温暖上架
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源!