随笔分类 - python笔记
摘要:去除指定标签from bs4 import BeautifulSoup#去除属性ul[s.extract() for s in soup("ul")]# 去除属性svg[s.extract() for s in soup("svg")]# 去除属性scrip...
阅读全文
摘要:前景在转载别人博客的时候通常我们会通过复制html然后放到编辑器里面, 但是通常html里有很多杂七杂八的东西, 比如script, svg这些标签导致排版出现问题例如由lu标签引起的由svg标签引起的当然要说你直接把不要的东西删除也可以, 但是作为一个程序...
阅读全文
摘要:作为一个博客新人,对自己博客的访问量也是很在意的,刚好在学python爬虫,所以正好利用一下,写一个python程序来监控博客文章访问量效果代码会自动爬取文章列表,并且获取标题和访问量,写入excel,并且对新加入的文章也有作用解析HTMLhtml通过beautifu...
阅读全文
摘要:相关库import osimport xlwtfrom xlrd import open_workbookfrom xlutils.copy import copy1.判断是否存在xls文件, 不存在则创建import osimport xlwtif not os.p...
阅读全文
摘要:最近在自学Python爬虫,所以想练一下手,用python来爬取B站在线人数,应该可以拿来小小分析一下设计思路首先查看网页源代码,找到相应的html,然后利用各种工具(BeautifulSoup或者直接正则表达式)得到数据, 然后把数据和当且时间保存到本地,并且设置一...
阅读全文
摘要:python版本为3.7 因为用anaconda安装scrapy非常方便,会自动下载所依赖的包, 所以就使用anaconda安装scrapy, 非常舒服,安装很成功conda install scrapy问题出现当使用scrapy时出现报错, 这里我是创建新项目,发现...
阅读全文