摘要: 最近在写爬虫时需要获取javascrip的一些内容,需要配置selenium来使用,在此整理一下我在windows下的安装步骤: 1.安装好chrome浏览器,并在设置里查看chrome的版本,示例如下: 2.下载好对应的chromedriver版本,下载地址:"http://chromedrive 阅读全文
posted @ 2019-03-28 22:00 皮皮嘉 阅读(518) 评论(0) 推荐(0) 编辑
摘要: 官方网站:"https://selenium-python.readthedocs.io/index.html" Selenium操作主要分两大类:1.得到UI元素: - find_element_by_id - find_elements_by_name - find_elements_by_xp 阅读全文
posted @ 2019-03-28 21:40 皮皮嘉 阅读(686) 评论(0) 推荐(0) 编辑
摘要: BeautifulSoup是一个可以从HTML或XML文件中提取数据的Python库,它能实现文档的导航和查找,修改文档等操作 官方文档地址:"https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/" 几个常用提取信息工具的比较: - 正则:很快,使用复 阅读全文
posted @ 2019-03-28 16:24 皮皮嘉 阅读(3045) 评论(0) 推荐(0) 编辑
摘要: 原文地址:"https://www.cnblogs.com/whaben/p/6495702.html" Python list内置sort()方法用来排序,也可以用python内置的全局sorted()方法来对可迭代的序列排序生成新的序列。 1)排序基础 简单的升序排序是非常容易的。只需要调用so 阅读全文
posted @ 2019-03-28 10:23 皮皮嘉 阅读(19635) 评论(0) 推荐(2) 编辑
摘要: 原文地址:"https://www.cnblogs.com/laoniubile/p/5904853.html" Python中的random模块用于生成随机数。下面介绍一下random模块中最常用的几个函数。 random.random random.random()用于生成一个0到1的随机符点数 阅读全文
posted @ 2019-03-28 09:48 皮皮嘉 阅读(1879) 评论(0) 推荐(0) 编辑