随笔分类 -  Python

摘要:chromedriver不同版本 https://chromedriver.storage.googleapis.com/index.html https://registry.npmmirror.com/binary.html?path=chrome-for-testing https://goo 阅读全文
posted @ 2024-05-29 14:47 幽冥狂_七 阅读(21) 评论(0) 推荐(0) 编辑
摘要:selenium.common.exceptions.WebDriverException: Message: 'chromedriver' executable needs to be in PATH. Please see https://sites.google.com/a/chromium. 阅读全文
posted @ 2019-06-30 20:42 幽冥狂_七 阅读(12506) 评论(1) 推荐(0) 编辑
摘要:一个Python 爬取猫眼top100的小栗子 阅读全文
posted @ 2017-11-22 16:46 幽冥狂_七 阅读(665) 评论(0) 推荐(0) 编辑
摘要:找不到driver的路径,需要将driver的路径加上 部分参考:http://blog.csdn.net/972301/article/details/62238451 【Python处理】 1. 零基础: 如果从来没有装过Selenium,直接执行。 pip install selenium 2 阅读全文
posted @ 2017-11-21 13:58 幽冥狂_七 阅读(20476) 评论(1) 推荐(0) 编辑
摘要:自动化测试工具,支持多种浏览器。爬虫中主要用来解决JavaScript渲染问题。 用法 基本使用 先下载对应的驱动:https://github.com/mozilla/geckodriver/releases 以FireFox的驱动 geckodriver为例。下载后,建议可以直接放在FireFo 阅读全文
posted @ 2017-11-21 11:03 幽冥狂_七 阅读(256) 评论(0) 推荐(0) 编辑
摘要:强大又灵活的网页解析库。如果你觉得正则写起来太麻烦,如果你觉得Beauifulsoup语法太难记,如果你属性Jqueryd 语法,PyQuery是个不错的选择。 pyquery 栗子 3、文件初始化 4、基本CSS选择器 doc = pq(html) print(doc('#cond .list l 阅读全文
posted @ 2017-11-16 11:37 幽冥狂_七 阅读(276) 评论(0) 推荐(0) 编辑
摘要:1、BeautifuSoup 是什么 灵活又方便的网页解析库,处理高效,支持多种解析器,利用它不用编写正则表达式既可方便地实现网页信息的提取。 安装: pip3 install beautifulsoup4 用法讲解 来个栗子 2、标签选择器 1、选择元素 输出: 如果加了.string 输出就是具 阅读全文
posted @ 2017-11-15 16:36 幽冥狂_七 阅读(342) 评论(0) 推荐(0) 编辑
摘要:1、re.match re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()返回none。 re.match(pattern,string,flags=0) 最常规的匹配 import re content ='hello 123 4567 World_T 阅读全文
posted @ 2017-11-05 22:05 幽冥狂_七 阅读(209) 评论(0) 推荐(0) 编辑
摘要:1、Requests 用法 例子: import requests response = requests.get('https://www.baidu.com') print(type(response)) print(response.status_code) //200 print(type( 阅读全文
posted @ 2017-11-05 10:36 幽冥狂_七 阅读(228) 评论(0) 推荐(0) 编辑
摘要:一、常用库 1、requests 做请求的时候用到。 requests.get("url") 2、selenium 自动化会用到。 3、lxml 4、beautifulsoup 5、pyquery 网页解析库 说是比beautiful 好用,语法和jquery非常像。 6、pymysql 存储库。操 阅读全文
posted @ 2017-11-03 21:47 幽冥狂_七 阅读(5778) 评论(0) 推荐(0) 编辑
摘要:直接安装scrapy 各种报错,后来各种百度终于解决了,如下是亲身的经历。 这样直接会报错。 第一步: 先安装wheel 第二步: 安装twiste,事先下载好Twisted-17.9.0-cp36-cp36m-win32.whl,我用的是32位,切换到twisted路径下安装, 这上有 http: 阅读全文
posted @ 2017-09-27 17:56 幽冥狂_七 阅读(254) 评论(0) 推荐(0) 编辑
摘要:如果发现不能用,那就是糗百又改规则了 阅读全文
posted @ 2017-09-21 16:14 幽冥狂_七 阅读(371) 评论(0) 推荐(0) 编辑
摘要:#1、执行outer函数,并且将其下面的函数名当做参数 #2、将outer的返回值重新赋值给f1=outer的返回值 #新f1函数 = inner 上面是没有参数的,来两个有参数的 阅读全文
posted @ 2017-09-16 23:37 幽冥狂_七 阅读(144) 评论(0) 推荐(0) 编辑
摘要:temp2 = "" for i in range(6): num = random.randrange(0,6) if num == 1 or num == 3 or num ==5: temp2 = temp2 + str(num) else: num2 =random.randrange(65,91) temp2 +=... 阅读全文
posted @ 2017-09-16 14:20 幽冥狂_七 阅读(163) 评论(0) 推荐(0) 编辑
摘要:示例代码和引用的语录都来自Raymond的演讲。这是我按我的理解整理出来的,希望你们理解起来跟我一样顺畅! 遍历一个范围内的数字 for i in [0, 1, 2, 3, 4, 5]: print i ** 2 for i in range(6): print i ** 2 更好的方法 for i 阅读全文
posted @ 2017-09-16 09:17 幽冥狂_七 阅读(247) 评论(0) 推荐(0) 编辑
摘要:完美 参考:http://www.cnblogs.com/smq772340208/p/6927063.html 阅读全文
posted @ 2017-09-15 17:13 幽冥狂_七 阅读(3511) 评论(0) 推荐(0) 编辑
摘要:1、添加关键字: global 在要给变量从新赋值的时候添加。 全局变量都大写,局部变量都小写。 阅读全文
posted @ 2017-09-13 21:35 幽冥狂_七 阅读(242) 评论(0) 推荐(0) 编辑
摘要:对python 读写配置文件的具体方案的介绍 1,函数介绍 1.1.读取配置文件 -read(filename) 直接读取ini文件内容 -sections() 得到所有的section,并以列表的形式返回 -options(section) 得到该section的所有option -items(s 阅读全文
posted @ 2017-09-12 10:32 幽冥狂_七 阅读(455) 评论(0) 推荐(0) 编辑
摘要:网址:http://www.lfd.uci.edu/~gohlke/pythonlibs/ 阅读全文
posted @ 2017-09-07 11:29 幽冥狂_七 阅读(1352) 评论(0) 推荐(0) 编辑
摘要:1、下载 lxml 地址:https://pypi.python.org/pypi/lxml/3.8.0#downloads 我用的是python 3.6,我下载了 lxml-3.8.0-cp36-cp36m-win_amd64.whl,可根据自己情况而定。 然后安装,把 lxml-3.8.0-cp 阅读全文
posted @ 2017-09-06 17:09 幽冥狂_七 阅读(3985) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示