2020 年 4月 9 日随笔档案 - Hank·Paul

2020年4月9日

摘要： selenium的使用声明浏览器对象 Selenium支持非常多的浏览器，如Chrome、Firefox、Edge等，还有Android、BlackBerry等手机端的浏览器。此外，我们可以用如下方式进行初始化： from selenium import webdriver browser = w 阅读全文

posted @ 2020-04-09 21:53 Hank·Paul 阅读(239) 评论(0) 推荐(0) 编辑

selenium简介与安装

摘要： selenium的介绍 selenium最初是一个自动化测试工具,而爬虫中使用它主要是为了解决requests无法直接执行JavaScript代码的问题 selenium本质是通过驱动浏览器，完全模拟浏览器的操作，比如跳转、输入、点击、下拉等，来拿到网页渲染之后的结果，可支持多种浏览器安装 pip 阅读全文

posted @ 2020-04-09 19:44 Hank·Paul 阅读(194) 评论(0) 推荐(0) 编辑

xpath路径

摘要： xpath路径 XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。 1、选取节点表达式描述 nodename 选取此节点的所有子节点。 / 从根节点选取。 // 从匹配选择的当前节点选择文档中的节点，而不考虑它们的位置。 . 选取当前节点阅读全文

posted @ 2020-04-09 10:26 Hank·Paul 阅读(609) 评论(0) 推荐(0) 编辑

模拟自动登录网站

摘要：模拟自动登录网站 import requests ret = requests.post('http://www.aa7a.cn/user.php', data={ 'username': '616564099@qq.com', 'password': 'lqz123', 'captcha': 'f 阅读全文

posted @ 2020-04-09 06:04 Hank·Paul 阅读(609) 评论(0) 推荐(0) 编辑

爬虫的Robots协议

摘要：爬虫的规定 Robots协议网站开发者对于网络爬虫的规范的公告,你可以不遵守可能存在法律风险,但尽量去遵守 Robots协议:在网页的根目录+/robots.txt 如www.baidu.com/robots.txt Robots协议的基本语法: #*代表所有,/代表根目录 User-agent: 阅读全文

posted @ 2020-04-09 01:22 Hank·Paul 阅读(1249) 评论(0) 推荐(0) 编辑

单链表

摘要：单链表 class Hero(): def __init__(self,num=None,name=None,nickname=None,pNext=None): self.num = num self.name = name self.nickname = nickname self.pNext 阅读全文

posted @ 2020-04-09 01:19 Hank·Paul 阅读(134) 评论(0) 推荐(0) 编辑

python微信机器人

摘要： https://www.cnblogs.com/liuqingzheng/articles/9079192.html 官方文档阅读全文

posted @ 2020-04-09 01:16 Hank·Paul 阅读(926) 评论(0) 推荐(0) 编辑

爬取糗事百科，微信自动发送

摘要：爬取糗事百科，微信自动发送 # https://www.qiushibaike.com/text/ # https://www.qiushibaike.com/text/page/1/ import requests from bs4 import BeautifulSoup ret=request 阅读全文

posted @ 2020-04-09 01:12 Hank·Paul 阅读(207) 评论(0) 推荐(0) 编辑

Hank·Paul

原CSDN博客已不用，转到此处

公告