看网络开发实战书笔记

-·

请求方法：

名词：

HTML:

长沙市：

CSS：

DOM:

JSON:

AJAX:

爬虫方法：

1：获取网页

2：提取信息

3：保存数据

静态网页：

登陆时框，爬虫登陆代码：

文件上传：

其中favicon.ioc相当于一个文件：

登陆认证：

seach()——在匹配时扫描字符串，然后返回第一个成功匹配的结果

match()——从字符串的头部开始匹配，一旦开头不匹配则匹配失败返回none

findall()——匹配正则表达式的所有内容。

sub()——去掉不想要的内容

compile()——将正则表达式编译成正则表达式对象，以后在后面的匹配中复用

beautiful soup4

读取JSON：

关于ensure_ascii = False:

CSV文件的写入行：

数据库MySQL操作：

1创建表：CREATE

2:插入数据：INSERT

3:更新数据：UPDATE

4:-删除数据：DELETE

5:查询数据：SELECT

数据库MongoDB操作：

连接mongoDB:

指定数据库：

指定集合：

插入数据：

查询数据：

关于selenium:

单节点：

多节点：

关于动态链：

对于鼠标拖拽，键盘按键等这些动作得使用动态链来实现

关于下拉进度条：

execute_script()可以将进度条下拉到最底部

获取源代码：

page_source

获取文本值：

webElement——text

beautifulSoup——get_text()

pyquery——text()

获取属性：

get_attribute()——获取节点属性

获取id,位置，标签名和大小：

切换Frame(相当于子页面）

延时等待：

隐式等待： implicitly——wait()

显式等待:

posted @ 2018-08-09 17:45 莫失莫忘csbh 阅读(188) 评论(0) 收藏举报

刷新页面返回顶部