看网络开发实战书笔记

 

 

-·   

请求方法:  

 

名词:

HTML:

长沙市:

 CSS:

DOM:

 

JSON:

 AJAX:

 

爬虫方法:

1:获取网页

2:提取信息

3:保存数据

 

静态网页:

 登陆时框,爬虫登陆代码:

 文件上传:

其中favicon.ioc相当于一个文件:

登陆认证:

 

 

seach()——在匹配时扫描字符串,然后返回第一个成功匹配的结果

match()——从字符串的头部开始匹配,一旦开头不匹配则匹配失败返回none

findall()——匹配正则表达式的所有内容。

sub()——去掉不想要的内容

compile()——将正则表达式编译成正则表达式对象,以后在后面的匹配中复用

 

 

 

beautiful soup4

 

读取JSON:

关于ensure_ascii = False:

CSV文件的写入行:

 数据库MySQL操作:

1创建表:CREATE

2:插入数据:INSERT

3:更新数据:UPDATE

4:-删除数据:DELETE

5:查询数据:SELECT

 

 数据库MongoDB操作:

连接mongoDB:

指定数据库:

指定集合:

 

插入数据:

 

查询数据:

 关于selenium:

单节点:

 

多节点:

 

关于动态链:

对于鼠标拖拽,键盘按键等这些动作得使用动态链来实现

关于下拉进度条:

execute_script()可以将进度条下拉到最底部

获取源代码:

page_source

获取文本值:

webElement——text

beautifulSoup——get_text()

pyquery——text()

获取属性:

get_attribute()——获取节点属性

获取id,位置,标签名和大小:

 

 切换Frame(相当于子页面)

 

延时等待:

隐式等待: implicitly——wait()

显式等待:

 

posted @ 2018-08-09 17:45  莫失莫忘csbh  阅读(178)  评论(0编辑  收藏  举报