看网络开发实战书笔记
-·
请求方法:
名词:
HTML:
长沙市:
CSS:
DOM:
JSON:
AJAX:
爬虫方法:
1:获取网页
2:提取信息
3:保存数据
静态网页:
登陆时框,爬虫登陆代码:
文件上传:
其中favicon.ioc相当于一个文件:
登陆认证:
seach()——在匹配时扫描字符串,然后返回第一个成功匹配的结果
match()——从字符串的头部开始匹配,一旦开头不匹配则匹配失败返回none
findall()——匹配正则表达式的所有内容。
sub()——去掉不想要的内容
compile()——将正则表达式编译成正则表达式对象,以后在后面的匹配中复用
beautiful soup4
读取JSON:
关于ensure_ascii = False:
CSV文件的写入行:
数据库MySQL操作:
1创建表:CREATE
2:插入数据:INSERT
3:更新数据:UPDATE
4:-删除数据:DELETE
5:查询数据:SELECT
数据库MongoDB操作:
连接mongoDB:
指定数据库:
指定集合:
插入数据:
查询数据:
关于selenium:
单节点:
多节点:
关于动态链:
对于鼠标拖拽,键盘按键等这些动作得使用动态链来实现
关于下拉进度条:
execute_script()可以将进度条下拉到最底部
获取源代码:
page_source
获取文本值:
webElement——text
beautifulSoup——get_text()
pyquery——text()
获取属性:
get_attribute()——获取节点属性
获取id,位置,标签名和大小:
切换Frame(相当于子页面)
延时等待:
隐式等待: implicitly——wait()
显式等待:
No matter what situation we face, no matter how contradictory our hearts are, we always have a choice. What kind of person we are depends on who we choose to be.