摘要: 简单使用 阅读全文
posted @ 2018-04-09 09:55 蓝勃斐重新开始 阅读(519) 评论(1) 推荐(0) 编辑
摘要: 不断发送标志,以获得完整页面 阅读全文
posted @ 2018-04-09 09:18 蓝勃斐重新开始 阅读(158) 评论(0) 推荐(0) 编辑
摘要: Cpu有几个核,就设几个进程 阅读全文
posted @ 2018-04-09 09:00 蓝勃斐重新开始 阅读(148) 评论(0) 推荐(0) 编辑
摘要: 非关系型数据库:MongoDB。关系型数据库:MySQL 关系型和非关系型的区别: 安装: 使用: 应用场景: mongoDB是一种非关系型数据库,分为四大类:键值存储数据库,列存储数据库,文档型数据库,图形数据库。 重点学习mysql 阅读全文
posted @ 2018-04-09 08:45 蓝勃斐重新开始 阅读(146) 评论(0) 推荐(0) 编辑
摘要: lxml库:是xml解析库,也支持html文档解析功能,实用功能:自动修正补全html代码。 使用流程:①导入lxml中的etree库,②利用etree.HTML(文件名)或etree.parse(本地打开,路径)进行初始化,③etree库把HTML文档解析为Element对象。 from lxml 阅读全文
posted @ 2018-04-08 16:53 蓝勃斐重新开始 阅读(258) 评论(0) 推荐(0) 编辑
摘要: import requests import re import time headers={ #'User-Agent':'Nokia6600/1.0 (3.42.1) SymbianOS/7.0s Series60/2.0 Profile/MIDP-2.0 Configuration/CLDC-1.0' 'User-Agent':'Mozilla/5.0 (Wind... 阅读全文
posted @ 2018-04-08 15:40 蓝勃斐重新开始 阅读(252) 评论(0) 推荐(0) 编辑
摘要: 介绍常用的三种方法:search(),sub(),findall() search():匹配并提取第一个符合规律的内容,然后返回一个正则表达式的对象 #提取字符串中的第一个数字 import re a='a1b2d3f4' infos=re.search('\d+',a) print(infos) 阅读全文
posted @ 2018-04-08 10:42 蓝勃斐重新开始 阅读(200) 评论(0) 推荐(0) 编辑
摘要: 正则表达式:是一个特殊的符号系列,检查字符串是否与指定模式匹配。 python中的re模块拥有全部的正则表达式功能。 判断字符: 类型: 数目:有无: 个数:单值 区间 离散 判断一个字符: 表示一个字符:①确定 (1)字符 a,b,1,4 (2)转义字符 \. ②完全不确定 (.) 匹配任意单个字 阅读全文
posted @ 2018-04-08 09:03 蓝勃斐重新开始 阅读(154) 评论(0) 推荐(0) 编辑
摘要: 啦啦,网站屏蔽太严重。很难完成 阅读全文
posted @ 2018-04-03 17:12 蓝勃斐重新开始 阅读(145) 评论(0) 推荐(0) 编辑
摘要: 三大库:requests,lxml,beautifulSoup. Request库作用:请求网站获取网页数据。 get()的基本使用方法 #导入库 import requests #向网站发送请求,获取数据。 res= requests.get(‘http://bj.xiaozhu.com/’) # 阅读全文
posted @ 2018-03-30 11:23 蓝勃斐重新开始 阅读(328) 评论(0) 推荐(0) 编辑