hank-li - 博客园

2019年3月30日

摘要： from lxml import etree html = """ 1 子 2 子 3 子 4 子 5 子 """ # 1.转类型 x_data ... 阅读全文

posted @ 2019-03-30 11:15 hank-li 阅读(75) 评论(0) 推荐(0) 编辑

摘要： import re import requests # 安装支持解析html和XML的解析库 lxml # pip install lxml from lxml import etree url = 'http://news.baidu.com/' headers = { "User-Agent": 'Mozilla/5.0 (Macintosh; Intel Mac OS X 1... 阅读全文

posted @ 2019-03-30 11:14 hank-li 阅读(101) 评论(0) 推荐(0) 编辑

6.02-news_re

摘要： import re import requests url = 'http://news.baidu.com/' headers = { "User-Agent": 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Saf... 阅读全文

posted @ 2019-03-30 11:13 hank-li 阅读(197) 评论(0) 推荐(0) 编辑

6.01-re-split_chinese

摘要： import re # 1.拆分字符串 one = 'asdsfsgsh' # 标准是 s 为拆分 pattern = re.compile('s') result = pattern.split(one) # print(result) # 2.匹配中文 two = '网页是最新版本的,适配移动端' # python中匹配中问 [a-z] unicode的范围 * + ? pat... 阅读全文

posted @ 2019-03-30 11:11 hank-li 阅读(124) 评论(0) 推荐(0) 编辑

2019年3月27日

Python3爬虫利用百度地图api得到城市经纬度

摘要：有2种方式，第一种是利用urllib , 方法1：利用urllib ，先把url 转成urlcode,然后读取网页，读到网页再用json读取内容，比较麻烦。可以在浏览器输入，看一下格式。 2.将查询转换为urlcode 读取网页内容：读取json数据：程序: 方法二：利用request模块，阅读全文

posted @ 2019-03-27 15:45 hank-li 阅读(2986) 评论(0) 推荐(0) 编辑

5.06-re

摘要： import re # 贪婪模式从开头匹配到结尾默认 # 非贪婪 one = 'mdfsdsfffdsn12345656n' two = "a\d" pattern = re.compile('a\b') # pattern = re.compile('m(.*?)n') result = pattern.findall(two) print(result) import r... 阅读全文

posted @ 2019-03-27 04:50 hank-li 阅读(136) 评论(0) 推荐(0) 编辑

5.05-requests_cookies2

摘要： import requests # 请求数据url member_url = 'https://www.yaozh.com/member/' headers = { 'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/7... 阅读全文

posted @ 2019-03-27 04:36 hank-li 阅读(102) 评论(0) 推荐(0) 编辑

2019年3月26日

5.04-requests_cookies

摘要： import requests # 请求数据url member_url = 'https://www.yaozh.com/member/' headers = { 'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/7... 阅读全文

posted @ 2019-03-26 23:08 hank-li 阅读(155) 评论(0) 推荐(0) 编辑

5.03-requests_ssl

摘要： import requests url = 'https://www.12306.cn/mormhweb/' headers = { 'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.67 Safar... 阅读全文

posted @ 2019-03-26 22:59 hank-li 阅读(111) 评论(0) 推荐(0) 编辑

5.02-requests_proxy

摘要： import requests # 1.请求url url = 'http://www.baidu.com' headers = { 'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.67 Safar... 阅读全文

posted @ 2019-03-26 20:51 hank-li 阅读(112) 评论(0) 推荐(0) 编辑

Hank

求学之路无坦途,问艺之路无捷径.

公告