摘要:
re模块 re引擎由c编写 .元字符 一个.代表匹配一个任意字符(除了\n),下面代码表示2个字符在中间 ['lxxl'] ^元字符 字符开头为标准,只匹配开头,如代码,当str开头为l满足^的条件,然后继续匹配其他条件 ['lgdl'] 贪婪匹配:有多少匹配多少 $元字符 $匹配文本结束 \ 元字 阅读全文
摘要:
目标爬取社会信用码 http://125.35.6.84:81/xk/ 1.首先界面是一个简单的分页查询 2.刷新一下,发现数据是ajax请求的 3.查相关参数 4.点击一条记录进去 5.发现数据也是ajax请求的 6.查看参数发现,是根据之前的ID查询的 7.开始work,首先爬取前面数据的ID, 阅读全文