摘要: 正则解析 单字符: . : 除换行以外所有字符 [] :[aoe] [a-w] 匹配集合中任意一个字符 \d :数字 [0-9] \D : 非数字 \w :数字、字母、下划线、中文 \W : 非\w \s :所有的空白字符包,括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。 \S : 阅读全文
posted @ 2019-06-04 21:46 z1115230598 阅读(198) 评论(0) 推荐(0) 编辑
摘要: 什么是requests模块 requests模块是python中原生的基于网络请求的模块,其主要作用是用来模拟浏览器发起请求。功能强大,用法简洁高效。在爬虫领域中占据着半壁江山的地位。 优点:自动处理url编码 自动处理post请求参数 简化cookie和代理操作 如何使用requests模块 安装 阅读全文
posted @ 2019-06-04 21:41 z1115230598 阅读(227) 评论(0) 推荐(0) 编辑
摘要: django相关 阅读全文
posted @ 2019-06-04 21:03 z1115230598 阅读(84) 评论(0) 推荐(0) 编辑
摘要: 什么是爬虫 爬虫就是通过编写程序模拟浏览器上网,然后让其去互联网上抓取数据的过程。 哪些语言可以实现爬虫 1.php:可以实现爬虫.但是php在实现爬虫中支持多线程和多进程方面做的不好。 2.java:可以实现爬虫。java可以非常好的处理和实现爬虫,是唯一可以与python并驾齐驱且是python 阅读全文
posted @ 2019-06-04 20:52 z1115230598 阅读(157) 评论(0) 推荐(0) 编辑