会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
玉然
Powered by
博客园
博客园
|
首页
|
新随笔
|
联系
|
订阅
|
管理
2019年3月14日
数据提取方法
摘要: 数据提取就是从响应中提取我们想要的数据的过程一、json1.是一种轻量级的数据交换格式,它使的人们容易进行阅读和编写。同时也方便了机器进行解析和生成,适用于数据交互的场景,比如网站与后台之间的数据交互2.在数据交换中起到了一个载体的作用,承载着相互传递的数据二、XPATH和LXML类库1.lxml是
阅读全文
posted @ 2019-03-14 15:24 玉然
阅读(788)
评论(0)
推荐(0)
编辑
爬虫原理和数据抓取
摘要: 1.网络爬虫,就是模拟客户端发送网络请求,接收请求相应,一种按照一定的规则,自动地抓取互联网信息的程序也就是说:只要是浏览器能做的事,原则上,爬虫都能做2.爬虫分为通用爬虫(通常指搜索引擎的爬虫)聚焦爬虫(针对特定网站的爬虫)3.http:超文本传输协议,默认端口号是80https:http+ssl
阅读全文
posted @ 2019-03-14 09:11 玉然
阅读(387)
评论(0)
推荐(0)
编辑
Web与Http基础
摘要: Web与Http基础一、三大前端技术:HTML、CSS、JavaScript同时html文件、css文件、js文件也是浏览器渲染网页需要的三种文件二、HTML1.html是超文本标记语言的缩写2.不区分大小写3.html语言是标签化的,这些标签最终会形成一个DOM Tree4.html文档是由服务器
阅读全文
posted @ 2019-03-14 09:02 玉然
阅读(77)
评论(0)
推荐(0)
编辑