01 2017 档案

Flume 入门--几种不同的Sinks
摘要:主要介绍几种常见Flume的Sink--汇聚点 1.Logger Sink 记录INFO级别的日志,一般用于调试。前面介绍Source时候用到的Sink都是这个类型的Sink 必须配置的属性: 属性说明: !channel – !type – The component type name, nee 阅读全文

posted @ 2017-01-10 21:33 波比12 阅读(9875) 评论(1) 推荐(0) 编辑

Flume 入门--几种不同的Sources
摘要:1.flume概念 flume是分布式的,可靠的,高可用的,用于对不同来源的大量的日志数据进行有效收集、聚集和移动,并以集中式的数据存储的系统。 flume目前是apache的一个顶级项目。 flume需要java运行环境,要求java1.6以上,推荐java1.7. 将下载好的flume安装包解压 阅读全文

posted @ 2017-01-09 22:28 波比12 阅读(23185) 评论(1) 推荐(0) 编辑

urllib+BeautifulSoup无登录模式爬取豆瓣电影Top250
摘要:对于简单的爬虫任务,尤其对于初学者,urllib+BeautifulSoup足以满足大部分的任务。 1、urllib是Python3自带的库,不需要安装,但是BeautifulSoup却是需要安装的。安装方式:pip install beautifulsoup4 其官方文档中文版地址:https:/ 阅读全文

posted @ 2017-01-06 15:54 波比12 阅读(1466) 评论(0) 推荐(0) 编辑

导航

< 2025年4月 >
30 31 1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 1 2 3
4 5 6 7 8 9 10
点击右上角即可分享
微信分享提示