打赏

01 2017 档案

摘要:最近,需要这个知识点,看到网上各种繁多复杂的资料,自己梳理个思路。 不多说,直接上干货! 简述:将L列、M列和N列,相加放到O列。(当然这里是相邻的列)。同时,也可以求相隔几列的某些列相加。 阅读全文
posted @ 2017-01-18 23:59 大数据和AI躺过的坑 阅读(1124) 评论(0) 推荐(0) 编辑
摘要:Azkaban是什么?(一) Azkaban的功能特点(二) Azkaban的架构(三) Hadoop工作流引擎之Azkaban与Oozie对比(四) 不多说,直接上干货! http://www.cnblogs.com/zlslch/category/938837.html 准备这四个 Azkaba 阅读全文
posted @ 2017-01-18 12:07 大数据和AI躺过的坑 阅读(5236) 评论(0) 推荐(0) 编辑
摘要:Azkaban是什么?(一) Azkaban的功能特点(二) Azkaban的架构(三) 不多说,直接上干货! http://www.cnblogs.com/zlslch/category/938837.html 目前,市面上最流行的两种Hadoop工作流引擎调度器Azkaban与Oozie。 具体 阅读全文
posted @ 2017-01-18 12:03 大数据和AI躺过的坑 阅读(17074) 评论(0) 推荐(1) 编辑
摘要:Azkaban是什么?(一) Azkaban的功能特点(二) 不多说,直接上干货! http://www.cnblogs.com/zlslch/category/938837.html Azkaban的架构 Azkaban是一种类似于Oozie的工作流控制引擎,可以用来解决多个Hadoop(或Spa 阅读全文
posted @ 2017-01-18 11:49 大数据和AI躺过的坑 阅读(3035) 评论(0) 推荐(1) 编辑
摘要:Azkaban是什么?(一) 不多说,直接上干货! http://www.cnblogs.com/zlslch/category/938837.html Azkaban的功能特点 它具有如下功能特点: 1、Web用户界面 2、方便上传工作流 3、方便设置任务之间的关系 4、工作流调度 5、认证/授权 阅读全文
posted @ 2017-01-18 11:21 大数据和AI躺过的坑 阅读(2994) 评论(0) 推荐(0) 编辑
摘要:不多说,直接上干货! 为此,需要第三方框架。如Azkaban或Oozie! Azkaban https://azkaban.github.io/ 具体,见我的博客,Azkaban概念学习系列。http://www.cnblogs.com/zlslch/category/938837.html Azk 阅读全文
posted @ 2017-01-18 11:04 大数据和AI躺过的坑 阅读(394) 评论(0) 推荐(0) 编辑
摘要:不多说,直接上干货! 这只是部分,做个引子。 未完,待续! 阅读全文
posted @ 2017-01-18 10:30 大数据和AI躺过的坑 阅读(415) 评论(0) 推荐(0) 编辑
摘要:不多说,直接上干货! Hadoop的ChainMapper和ChainReducer使用案例(链式处理) 什么是ChainMapper/ChainReducer? 阅读全文
posted @ 2017-01-18 10:14 大数据和AI躺过的坑 阅读(335) 评论(0) 推荐(0) 编辑
摘要:工作流(Workflow),指“业务过程的部分或整体在计算机应用环境下的自动化”。是对工作流程及其各操作步骤之间业务规则的抽象、概括描述。在计算机中,工作流属于计算机支持的协同工作(CSCW)的一部分。后者是普遍地研究一个群体如何在计算机的帮助下实现协同工作的。 什么是工作流--JBPM? 推荐一篇 阅读全文
posted @ 2017-01-18 10:08 大数据和AI躺过的坑 阅读(1286) 评论(0) 推荐(0) 编辑
摘要:不多说,这里,直接上干货!从这篇博客起,逐步分享如下: 1、工作流 2、Hadoop工作流(内置) 3、第三方框架--Azkaban(推荐外安装) 阅读全文
posted @ 2017-01-18 09:19 大数据和AI躺过的坑 阅读(450) 评论(0) 推荐(0) 编辑
摘要:不多说,直接上干货! Hadoop的MR作业支持链式处理,类似在一个生产牛奶的流水线上,每一个阶段都有特定的任务要处理,比如提供牛奶盒,装入牛奶,封盒,打印出厂日期,等等,通过这样进一步的分工,从而提高了生产效率,那么在我们的Hadoop的MapReduce中也是如此,支持链式的处理方式,这些Map 阅读全文
posted @ 2017-01-18 08:59 大数据和AI躺过的坑 阅读(994) 评论(0) 推荐(0) 编辑
摘要:不多说,直接上干货! http://www.cnblogs.com/zlslch/category/938837.html Azkaban是什么? Azkaban是一套简单的任务调度服务,整体包括三部分webserver、dbserver、executorserver。 是linkin的开源项目,开 阅读全文
posted @ 2017-01-17 19:45 大数据和AI躺过的坑 阅读(22177) 评论(0) 推荐(0) 编辑
摘要:先看,前一期博客,理清好思路。 爬虫概念与编程学习之如何爬取网页源代码(一) 爬虫概念与编程学习之如何爬取视频网站页面(用HttpClient)(二) 不多说,直接上代码。 编写代码 运行 <!DOCTYPE html><html><head><meta http-equiv="X-UA-Compa 阅读全文
posted @ 2017-01-13 17:08 大数据和AI躺过的坑 阅读(4294) 评论(0) 推荐(0) 编辑
摘要:先看,前一期博客,理清好思路。 爬虫概念与编程学习之如何爬取网页源代码(一) 不多说,直接上代码。 编写代码 运行 <!DOCTYPE html><html><head><meta http-equiv="X-UA-Compatible" content="IE=Edge" /><meta http 阅读全文
posted @ 2017-01-13 16:46 大数据和AI躺过的坑 阅读(4051) 评论(0) 推荐(0) 编辑
摘要:直接,去看一个网页的源代码,这个很简单! 1、新建maven项目 2、选择代码保存位置 3、选择quickstart 4、设置Group Id和Artifact Id 5、得到新建好的maven项目 pom.xml里需要自行添加(httpclient 4.4 、htmlcleaner 2.10 ) 阅读全文
posted @ 2017-01-11 23:23 大数据和AI躺过的坑 阅读(5115) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示