上一页 1 ··· 33 34 35 36 37 38 39 40 41 ··· 44 下一页

2018年5月31日

Hadoop概念学习系列之Hadoop集群动态增加新节点或删除已有某节点及复制策略导向

摘要: hadoop-2.6.0动态添加新节点 https://blog.csdn.net/baidu_25820069/article/details/52225216 Hadoop集群动态增加新节点 一、在新增节点配置运行环境 1、安装和其他节点相同的java环境,jdk版本要相同。 2、修改/etc/ 阅读全文

posted @ 2018-05-31 13:32 Hi,王松柏 阅读(229) 评论(0) 推荐(0) 编辑

如何在IDEA里给大数据项目导入该项目的相关源码(博主推荐)(类似eclipse里同一个workspace下单个子项目存在)(图文详解)

摘要: 如果在一个界面里,可以是单个项目 注意:本文是以gradle项目的方式来做的! 如何在IDEA里正确导入从Github上下载的Gradle项目(含相关源码)(博主推荐)(图文详解) 注意:本文是以maven项目的方式来做的! 如何在IDEA里正确导入从Github上下载的Maven项目(含相关源码) 阅读全文

posted @ 2018-05-31 13:31 Hi,王松柏 阅读(781) 评论(0) 推荐(0) 编辑

如何走上更高平台分享传递干货知识:(开通个人微信公众号:大数据躺过的坑)(图文详解)(博主推荐)

摘要: 为了进一步打造提升(大数据躺过的坑)本微信公众平台的博文高质量水平,特邀请善于分享、主动、敢于专研尝试新技术新领域的您,一起共同维护好我们的知识小天地。目前涉及领域有:大数据领域:Hadoop、Hive、HBase、Zookeeper、Flume、Sqoop、Kafka、Spark、Storm、Ze 阅读全文

posted @ 2018-05-31 13:30 Hi,王松柏 阅读(1008) 评论(0) 推荐(0) 编辑

CentOS6.5下如何正确下载、安装Intellij IDEA、Scala、Scala-intellij-bin插件、Scala IDE for Eclipse助推大数据开发(图文详解)

摘要: 第一步:卸载CentOS中自带openjdk Centos 6.5下的OPENJDK卸载和SUN的JDK安装、环境变量配置 第二步:安装Intellij IDEA 若是3节点如,master、slave1、slave2,则建议将其安装在master节点上 到https://www.jetbrains 阅读全文

posted @ 2018-05-31 13:27 Hi,王松柏 阅读(1735) 评论(0) 推荐(0) 编辑

对于maven创建spark项目的pom.xml配置文件(图文详解)

摘要: 不多说,直接上干货! http://mvnrepository.com/ 这里,怎么创建,见 Spark编程环境搭建(基于Intellij IDEA的Ultimate版本)(包含Java和Scala版的WordCount)(博主强烈推荐) 这里, 我重点说下spark项目,因为,对于hadoop这样 阅读全文

posted @ 2018-05-31 13:25 Hi,王松柏 阅读(27686) 评论(0) 推荐(1) 编辑

Apache-kylin-2.0.0-bin-hbase1x.tar.gz的下载与安装(图文详解)

摘要: 首先,对于Apache Kylin的安装,我有话要说。 由于Apache Kylin本身只是一个Server,所以安装部署还是比较简单的。但是它的前提要求是Hadoop、Hive、HBase必须已经安装且能正常工作。 以下,是我集群环境的情况 Apache kylin的官网安装文档 注意:本博文,立 阅读全文

posted @ 2018-05-31 13:24 Hi,王松柏 阅读(991) 评论(0) 推荐(0) 编辑

数据分析、数据挖掘、机器学习、神经网络、深度学习和人工智能概念区别(入门级别)

摘要: 数据分析, 就是对数据进行分析, 得出一些结论性的内容, 用于决策。 分析什么哪? 根据分析现状、 分析原因、 预测未来。 分析现状和分析原因, 需要结合业务才能解释清楚。 用到的技术比较简单, 最简单的数据分析工具就是 Excel。 预测未来指的是分析未来一段时间的销售额之类的。 在预测未来方面, 阅读全文

posted @ 2018-05-31 13:23 Hi,王松柏 阅读(3486) 评论(0) 推荐(0) 编辑

用maven来创建scala和java项目代码环境(图文详解)(Intellij IDEA(Ultimate版本)、Intellij IDEA(Community版本)和Scala IDEA for Eclipse皆适用)(博主推荐)

摘要: 为什么要写这篇博客? 首先,对于spark项目,强烈建议搭建,用Intellij IDEA(Ultimate版本),如果你还有另所爱好尝试Scala IDEA for Eclipse,有时间自己去玩玩。但最好追随大流。 对于hadoop项目,强烈建议用eclipse。 其次,出于有博友给我留言的索求 阅读全文

posted @ 2018-05-31 13:22 Hi,王松柏 阅读(329) 评论(0) 推荐(0) 编辑

数学很差, 能学习机器学习吗?

摘要: 最近,好多人在问我这个问题。 机器学习中的各种算法, 都是一个个的数学算式。 不会高等数学、 概率统计、 凸优化等知识, 就不能搞透各个数学算式。 如果想明白这些算式的来龙去脉, 以及如何推导出来的, 没有前面的数学知识做铺垫是绝对不可能的。 但是, 包括很多公司里需要招聘员工,培养的是工程师, 不 阅读全文

posted @ 2018-05-31 13:22 Hi,王松柏 阅读(350) 评论(0) 推荐(0) 编辑

Apache Kylin 是什么?

摘要: Apache Kylin的官网 - 可扩展超快OLAP引擎: Kylin是为减少在Hadoop上百亿规模数据查询延迟而设计 - Hadoop ANSI SQL 接口: Kylin为Hadoop提供标准SQL支持大部分查询功能 - 交互式查询能力: 通过Kylin,用户可以与Hadoop数据进行亚秒级 阅读全文

posted @ 2018-05-31 13:21 Hi,王松柏 阅读(1615) 评论(0) 推荐(0) 编辑

上一页 1 ··· 33 34 35 36 37 38 39 40 41 ··· 44 下一页

导航