Hi，王松柏 - 博客园

Hadoop概念学习系列之Hadoop集群动态增加新节点或删除已有某节点及复制策略导向

摘要： hadoop-2.6.0动态添加新节点 https://blog.csdn.net/baidu_25820069/article/details/52225216 Hadoop集群动态增加新节点一、在新增节点配置运行环境 1、安装和其他节点相同的java环境，jdk版本要相同。 2、修改/etc/ 阅读全文

posted @ 2018-05-31 13:32 Hi，王松柏阅读(232) 评论(0) 推荐(0) 编辑

如何在IDEA里给大数据项目导入该项目的相关源码（博主推荐）（类似eclipse里同一个workspace下单个子项目存在）（图文详解）

摘要：如果在一个界面里，可以是单个项目注意：本文是以gradle项目的方式来做的！如何在IDEA里正确导入从Github上下载的Gradle项目（含相关源码）（博主推荐）（图文详解）注意：本文是以maven项目的方式来做的！如何在IDEA里正确导入从Github上下载的Maven项目（含相关源码）阅读全文

posted @ 2018-05-31 13:31 Hi，王松柏阅读(789) 评论(0) 推荐(0) 编辑

如何走上更高平台分享传递干货知识：（开通个人微信公众号：大数据躺过的坑）（图文详解）（博主推荐）

摘要：为了进一步打造提升（大数据躺过的坑）本微信公众平台的博文高质量水平，特邀请善于分享、主动、敢于专研尝试新技术新领域的您，一起共同维护好我们的知识小天地。目前涉及领域有：大数据领域：Hadoop、Hive、HBase、Zookeeper、Flume、Sqoop、Kafka、Spark、Storm、Ze 阅读全文

posted @ 2018-05-31 13:30 Hi，王松柏阅读(1013) 评论(0) 推荐(0) 编辑

CentOS6.5下如何正确下载、安装Intellij IDEA、Scala、Scala-intellij-bin插件、Scala IDE for Eclipse助推大数据开发（图文详解）

摘要：第一步：卸载CentOS中自带openjdk Centos 6.5下的OPENJDK卸载和SUN的JDK安装、环境变量配置第二步：安装Intellij IDEA 若是3节点如，master、slave1、slave2，则建议将其安装在master节点上到https://www.jetbrains 阅读全文

posted @ 2018-05-31 13:27 Hi，王松柏阅读(1742) 评论(0) 推荐(0) 编辑

对于maven创建spark项目的pom.xml配置文件（图文详解）

摘要：不多说，直接上干货！ http://mvnrepository.com/ 这里，怎么创建，见 Spark编程环境搭建（基于Intellij IDEA的Ultimate版本）（包含Java和Scala版的WordCount）（博主强烈推荐) 这里，我重点说下spark项目，因为，对于hadoop这样阅读全文

posted @ 2018-05-31 13:25 Hi，王松柏阅读(27710) 评论(0) 推荐(1) 编辑

Apache-kylin-2.0.0-bin-hbase1x.tar.gz的下载与安装（图文详解）

摘要：首先，对于Apache Kylin的安装，我有话要说。由于Apache Kylin本身只是一个Server，所以安装部署还是比较简单的。但是它的前提要求是Hadoop、Hive、HBase必须已经安装且能正常工作。以下，是我集群环境的情况 Apache kylin的官网安装文档注意：本博文，立阅读全文

posted @ 2018-05-31 13:24 Hi，王松柏阅读(992) 评论(0) 推荐(0) 编辑

数据分析、数据挖掘、机器学习、神经网络、深度学习和人工智能概念区别（入门级别）

摘要：数据分析，就是对数据进行分析，得出一些结论性的内容，用于决策。分析什么哪？根据分析现状、分析原因、预测未来。分析现状和分析原因，需要结合业务才能解释清楚。用到的技术比较简单，最简单的数据分析工具就是 Excel。预测未来指的是分析未来一段时间的销售额之类的。在预测未来方面，阅读全文

posted @ 2018-05-31 13:23 Hi，王松柏阅读(3498) 评论(0) 推荐(0) 编辑

用maven来创建scala和java项目代码环境（图文详解）（Intellij IDEA（Ultimate版本）、Intellij IDEA（Community版本）和Scala IDEA for Eclipse皆适用）（博主推荐）

摘要：为什么要写这篇博客？首先，对于spark项目，强烈建议搭建，用Intellij IDEA（Ultimate版本），如果你还有另所爱好尝试Scala IDEA for Eclipse，有时间自己去玩玩。但最好追随大流。对于hadoop项目，强烈建议用eclipse。其次，出于有博友给我留言的索求阅读全文

posted @ 2018-05-31 13:22 Hi，王松柏阅读(331) 评论(0) 推荐(0) 编辑

数学很差，能学习机器学习吗？

摘要：最近，好多人在问我这个问题。机器学习中的各种算法，都是一个个的数学算式。不会高等数学、概率统计、凸优化等知识，就不能搞透各个数学算式。如果想明白这些算式的来龙去脉，以及如何推导出来的，没有前面的数学知识做铺垫是绝对不可能的。但是，包括很多公司里需要招聘员工，培养的是工程师，不阅读全文

posted @ 2018-05-31 13:22 Hi，王松柏阅读(351) 评论(0) 推荐(0) 编辑

Apache Kylin 是什么？

摘要： Apache Kylin的官网 - 可扩展超快OLAP引擎: Kylin是为减少在Hadoop上百亿规模数据查询延迟而设计 - Hadoop ANSI SQL 接口: Kylin为Hadoop提供标准SQL支持大部分查询功能 - 交互式查询能力: 通过Kylin，用户可以与Hadoop数据进行亚秒级阅读全文

posted @ 2018-05-31 13:21 Hi，王松柏阅读(1615) 评论(0) 推荐(0) 编辑

好记性不如烂笔头！