摘要: 原文见https://github.com/MLEveryday/100-Days-Of-ML-Code/blob/master/Code/Day%201_Data_Preprocessing.md Day_1 warning解决方法: 第三步:处理丢失数据 warning: 文档: sklearn 阅读全文
posted @ 2019-04-04 15:22 昊天无鸣 阅读(1315) 评论(0) 推荐(0) 编辑
摘要: 6.安装Hadoop 1)在Hadoop网站下,下载稳定版的并且已经编译好的二进制包,并解压缩。 2)设置环境变量: 3)修改配置文件(etc/hadoop/hadoop-env.sh),添加下面的命令(这里需要注意JAVA_HOME的设置需要根据自己机器的实际情况进行设置): 4) 修改配置文件( 阅读全文
posted @ 2017-02-05 12:13 昊天无鸣 阅读(576) 评论(0) 推荐(0) 编辑
摘要: 接【Hadoop大数据分析与挖掘实战】(一) 5.配置ssh免登陆 1)启动三台机器,分别修改机器名为master、slave1、slave2,重启系统。 2)修改master上的/etc/hosts。 3)将hosts文件复制到slave1和slave2。 4)在master机器上使用hadoop 阅读全文
posted @ 2017-02-03 10:13 昊天无鸣 阅读(471) 评论(0) 推荐(0) 编辑
摘要: 这是一本书的名字,叫做【Hadoop大数据分析与挖掘实战】,我从2017.1开始学习 软件版本为Centos6.4 64bit,VMware,Hadoop2.6.0,JDK1.7. 但是这本书的出版时间为2016.1,待到我2017.1使用时,一部分内容已经发生了翻天覆地的变化。 于是我开始写这么一个博客,把这些记录下来。 阅读全文
posted @ 2017-01-20 21:34 昊天无鸣 阅读(1757) 评论(1) 推荐(1) 编辑