摘要: 0x01 简介 Mahout 是一套具有可扩充能力的机器学习类库。它提供机器学习框架的同时,还实现了一些可扩展的机器学习领域经典算法的实现,可以帮助开发人员更加方便快捷地创建智能应用程序。通过和 Apache Hadoop 分布式框架相结合,Mahout 可以有效地使用分布式系统来实现高性能计算。 阅读全文
posted @ 2017-07-11 21:26 ning-wang 阅读(1027) 评论(1) 推荐(1) 编辑
摘要: "原文链接" 0x01 简介 当我们编写Python代码时,我们得到的是一个包含Python代码的以 为扩展名的文本文件。要运行代码,就需要Python解释器去执行 文件。 0x02 Python解释器类型 CPython 当我们从 "Python官方网站" 下载并安装好Python 3.6后,我们 阅读全文
posted @ 2017-06-30 16:05 ning-wang 阅读(171) 评论(0) 推荐(0) 编辑
摘要: 0x01 命令行交互 在交互式环境的提示符 下,直接输入代码,按回车,就可以立刻得到代码执行结果。现在,试试输入 ,看看计算结果是不是 : 让Python打印出指定的文字,可以用 函数,然后把希望打印的文字用单引号或者双引号括起来,但不能混用单引号和双引号: 用 退出Python。至此,Python 阅读全文
posted @ 2017-06-27 15:18 ning-wang 阅读(2150) 评论(0) 推荐(0) 编辑
摘要: 0x01 环境说明 OS: CentOS 6.5 x86_64 java: jdk1.8.0_111 hadoop: hadoop 2.6.5 hive: hive 2.1.1 0x02 安装配置 2.1 下载 下载地址:http://www.apache.org/dyn/closer.cgi/hi 阅读全文
posted @ 2017-06-25 19:33 ning-wang 阅读(978) 评论(0) 推荐(1) 编辑
摘要: 0x01 安装 1.1 说明 目前,Python有两个版本,一个是 版,一个是 版,这两个版本是 的。 本教程安装的是 版本。 Python官网: "https://www.python.org/" Python下载地址: "https://www.python.org/downloads/" 1. 阅读全文
posted @ 2017-06-23 10:35 ning-wang 阅读(1195) 评论(2) 推荐(1) 编辑
摘要: 0x01 软件环境 Spark 官方提供了三种集群部署方案: , , 。其中 Standalone 最为方便,本文主要讲述结合 的部署方案。 软件环境: CentOS_6.5_x64 hadoop 2.5.2 jdk 1.8.111 scala 2.11.11 spark 2.1.0 0x02 安装 阅读全文
posted @ 2017-06-12 19:00 ning-wang 阅读(557) 评论(0) 推荐(1) 编辑
摘要: 0x01 问题描述 将 的编码格式设置为 之后,在 窗口输出中文乱码。 0x02 解决办法 控制台显示的时候缺省的是使用系统默认的字符集,比如windows下用的是 ,但是默认情况下,编译之后的执行文件时编译成 的,所以又出现了不统一,乱码由此而生! 搞懂了乱码产生的原因,那么不难得出结论,如何修改 阅读全文
posted @ 2017-02-27 20:23 ning-wang 阅读(5368) 评论(0) 推荐(1) 编辑
摘要: 0x01 软件环境 OS: CentOS 6.5 x86_64 JDK: jdk 8u111 linux x64 Hadoop: hadoop 2.6.5 Zookeeper: zookeeper 3.4.6 Hbase: hbase 0.98.24 0x02 集群概况 | IP | hostnam 阅读全文
posted @ 2017-02-26 22:00 ning-wang 阅读(232) 评论(0) 推荐(1) 编辑
摘要: [TOC] 0x01 ntp安装 1.1 检查时间服务器是否安装 1.2 设置ntp自启动 按上面的安装方式在内网每台服务器上都安装好 软件包。 完成后,都需要配置 服务为自启动 1.3 手动同步时间 在配置前,先使用 手动同步下时间,免得本机与外部时间服务器时间差距太大,让 不能正常同步。 0x0 阅读全文
posted @ 2017-02-25 23:09 ning-wang 阅读(371) 评论(0) 推荐(0) 编辑
摘要: 0x00 环境说明 OS: CentOS 6.5 x86_64 JDK: jdk 8u111 linux x64 Hadoop: hadoop 2.6.5 Zookeeper: zookeeper 3.4.6 0x01 简介 Zookeeper是一个很好的集群管理工具,被大量用于分布式计算。如Had 阅读全文
posted @ 2017-02-19 18:18 ning-wang 阅读(550) 评论(1) 推荐(1) 编辑