2020年4月3日
摘要: Hadoop平台的搭建流程之单机/伪分布配置 所需工具:VMware Workstation / Virtual Box 虚拟机; Hadoop安装文件; 实验环境:Ubuntu 32位或64位系统 / CentOS系统; ps: 该实验教程采用Ubuntu 64位系统进行讲解。 Ubuntu安装系 阅读全文
posted @ 2020-04-03 18:14 CC陈三愿 阅读(790) 评论(0) 推荐(0) 编辑
摘要: 前言:Windows和Linux系统之间共享文件的方式大致分为三种,一是通过ftp或sftp协议,二是通过http协议,三是通过ssh协议。 前两者一般都需要在远程服务器配置ftp或http服务后才能使用,而ssh协议基本上是所有的linux系统都默认支持的,可用来远程登录。 SSH Secure 阅读全文
posted @ 2020-04-03 18:12 CC陈三愿 阅读(916) 评论(0) 推荐(0) 编辑
摘要: 当数据集中包含大量特征时: - 有些特征包含丰富的预测信息; - 有些特征之间具有一定的相关性; - 有些特征只包含噪声或不相关信息; 只保留有意义的特征不仅可以使数据集易于管理,而且可以使预测结果不受数据中噪声的影响,预测精度更好。 维数约简 消除输入数据集的某些特征,创建一个有限特征的数据集(包 阅读全文
posted @ 2020-04-03 15:09 CC陈三愿 阅读(744) 评论(0) 推荐(0) 编辑