摘要: 1、分类检查未知分类或暂时未知分类的数据,其目的是预测数据属于哪一类或将要分到哪一类。分类已知的相似数据用于研究分类规则,然后将这些规则应用于未知分类数据中。2、预测预测是指对数值型连续变量的预测,而不是分类变量。3、关联规则和推荐系统关联规则或关联性分析是指,在大型数据库的事项中找出一般关联模式, 阅读全文
posted @ 2020-03-13 18:29 夏日的向日葵 阅读(1191) 评论(0) 推荐(0) 编辑
摘要: 一、Hadoop概述 Hadoop实现了一个分布式文件系统,简称HDFS。Hadoop在数据提取、变形和加载(ETL)方面有着天然的优势。Hadoop的HDFS实现了文件的大批量存储,Hadoop的MapReduce功能实现了将单个任务打碎,将碎片任务(Map)发送到多个节点上,之后再以单个数据集的 阅读全文
posted @ 2020-03-13 18:27 夏日的向日葵 阅读(772) 评论(0) 推荐(0) 编辑