摘要:
一、Hadoop简介1.1、Hadoop主要进行分布式存储和分布式计算 1.1-1、HDFS:分布式文件系统 1.1-2、MapReduce:并行计算框架1.2、Hadoop用来做什么? 搭建大型的数据仓库 搜索引擎、日志分析、数据挖掘1.3、优势: 高扩展、低成本、成熟的生态圈二、Had... 阅读全文
摘要:
一、运行R语言可以做哪些事?1、探索性数据分析(将数据绘制图表)2、统计推断(根据数据进行预测)3、回归分析(对数据进行拟合分析)4、机器学习(对数据集进行训练和预测)5、数据产品开发二、R语言包的使用1、安装包 install.packages()//安装https://cran.r-proje... 阅读全文