摘要: 高级数据操作工具,将数据存储为dataframe的数据结构。 注:将brics.csv文件放到D:/Documents下。 列的获取 添加咧 行的获取 元素的获取 阅读全文
posted @ 2017-02-07 22:14 派。 阅读(149) 评论(0) 推荐(0) 编辑
摘要: 数据可视化 1.折线图 2.散点图 3.直方图 4.轴的标签 5.标题 6.刻度 7.加入历史数据 阅读全文
posted @ 2017-02-07 21:45 派。 阅读(198) 评论(0) 推荐(0) 编辑
摘要: Spark1.6.2.2.3 PCA 算法介绍: 主成分分析是一种统计学方法,它使用正交转换从一系列可能相关的变量中提取线性无关变量集,提取出的变量集中的元素称为主成分。使用PCA方法可以对变量集合进行降维。下面的示例将会展示如何将5维特征向量转换为3维主成分向量。 scala代码 由于是spark 阅读全文
posted @ 2017-02-07 12:08 派。 阅读(374) 评论(0) 推荐(0) 编辑
摘要: Python List numpy array numpy数组:元素只有一种类型,否则会转换成字符串。 不同的类型,不同的行为 numpy的构造子集 二维numpy数组 ndarray=n维数组 阅读全文
posted @ 2017-02-07 00:19 派。 阅读(337) 评论(0) 推荐(0) 编辑