12 2018 档案

摘要:notebook1.md NoteBook学习(一) Zeppelin VS Jupyter1 NoteBook是什么?比IDE更受数据科学家欢迎的数据处理工具,笔记本。提供了基于浏览器的交互式分析环境,数据科学家可以使用Python、Scala或者R进行交互式的开发,来设计分析模型,可视化展现分析 阅读全文
posted @ 2018-12-28 11:54 独孤风 阅读(3855) 评论(0) 推荐(0) 编辑
摘要:Zeppelin官网地址: http://zeppelin.apache.org/ Github地址: https://github.com/apache/zeppelin (参照官网) 1、什么是zeppelin 多用途的笔记本。数据的采集 发现 分析 可视化 协作。。 支持20+种后端语言,支持 阅读全文
posted @ 2018-12-27 13:35 独孤风 阅读(1144) 评论(0) 推荐(0) 编辑
摘要:逻辑回归(Logistic Regression) 线性回归用来预测,逻辑回归用来分类。 线性回归是拟合函数,逻辑回归是预测函数 逻辑回归就是分类、 分类问题用线性方程是不行的 线性方程拟合的是连续的值 逻辑回归是分类问题 比如肿瘤问题 只有 0 ,1 两种情况 逻辑回归的方程写成 X是特征向量 t 阅读全文
posted @ 2018-12-14 16:58 独孤风 阅读(471) 评论(0) 推荐(0) 编辑
摘要:Spark核心API [SparkContext] 连接到spark集群,入口点. [HadoopRDD] 读取hadoop上的数据, [MapPartitionsRDD] 针对父RDD的每个分区提供了函数构成的新类型RDD. [PairRDDFunctions] 对偶RDD函数类。 可用于KV类型 阅读全文
posted @ 2018-12-12 16:15 独孤风 阅读(196) 评论(0) 推荐(0) 编辑
摘要:添加针对scala文件的编译插件 <?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema 阅读全文
posted @ 2018-12-11 17:17 独孤风 阅读(235) 评论(0) 推荐(0) 编辑
摘要:官网对Spark的介绍 http://spark.apache.org/ Apache Spark™ is a unified analytics engine for large-scale data processing Lightning-fast cluster computing。 快如闪 阅读全文
posted @ 2018-12-10 17:21 独孤风 阅读(655) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示