随笔分类 - 【58】机器学习
摘要:环境 spark-1.6 python3.5 一、有无截距对于逻辑回归分类,就是找到z那条直线,不通过原点有截距的直线与通过原点的直线相比,有截距更能将数据分类的彻底。 二、线性不可分问题对于线性不可分问题,可以使用升高维度的方式转换成线性可分问题。低维空间的非线性问题在高维空间往往会成为线性问题。
阅读全文
摘要:环境 spark-1.6 python3.5 一、逻辑回归逻辑回归又叫logistic回归分析,是一种广义的线性回归分析模型。线性回归要求因变量必须是连续性的数据变量,逻辑回归要求因变量必须是分类变量,可以是二分类或者多分类(多分类都可以归结到二分类问题),逻辑回归的输出是0~1之间的概率。比如要分
阅读全文
摘要:环境 spark-1.6 python3.5 一、线性回归 二、spark MLLIB案例 结果:
阅读全文
摘要:环境 spark-1.6 python3.5 一、wordcount 二、PVUV
阅读全文
摘要:环境 spark-1.6 python3.5 一、python开发spark原理使用python api编写pyspark代码提交运行时,为了不破坏spark原有的运行架构,会将写好的代码首先在python解析器中运行(cpython),Spark代码归根结底是运行在JVM中的,这里python借助
阅读全文