2020年4月3日
摘要: 朴素贝叶斯是一种经典的分类方法,其原理在高中或大学的概率论部分学习了很多了,下面开始介绍在Spark环境下使用MLlib来使用Naive Bayes来对网站性质进行分类判断。 第一步:导入库函数 import sysfrom time import timeimport pandas as pdim 阅读全文
posted @ 2020-04-03 22:57 桌子哥 阅读(277) 评论(0) 推荐(0) 编辑
摘要: 支持向量机是一个应用很广的机器学习模型,利用核空间变换可以将数据从一个空间变换到另外一个空间当中,从而使得数据呈现出更清晰的分布。支持向量机不论是在工业界还是在学界都有举足亲重的意义,在学界,基于支持向量机的改进方法有很多,通过算法层面的改进可以得到一种针对特定数据情况的优质算法,从而能更好的解决实 阅读全文
posted @ 2020-04-03 17:16 桌子哥 阅读(581) 评论(0) 推荐(0) 编辑
摘要: 同上一部分的内容,在进行二分类问题时,逻辑斯蒂回归也是一种常用的分类方法。逻辑斯蒂回归使用了一个Sigmoid函数来作为核心的内容来实现分类的思想,接下里介绍在Pyspark中使用MLlib来实现逻辑斯蒂回归。 第一步:导入需要的库函数 import sysfrom time import time 阅读全文
posted @ 2020-04-03 15:47 桌子哥 阅读(456) 评论(0) 推荐(0) 编辑