摘要: 初识pyecharts: 什么是pyecharts? pyecharts=python+echarts 而Echarts 是一个由百度开源的数据可视化工具,有着良好的交互性,精巧的图表设计能力。当Python与Echarts结合就形成了pyecharts. 有了matplotlib和seaborn为 阅读全文
posted @ 2021-08-04 17:33 瑶池里 阅读(1489) 评论(0) 推荐(0) 编辑
摘要: 我们还是用相亲网站的数据来建立模型预测一个人是否约会成功: 根据大数定律我们知道当数据足够多的时候频率等于概率,所以数据越大,我们用贝叶斯算法预测的越准确 > ##加载数据集:相亲网站约会数据 > setwd("/Users/yaozhilin/Downloads/R_edu/data") > Da 阅读全文
posted @ 2020-11-14 12:13 瑶池里 阅读(462) 评论(0) 推荐(0) 编辑
摘要: 我们拿一个婚恋网站的数据来做knn模型:自变量收入、吸引力、资产,教育和是否约会成功。我们利用这些数据做一个小的预测约会是否成功的模型 > ##加载数据集 > Data<-read.csv("date_data2.csv") > #数据需要标准化 > x<-scale(Data[,c(1,2,3,4 阅读全文
posted @ 2020-11-13 23:36 瑶池里 阅读(1000) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2020-11-13 12:01 瑶池里 阅读(146) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2020-11-13 11:15 瑶池里 阅读(102) 评论(0) 推荐(0) 编辑
摘要: 层次聚类 1、定义每一个观测量为一类 2、计算每一类与其他各类的距离 3、把距离最短的两类合为一类 4、重复步骤2和3,直到包含所有的观测量合并成单类时 > ##########################聚类算法 > ####层次聚类 > par(mfrow = c(1,1)) > data( 阅读全文
posted @ 2020-11-04 17:43 瑶池里 阅读(3750) 评论(0) 推荐(0) 编辑
摘要: C5.0 > ###########################决策树 > ########C5.0 > setwd("/Users/yaozhilin/Downloads/R_edu/data") > orgdata<-read.csv("Allelectronics.csv") > summ 阅读全文
posted @ 2020-11-04 17:26 瑶池里 阅读(630) 评论(1) 推荐(0) 编辑
摘要: > ###############逻辑回归 > setwd("/Users/yaozhilin/Downloads/R_edu/data") > accepts<-read.csv("accepts.csv") > names(accepts) [1] "application_id" "accou 阅读全文
posted @ 2020-11-04 14:06 瑶池里 阅读(296) 评论(0) 推荐(0) 编辑
摘要: 前文我们讲到线性回归建模会有共线性的问题,岭回归和lasso算法都能一定程度上消除共线性问题。 岭回归 > #########正则化方法消除共线性 > ###岭回归 > ###glmnet只能处理矩阵 > library(glmnet) > library(mice) > creditcard_ex 阅读全文
posted @ 2020-11-04 11:29 瑶池里 阅读(6011) 评论(0) 推荐(0) 编辑
摘要: > ############################################线性回归 > setwd("/Users/yaozhilin/Downloads/R_edu/data") > creditcard_exp<-read.csv("creditcard_exp.csv") > 阅读全文
posted @ 2020-11-04 10:46 瑶池里 阅读(624) 评论(0) 推荐(0) 编辑