摘要:
初识pyecharts: 什么是pyecharts? pyecharts=python+echarts 而Echarts 是一个由百度开源的数据可视化工具,有着良好的交互性,精巧的图表设计能力。当Python与Echarts结合就形成了pyecharts. 有了matplotlib和seaborn为 阅读全文
摘要:
我们还是用相亲网站的数据来建立模型预测一个人是否约会成功: 根据大数定律我们知道当数据足够多的时候频率等于概率,所以数据越大,我们用贝叶斯算法预测的越准确 > ##加载数据集:相亲网站约会数据 > setwd("/Users/yaozhilin/Downloads/R_edu/data") > Da 阅读全文
摘要:
我们拿一个婚恋网站的数据来做knn模型:自变量收入、吸引力、资产,教育和是否约会成功。我们利用这些数据做一个小的预测约会是否成功的模型 > ##加载数据集 > Data<-read.csv("date_data2.csv") > #数据需要标准化 > x<-scale(Data[,c(1,2,3,4 阅读全文
摘要:
阅读全文
摘要:
阅读全文
摘要:
层次聚类 1、定义每一个观测量为一类 2、计算每一类与其他各类的距离 3、把距离最短的两类合为一类 4、重复步骤2和3,直到包含所有的观测量合并成单类时 > ##########################聚类算法 > ####层次聚类 > par(mfrow = c(1,1)) > data( 阅读全文
摘要:
C5.0 > ###########################决策树 > ########C5.0 > setwd("/Users/yaozhilin/Downloads/R_edu/data") > orgdata<-read.csv("Allelectronics.csv") > summ 阅读全文
摘要:
> ###############逻辑回归 > setwd("/Users/yaozhilin/Downloads/R_edu/data") > accepts<-read.csv("accepts.csv") > names(accepts) [1] "application_id" "accou 阅读全文
摘要:
前文我们讲到线性回归建模会有共线性的问题,岭回归和lasso算法都能一定程度上消除共线性问题。 岭回归 > #########正则化方法消除共线性 > ###岭回归 > ###glmnet只能处理矩阵 > library(glmnet) > library(mice) > creditcard_ex 阅读全文
摘要:
> ############################################线性回归 > setwd("/Users/yaozhilin/Downloads/R_edu/data") > creditcard_exp<-read.csv("creditcard_exp.csv") > 阅读全文