摘要: 简单线性回归 步骤: 1、读取数据 2、画出散点图,求x和y 的相关系数:plt.scatter(x,y),x和y是dataframe 3、估计参数模型,建立回归模型:lrModel=LinearRegression() 4、训练模型: lrModel.fit(x,y) 5、对回归模型进行检验: l 阅读全文
posted @ 2018-10-03 23:27 我不要被你记住 阅读(3091) 评论(0) 推荐(0) 编辑
摘要: 所需模块 numpy、pandas 相关系数计算 首先使用numpy.mean()方法求出均值,Xsd=numpy.std()方法求出标准差; 然后在通过(X-Xmean)/Xsd公式求出z分数; 最后通过numpy.sum(ZX*ZY)/len(X) 使用内置函数直接计算 1、使用numpy的内置 阅读全文
posted @ 2018-10-03 21:48 我不要被你记住 阅读(8333) 评论(0) 推荐(0) 编辑
摘要: 使用sklearn包 CountVectorizer是通过fit_transform函数将文本中的词语转换为词频矩阵 get_feature_names()可看到所有文本的关键字 vocabulary_可看到所有文本关键字和其位置 toarray()可以看到词频矩阵的结果 TfidfTransfor 阅读全文
posted @ 2018-10-03 11:41 我不要被你记住 阅读(2325) 评论(0) 推荐(0) 编辑