摘要: 官方文档:http://scikit-learn.org/stable/modules/linear_model.html 一、线性回归实践 1、导入相关库,并查看数据情况 2、对于预测的变量,查看分布情况 3、对于几个特征,查看与因变量的关系 结论:三个特征,前两个与销量呈现明显的线性关系,第三个 阅读全文
posted @ 2018-03-13 12:41 杰哥哥是谁 阅读(296) 评论(0) 推荐(0) 编辑
摘要: 一、线性回归 1、基本形式 其中:W表示了各个属性在变量中的权重 2、线性回归求解 损失函数的推导过程运用高斯分布+极大似然估计推导如下 所有样本满足这个公式:,其中e是误差项,假设满足高斯分布,可以写出概率分布函数如下 ,将e带入到概率分布函数中得到 运用极大似然估计方法,,然后取对数,得到对数似 阅读全文
posted @ 2018-03-12 12:34 杰哥哥是谁 阅读(432) 评论(0) 推荐(0) 编辑
摘要: 使用书籍:《Tableau:数据可视化之极速BI》 配套数据:网上下载的 安装教程:使用时间驻留器 #################################################################### 分割线。。。。 ####################### 阅读全文
posted @ 2018-03-09 14:20 杰哥哥是谁 阅读(476) 评论(0) 推荐(0) 编辑
摘要: 一、基础设置 导入相关的库 默认不显示中文,因此需要更改设置,显示中文 设置全局变量 二、导入数据,并查看 三、作图(matplotlib) 1、折线图 2、柱形图 3、横轴的柱形图 4、饼图 5、散点图 6、几个区域的画图方法(一种是用上面的柱形图那种方法 fig,ax = plt.subplot 阅读全文
posted @ 2018-02-23 14:08 杰哥哥是谁 阅读(6662) 评论(0) 推荐(1) 编辑
摘要: 一、埋点如何做 数据的收集可以通过外部的工具比如:友盟和talking data等,不过部分深层次的用户行为数据还是需要做埋点收集的 做埋点时,一般需要两个表,一个是埋点事件表,一个是埋点统计表 1、埋点事件表: 数据埋点事件表一般是记录每个页面的交互事件,一般是后台记录次数。比如点击登录按钮的次数 阅读全文
posted @ 2018-02-23 11:46 杰哥哥是谁 阅读(5689) 评论(0) 推荐(0) 编辑
摘要: 一、什么是AARRR模型 AARRR分别代表了五个单词,分别是产品生命周期中的五个阶段: 获取(Acquisition):用户如何发现(并来到)你的产品? 激活(Activation):用户的第一次使用体验如何? 留存(Retention):用户是否还会回到产品(重复使用)? 收入(Revenue) 阅读全文
posted @ 2018-02-23 11:17 杰哥哥是谁 阅读(5892) 评论(0) 推荐(0) 编辑
摘要: # -*- coding: utf-8 -*- """ Created on Mon Oct 9 14:05:41 2017 @author: lenovo """ import numpy as np import pandas as pd #载入数据,合并测试集和训练集做特征处理 data_train = pd.read_csv('./input/train.csv') data_t... 阅读全文
posted @ 2017-10-09 17:02 杰哥哥是谁 阅读(466) 评论(0) 推荐(0) 编辑
摘要: 一、一般模型 结果是:0.82222222222222219 二、加入正则项: 结果是:0.77777777777777779 阅读全文
posted @ 2017-10-06 12:49 杰哥哥是谁 阅读(382) 评论(0) 推荐(0) 编辑
摘要: 输出结果:0.97777777777777775 阅读全文
posted @ 2017-10-06 12:47 杰哥哥是谁 阅读(363) 评论(0) 推荐(0) 编辑
摘要: 一、普通的线性模型 二、加入正则化的模型 Ridge回归 Lasso回归 阅读全文
posted @ 2017-10-05 20:25 杰哥哥是谁 阅读(648) 评论(1) 推荐(0) 编辑