2018年12月5日

大道至简: 拉新、促活和留存

摘要: 互联网运营中的拉新、促活和留存思维,从来不局限于互联网产品里,在传统行业里也是通用的,比如一家理发店的经营也是如此。 互联网运营中的拉新、促活和留存思维,从来不局限于互联网产品里,在传统行业里也是通用的。比如一家理发店的经营。这几年互联网很火,很多人都想着转行做互联网。互联网公司里的工种很多,产品、 阅读全文

posted @ 2018-12-05 14:31 布衣小工 阅读(1752) 评论(0) 推荐(1) 编辑

2018年11月1日

数据处理速查表

摘要: Python数据科学速查表 - Python 基础 Python数据科学速查表 - 导入数据 Python数据科学速查表 - Jupyter Notebook 数据处理系列推出的内容包括:Numpy、Pandas 及 SciPy: Python数据科学速查表 - Numpy 基础 Python数据科 阅读全文

posted @ 2018-11-01 17:37 布衣小工 阅读(357) 评论(0) 推荐(0) 编辑

轻松看懂机器学习十大常用算法

摘要: 转载链接:https://www.jianshu.com/p/55a67c12d3e9 通过本篇文章可以对ML的常用算法有个常识性的认识,没有代码,没有复杂的理论推导,就是图解一下,知道这些算法是什么,它们是怎么应用的,例子主要是分类问题。 每个算法都看了好几个视频,挑出讲的最清晰明了有趣的,便于科 阅读全文

posted @ 2018-11-01 16:58 布衣小工 阅读(294) 评论(0) 推荐(0) 编辑

2018年10月29日

数据拼接

摘要: 真实值与预测值合并 阅读全文

posted @ 2018-10-29 10:06 布衣小工 阅读(134) 评论(0) 推荐(0) 编辑

2018年10月25日

可视化---seaborn

摘要: 变量说明 x,y,hue 数据集变量 变量名 date 数据集 数据集名 row,col 更多分类变量进行平铺显示 变量名 col_wrap 每行的最高平铺数 整数 estimator 在每个分类中进行矢量到标量的映射 矢量 ci 置信区间 浮点数或None n_boot 计算置信区间时使用的引导迭 阅读全文

posted @ 2018-10-25 18:39 布衣小工 阅读(173) 评论(0) 推荐(0) 编辑

可视化---matplotlib

摘要: 中文乱码 多画布 折线图 多条线 柱状图 直方图 柱状图VS直方图 区别: 1.直方图展示数据的分布,柱状图比较数据的大小。 2.直方图X轴为定量数据,柱状图X轴为分类数据。 3.直方图柱子无间隔,柱状图柱子有间隔 散点图 箱线图 阅读全文

posted @ 2018-10-25 17:09 布衣小工 阅读(214) 评论(0) 推荐(0) 编辑

数据预处理--数据选择

摘要: 筛选空值 求均值 数据透视表 排序 列名处理 按列类型过滤 查看类型变量类别个数 类型转换 数据筛选 多个dataframe合并处理 多个列合并 阅读全文

posted @ 2018-10-25 16:13 布衣小工 阅读(279) 评论(0) 推荐(0) 编辑

数据预处理--样本选择、交叉验证

摘要: 1.样本下采样选择 交叉验证选择最优参数: 绘制混淆矩阵 查看不同阈值对应召回率 阅读全文

posted @ 2018-10-25 15:28 布衣小工 阅读(1119) 评论(0) 推荐(0) 编辑

模型评估---交叉验证

摘要: 1.原始交叉验证 2.cross_validation交叉验证 交叉验证中混合模型分类 阅读全文

posted @ 2018-10-25 11:29 布衣小工 阅读(301) 评论(0) 推荐(0) 编辑

数据预处理--缺失值处理

摘要: 用中位数填充缺失值 titanic["Age"] = titanic["Age"].fillna(titanic["Age"].median()) 用固定值填充 titanic["Embarked"] = titanic["Embarked"].fillna('S') 阅读全文

posted @ 2018-10-25 11:02 布衣小工 阅读(167) 评论(0) 推荐(0) 编辑

导航