摘要: 输出 阅读全文
posted @ 2019-07-30 20:08 Rener 阅读(95) 评论(0) 推荐(0) 编辑
摘要: https://zhidao.baidu.com/question/689931018470753924.html df.cov(x) 指的是x的无偏估计矩阵 df.corr(x) 指的是x的协方差矩阵 df.var(x) 指的是x的方差矩阵 阅读全文
posted @ 2019-07-29 23:51 Rener 阅读(276) 评论(0) 推荐(0) 编辑
摘要: 商品数据化运营关键指标 销售类指标 订单量/商品销售量 订单金额/商品销售金额 没订单金额/客单价/件单价 订单转换率 支付转化率 有效订单量/有效订单金额/有效商品销售量/有效商品销售额 订单有效率/废单率 毛利/毛利率 促销活动指标 每订单成本/每有效订单成本 每优惠券效益/每积分兑换收益 活动 阅读全文
posted @ 2019-07-28 11:30 Rener 阅读(659) 评论(0) 推荐(0) 编辑
摘要: enumerate() 循环读出每个列的索引值和列名 for col_num, col_name in enumerate(df): dataframe.groupby(条件选择) 用法 DataFrame.groupby(by=None, axis=0, level=None, as_index= 阅读全文
posted @ 2019-07-25 10:28 Rener 阅读(233) 评论(0) 推荐(0) 编辑
摘要: 全模式和精确模式 jieba.cut() 返回迭代器 jieba.lcut() 返回list 参数 需要分词的字符串(unicode 或 UTF 8 字符串、GBK 字符串) cut_all 参数:是否使用全模式,默认值为 False HMM 参数:用来控制是否使用 HMM 模型,默认值为 True 阅读全文
posted @ 2019-07-24 21:39 Rener 阅读(192) 评论(0) 推荐(0) 编辑
摘要: 数据拆分 from sklearn.model_selection import train_test_split 用法:X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.3, random_state=0) t 阅读全文
posted @ 2019-07-24 15:12 Rener 阅读(107) 评论(0) 推荐(0) 编辑
摘要: np.array(列表) 语法:np.array([2,3,4]) 常用语法 numpy.hstack(tup) tup:ndarrays数组序列,除了一维数组的堆叠可以是不同长度外,其它数组堆叠时,除了第二个轴(列)的长度可以不同外,其它轴的长度必须相同。 示例 np.random np.rand 阅读全文
posted @ 2019-07-24 12:07 Rener 阅读(130) 评论(0) 推荐(0) 编辑
摘要: os.path.abspath 语法:os.path.abspath(__file__) 当前模块的绝对路径,返回:'F:\python\datayunying\yunying\4_guanlianfenxi.py' 语法:os.path.abspath('.') 包含一个点:当前模块的父目录,返回 阅读全文
posted @ 2019-07-24 11:29 Rener 阅读(101) 评论(0) 推荐(0) 编辑
摘要: sys.path 此时sys.path 返回的是一个列表!该路径已经添加到系统的环境变量了 sys.path.append 当我们要添加自己的搜索目录时,可以通过列表的append()方法 把路径添加到系统的环境变量,或把该路径的文件夹放进已经添加到系统环境变量的路径内。\ 环境变量的内容会自动添加 阅读全文
posted @ 2019-07-24 11:22 Rener 阅读(130) 评论(0) 推荐(0) 编辑
摘要: 聚类分析 常用方法 k均值,DBSCAN,两步聚类,BIRCH,谱聚类 解决的问题 数据集分为几类 每个类别有多少样本量 不同类别各个变量的强弱关系 不同类别的典型特征是什么 超大数据量时应该放弃K均值算法,可以考虑Mini Batch KMeans 回归分析 主要应用场景 计划制定,KPI制定,目 阅读全文
posted @ 2019-07-23 15:53 Rener 阅读(166) 评论(0) 推荐(0) 编辑