摘要: 问题:在使用pandas库读取数据时,由于数据特征过多导致结果显示不全或者数据自动换行显示 解决方法:利用pd.set_option()进行设置 具体代码如下: pd.set_option('display.max_columns', 100) # 显示全部列 pd.set_option('disp 阅读全文
posted @ 2020-04-24 17:54 燕麦拿铁 阅读(2351) 评论(0) 推荐(0) 编辑
摘要: 一. 什么是流量 这里所谓的流量指的是从数字设备上访问企业的网站、APP应用、智能设备的用户行为 对于企业运营来说,用户是基础,而流量是获得用户的第一步 应用领域:互联网、广告、电子商务等相关行业 二. 流量的三个方面 三. 流量数据化运营的意义 背景:在媒体信息时代,用户行为移动化、需求个性化的复 阅读全文
posted @ 2020-04-23 15:05 燕麦拿铁 阅读(878) 评论(0) 推荐(0) 编辑
摘要: 1. 选中需要更改的变量名 2. 快捷键 Shift + F6 或右击选择Refactor - Rename 阅读全文
posted @ 2020-04-22 21:51 燕麦拿铁 阅读(361) 评论(0) 推荐(0) 编辑
摘要: 1.如何理解过拟合? 过拟合和欠拟合一样,都是数据挖掘的基本概念。过拟合指的就是数据训练得太好,在实际的测试环境中可能会产生错误,所以适当的剪枝对数据挖掘算法来说也是很重要的。 欠拟合则是指机器学习得不充分,数据样本太少,不足以让机器形成自我认知。 2.为什么说朴素贝叶斯是“朴素”的? 朴素贝叶斯是 阅读全文
posted @ 2020-04-22 20:03 燕麦拿铁 阅读(177) 评论(0) 推荐(0) 编辑
摘要: 1. 数据缺失分类 行记录的缺失,又称数据记录丢失 列值的缺失,即数据记录中某些列(变量)的值空缺 2. 数据列缺失的处理思路 2.1 丢弃 缺失值所在的行或者列整体删除,减少缺失数据对总体的影响 整行删除的前提:缺失行占总体的比例非常低,一般在5%以内 整列删除(对应变量删除)的前提:缺失值占整列 阅读全文
posted @ 2020-04-21 22:00 燕麦拿铁 阅读(1275) 评论(0) 推荐(0) 编辑
摘要: 1. 数据预处理的作用 数据分析过程中的重要环节 直接决定了后期所有数据工作的质量和价值输出 对建立模型的最终结果起到决定性的作用 2. 数据预处理的主要内容 数据清洗 数据转换 数据降维 样本不均衡 数据抽样 共线性问题 相关性 标准化 离散化 非结构化数据 阅读全文
posted @ 2020-04-21 18:02 燕麦拿铁 阅读(189) 评论(0) 推荐(0) 编辑
摘要: 一. 项目需求 根据用户购买的商品,对购买数据做关联分析 获得用户的商品频繁模式,比如哪些商品经常被一起购买 根据用户的频繁模式,可以做相应的打包销售或产品组合销售 二. 项目数据 数据特征:交易ID(order_id)和商品名称(product_name) 数据格式:事务性数据 唯一性:每次交易只 阅读全文
posted @ 2020-04-20 20:26 燕麦拿铁 阅读(1486) 评论(1) 推荐(0) 编辑
摘要: 1. 交叉销售 概念:借助CRM(客户关系管理),发现现有客户的多种需求,并通过满足其需求而实现销售多种相关的服务或产品的营销方式。 优点: 可以满足客户需求多样化,提升客户的忠诚度,有效的减少客户的流失率 可以节约公司寻求新客户的成本 可以提高客户对公司的信赖程度 交叉销售和数据挖掘:交叉销售是以 阅读全文
posted @ 2020-04-19 15:45 燕麦拿铁 阅读(1034) 评论(0) 推荐(0) 编辑
摘要: 一. 项目背景 精细化运营是针对人群、场景、流程做差异化细分运营的运营策略。 一般情况在产品进入稳定增长的阶段后,需要提升用户的覆盖,以更好的服务不同属性的用户,来提升运营效率和效果。 精细化运营中人群精细化尤为重要,精细化的前提是CRM(用户关系管理),而用户关系管理的核心即用户分类。 用户价值细 阅读全文
posted @ 2020-04-18 18:49 燕麦拿铁 阅读(711) 评论(0) 推荐(0) 编辑