燕麦拿铁

2020年4月24日

摘要：问题：在使用pandas库读取数据时，由于数据特征过多导致结果显示不全或者数据自动换行显示解决方法：利用pd.set_option()进行设置具体代码如下： pd.set_option('display.max_columns', 100) # 显示全部列 pd.set_option('disp 阅读全文

posted @ 2020-04-24 17:54 燕麦拿铁阅读(2351) 评论(0) 推荐(0) 编辑

2020年4月23日

流量数据运营 - 概述

摘要：一. 什么是流量这里所谓的流量指的是从数字设备上访问企业的网站、APP应用、智能设备的用户行为对于企业运营来说，用户是基础，而流量是获得用户的第一步应用领域：互联网、广告、电子商务等相关行业二. 流量的三个方面三. 流量数据化运营的意义背景：在媒体信息时代，用户行为移动化、需求个性化的复阅读全文

posted @ 2020-04-23 15:05 燕麦拿铁阅读(878) 评论(0) 推荐(0) 编辑

2020年4月22日

变量名称批量重命名

摘要： 1. 选中需要更改的变量名 2. 快捷键 Shift + F6 或右击选择Refactor - Rename 阅读全文

posted @ 2020-04-22 21:51 燕麦拿铁阅读(361) 评论(0) 推荐(0) 编辑

数据分析相关问题整理

摘要： 1.如何理解过拟合？过拟合和欠拟合一样，都是数据挖掘的基本概念。过拟合指的就是数据训练得太好，在实际的测试环境中可能会产生错误，所以适当的剪枝对数据挖掘算法来说也是很重要的。欠拟合则是指机器学习得不充分，数据样本太少，不足以让机器形成自我认知。 2.为什么说朴素贝叶斯是“朴素”的？朴素贝叶斯是阅读全文

posted @ 2020-04-22 20:03 燕麦拿铁阅读(177) 评论(0) 推荐(0) 编辑

2020年4月21日

数据清洗 - 缺失值

摘要： 1. 数据缺失分类行记录的缺失，又称数据记录丢失列值的缺失，即数据记录中某些列（变量）的值空缺 2. 数据列缺失的处理思路 2.1 丢弃缺失值所在的行或者列整体删除，减少缺失数据对总体的影响整行删除的前提：缺失行占总体的比例非常低，一般在5%以内整列删除（对应变量删除）的前提：缺失值占整列阅读全文

posted @ 2020-04-21 22:00 燕麦拿铁阅读(1275) 评论(0) 推荐(0) 编辑

数据预处理 - 先导篇

摘要： 1. 数据预处理的作用数据分析过程中的重要环节直接决定了后期所有数据工作的质量和价值输出对建立模型的最终结果起到决定性的作用 2. 数据预处理的主要内容数据清洗数据转换数据降维样本不均衡数据抽样共线性问题相关性标准化离散化非结构化数据阅读全文

posted @ 2020-04-21 18:02 燕麦拿铁阅读(189) 评论(0) 推荐(0) 编辑

2020年4月20日

关联分析 - 商品交叉销售分析

摘要：一. 项目需求根据用户购买的商品，对购买数据做关联分析获得用户的商品频繁模式，比如哪些商品经常被一起购买根据用户的频繁模式，可以做相应的打包销售或产品组合销售二. 项目数据数据特征：交易ID（order_id）和商品名称（product_name）数据格式：事务性数据唯一性：每次交易只阅读全文

posted @ 2020-04-20 20:26 燕麦拿铁阅读(1486) 评论(1) 推荐(0) 编辑

2020年4月19日

关联分析 - 商品交叉销售分析-基础知识

摘要： 1. 交叉销售概念：借助CRM（客户关系管理），发现现有客户的多种需求，并通过满足其需求而实现销售多种相关的服务或产品的营销方式。优点：可以满足客户需求多样化，提升客户的忠诚度，有效的减少客户的流失率可以节约公司寻求新客户的成本可以提高客户对公司的信赖程度交叉销售和数据挖掘：交叉销售是以阅读全文

posted @ 2020-04-19 15:45 燕麦拿铁阅读(1034) 评论(0) 推荐(0) 编辑

2020年4月18日

用户分析-基于交易数据的精细化用户管理

摘要：一. 项目背景精细化运营是针对人群、场景、流程做差异化细分运营的运营策略。一般情况在产品进入稳定增长的阶段后，需要提升用户的覆盖，以更好的服务不同属性的用户，来提升运营效率和效果。精细化运营中人群精细化尤为重要，精细化的前提是CRM（用户关系管理），而用户关系管理的核心即用户分类。用户价值细阅读全文

posted @ 2020-04-18 18:49 燕麦拿铁阅读(711) 评论(0) 推荐(0) 编辑

人生会遇到好的事情，也会遇到不好的事情，这就是人生

公告