摘要:
客户数据库中有三个神奇的要素,这三个要素构成了数据分析最好的指标: 最近一次消费(Recency) 消费频率(Frequency) 消费金额(Monetary) 最近一次消费(Recency) 消费频率(Frequency) 消费金额(Monetary) RFM模型是衡量客户价值和客户创利能力的重要 阅读全文
摘要:
目录 4.1 数据清洗 4.1.1 缺失值处理 4.1.2 异常值处理 4.2 数据集成 4.2.1 实体识别 4.2.2 冗余属性识别 4.3 数据变换 4.3.1 简单函数变换 4.3.2 规范化 4.3.3 连续属性离散化 4.3.4 属性构造 4.3.5 小波变换 4.4 数据规约 4..4 阅读全文
摘要:
pandas使用浮点值NaN表示浮点和非浮点数组中的缺失数据。它只是一个便于被检测出来的标记而已: Python内置的None值也会被当做NA处理: NA处理方法 dropna 根据各标签的值中是否存在缺失数据对轴标签进行过滤,可通过阈值调节对缺失值的容忍度 fillna 用指定值或插值方法(如ff 阅读全文