摘要: 第三章《数据分析实战》--第三章 python实现主要利用分组统计分析了企业某游戏的销售额下降的主要原因。 这一章主要利用交叉列表(或叫作透视表)的方式来剖析企业用户数量减少的原因。假设是因为某个群体的用户锐减导致当月用户比上个月的用户数少,因此主要利用python中的pandas、matplotl 阅读全文
posted @ 2019-05-16 14:16 beyondChan 阅读(587) 评论(0) 推荐(0) 编辑
摘要: 在商业数据分析流程中主要介绍分析流程以及每个过程的具体含义。这一章主要利用合并汇总来剖析企业销售额下降的原因。主要利用python中的pandas、matplotlib模块完成书中分析。 1、读取数据、合并数据 可以采用如下方式先设置工作路径至数据表放在位置,然后利用 os.getcwd() 来查看 阅读全文
posted @ 2019-05-15 20:06 beyondChan 阅读(579) 评论(0) 推荐(0) 编辑
摘要: 对pandas中的DataFrame进行条件筛选,即筛选出符合条件的数据条;这里经常会遇到以下几种情况,下面举例说明: (1)找出df中A列值为100的所有数据 这里也可以是小于(<)、大于(>)、小于等于(<=)、大于等于(>=)、不等于(!=)等情况。 (2)找出df中A列值为100、200、3 阅读全文
posted @ 2019-05-14 10:57 beyondChan 阅读(87171) 评论(0) 推荐(4) 编辑
摘要: 数据分析大体上的分析结构如下所示(分析流程图如下所示): 首先,需要对现状和预期有一个很好的把握。其次,弄清现状和预期之间的差距,并调查导致差距产生的关键因素,即发现问题。这样的因素可能很多,所以要收集数据和加工,并在此基础上进行数据分析。主要是挖掘出导致此问题发生的关键性因素,然后综合考虑时间成本 阅读全文
posted @ 2019-05-12 15:10 beyondChan 阅读(2408) 评论(0) 推荐(0) 编辑
摘要: 很多情况下,大家可能会遇到相同情况,就是现在有一些数据需要保存在某个文件里面,但是后续会不断更新添加新的数据,例如在爬虫的时候,一页一页爬取数据的时候,当然可以将所有页数据先合并到一起,再保存起来,但是也可以通过下文这种方式,输出一页的数据就保存一次,好像有点麻烦哈,但是如果是其他情况的话,可能就会 阅读全文
posted @ 2019-04-26 20:14 beyondChan 阅读(58122) 评论(0) 推荐(5) 编辑
摘要: 1、首先SettingWithCopyWarning不是一种错误Error而是一种警告Warning。 2、该警告一般是在引用pandas中的数据框时发出的警告,我们知道引用数据框数据的方式挺多的,但是一不小心就会返回这个警告。 3、SettingWithCopyWarning的含义是:(1)你的操 阅读全文
posted @ 2019-04-23 00:07 beyondChan 阅读(897) 评论(0) 推荐(1) 编辑
摘要: 1.无量纲化定义 无量纲化,也称为数据的规范化,是指不同指标之间由于存在量纲不同致其不具可比性,故首先需将指标进行无量纲化,消除量纲影响后再进行接下来的分析。 2.无量纲化方法 无量纲化方法有很多,但是从几何角度来说可以分为:直线型、折线型、曲线形无量纲化方法。 (1)直线型无量纲化方法 直线型无量 阅读全文
posted @ 2019-04-16 19:55 beyondChan 阅读(16489) 评论(0) 推荐(0) 编辑