摘要:
如何建立数据分析思维 建立你的指标体系 如果你不能衡量它,那么你就不能有效增长它。 人对世界上所有的事情的认知都是千人千面的。很容易陷入各自的“认知陷阱”中,抱着对自己紧紧看到的冰山一角草率的得出结论,最后做出的决策也必然存在一些局限性。 那么数据分析的思维,就是建立一套完善的指标体系,可以完整的描 阅读全文
摘要:
1、类,类就像是负责特定项目的主管,交给主管干这件事情,主管可以让手下的人分别去完成自己该干的活,最后综合起来把结果交给主管传递出去,即完成任务。 1、注意类的名称的首个字母最好大写(以规整日后书写习惯)。(当然不大写程序也不会报错) 2、类中一定要有一个初始化方法,并且init前后分别两道下划线, 阅读全文
摘要:
1、字典 创建字典,alien_0={'color':'green','points':5}其中由一个又一个的“键-值”对组成。 访问键-值对相应的值,print(alien_0['color']),可以得到green 添加键-值对,alien_0["x_position"]=100,这里前提是al 阅读全文
摘要:
python是一个效率极高的语言,现在市面上的机器学习大部分是由python和R语言完成,所以在不久之前小仙心中便种下了学习python的想法。下面是这一个月多月以来学习的总结,都是基础中基础了。 1、打印字符串: print("hijijiahfur")、print(variable_name), 阅读全文
摘要:
前面的博客有介绍过对连续的变量进行线性回归分析,从而达到对因变量的预测或者解释作用。那么如果因变量是离散变量呢?在做行为预测的时候通常只有“做”与“不做的区别”、“0”与“1”的区别,这是我们就要用到logistic分析(逻辑回归分析,非线性模型)。 参数解释(对变量的评价) 发生比(odds): 阅读全文
摘要:
回归分析即,量化因变量受自变量影响的大小,建立线性回归方程或者非线性回归方程,从而达对因变量的预测,或者对因变量的解释作用。 回归分析流程如下: ①探索性分析,画不同变量之间的散点图,进行相关性检验等,了解数据的大致情况,以及得知重点关注那几个变量; ②变量和模型选择,; ③回归分析假设条件验证; 阅读全文
摘要:
实际意义 判别分析于聚类分析的功能差不多,区别在于,聚类分析之前,没有人知道具体的是怎么分的类,分了哪几大类。而判别分析是已经把类别给分好,要做的是把没有分好类的数据观测,按照之前分好的类再进行分类。这里不同于生活中常见的分类先有具体的分类逻辑(这里叫做判别函数)。所以判别分的难点在于先由分好类的数 阅读全文
摘要:
顾名思义,对数据的变量或者观测进行分类。 常见的分类方法有:层次法(凝聚式、分裂式适合,适合观测少的,不需要输入类别数)、划分法(开始阶段直接指定某几个类中心,适合观测多的情形,需要输入类别数)。 检测分类好坏的标准:同一类的相似,不同类的几乎不具备相似性(殊途殊归,同途同归)。 一般情况下使用距离 阅读全文
摘要:
主成分分析,主成份是原始变量的线性组合,在考虑所有主成份的情况下主成份和原始变量间是可以逆转的。即“简化变量”,将变量以不同的系数合起来,得到好几个复合变量,然后在从中挑几个能表示整体的复合变量就是主成份,然后计算得分。 因子分析,公共因子和原始变量的关系是不可逆转的,但是可以通过回归得到。是将变量 阅读全文
摘要:
方差分析的主要功能就是验证两组样本,或者两组以上的样本均值是否有显著性差异(是否一致)。 这里有两个大点需要注意:①方差分析的原假设是:样本不存在显著性差异(即,均值完全相等);②两样本数据无交互作用(即,样本数据独立)这一点在双因素方差分析中判断两因素是否独立时用。 原理 方差分析的原理就一个方程 阅读全文