摘要: 尽可能的使用内置函数处理数据 len 进行列表计数 过滤一个列表使用列表推导式 [n for n in [1,2,3,4] if n%2] 善用异常 try: user.name except AttributeError: pass 使用in进行列表元素检查 去重使用set() 列表排序使用 [1,2,4].sort() 迭代循环放到函数里面 de... 阅读全文
posted @ 2020-04-08 14:14 raisok 阅读(95) 评论(0) 推荐(0) 编辑
摘要: tensorflow的定义 tensorflow是一个采用数据流图,用于数值计算的开源的软件库。本质上可以认为是一个数据库,tensorflow可以作为 Tensor(张量)意味着N维数组,Flow(流)意味 tensorflow 网站 中文:https://tensorflow.google.cn/ 英文:https://tensorflow.org/ github:https://... 阅读全文
posted @ 2020-04-08 14:11 raisok 阅读(268) 评论(0) 推荐(0) 编辑
摘要: one_hot (独热)编码,和dummy variable(哑变量)的区别: one_hot 类别变量中n个不同类别转换为n个变量 dummy variable 在某一设定的参考准则下,对n个不同的类别,转换为n-1个变量 pandas 将标签转化为独热编码 pd.get_dummies(df_NMF['cluster']).head(20) tensorflow 将标签转化为独热... 阅读全文
posted @ 2020-04-08 14:11 raisok 阅读(1410) 评论(0) 推荐(0) 编辑
摘要: 定义 Mann-Whitney 秩和检验,也被称为 Mann-Whitney-U 检验,是另一类非参数检验方法,它们不对数据分布作特殊假设,因而能适用于更复杂的数据分布情况。 秩和检验的做法是,首先将两类样本混合在一起,对所有样本按照所考察的特征从小到大排序。在两类样本中分别计算所得排序序号之和T1 和T2 ,称作秩和。两类的样本数分别是n1个和n2。秩和检验的基本思想是,如果一类样本的秩和显... 阅读全文
posted @ 2020-04-08 14:06 raisok 阅读(4795) 评论(0) 推荐(0) 编辑
摘要: 卡方检验的定义 卡房检验可以来检验两个因素的关联性,但是不能直接表示出关联的强弱,常见的2x2卡方和列联表组合。 卡方检验是一种非参数检验方法。 相对来说,非参数检验对数据分布的要求比较宽松,并且也不要求太大数据量。 卡方检验是一种对计数资料的假设检验方法,主要是比较理论频数和实际频数的吻合程度。 常用于特征选择,比如,检验男人和女人在是否患有高血压上有无区别,如果有区别,则说明性别与是否患有... 阅读全文
posted @ 2020-04-08 14:01 raisok 阅读(2379) 评论(0) 推荐(0) 编辑
摘要: Odds ratio(OR)从字面上可看出,是两个odds的ratio,其用于: 在病例对照研究(case-control study)中,分析暴露风险因素与疾病(或者用药)的关联程度;主要是反映暴露与疾病之间关联强度的指标,OR常适用于病例对照研究,也可以运用于前瞻性的研究(当观察时间相等时) 与 阅读全文
posted @ 2020-04-08 14:01 raisok 阅读(4822) 评论(0) 推荐(0) 编辑
摘要: 方差分析 试验指标:试验中要考察的指标,即收入 因素:影响试验指标的条件,如性别,年龄 水平:因素所处的状态,比如性别的分为男,女 单因素试验:在一项试验中只有一个因素改变 多因素试验:在一项试验中有多个因素改变 单因素方差分析 方差分析(Analysis of Variance,简称ANOVA),又称F检验,用于两个及两个以上样本均数差别的显著性检验。方差分析主要是考虑各组之间的均... 阅读全文
posted @ 2020-04-08 14:00 raisok 阅读(1462) 评论(0) 推荐(0) 编辑