摘要: 用4个空格,或者设置Tab代替4个空格。 对Spyder设置PEP8规则检测警告,可以有效改善编码习惯: Preferences > Editor > Code Introspection/Analysis,然后勾选Style analysis(PEP8)。 用4个空格,或者设置Tab代替4个空格。 阅读全文
posted @ 2019-10-27 15:36 数之美 阅读(12456) 评论(0) 推荐(0) 编辑
摘要: 迭代器就是访问集合元素,有一个next()方法的对象,而不是通过索引来计数的。 好几个G的数据, 使用了迭代器后,内存使用大幅度减少,这是迭代器最大的优点。 列表、字符串等都是可迭代的,即可遍历可循环的,但是要通过ITER函数变成一个迭代器,方能实现for/while等遍历循环。 示例: >>>i= 阅读全文
posted @ 2019-10-27 15:34 数之美 阅读(349) 评论(0) 推荐(0) 编辑
摘要: >>>a=1 >>>b=a >>>a=a++1 >>>print b 1 >>>a=[1,2,3] >>>b=a >>>a.append(4) >>>print b [1,2,3,4] 阅读全文
posted @ 2019-10-27 15:32 数之美 阅读(187) 评论(0) 推荐(0) 编辑
摘要: https://www.cnblogs.com/xqnq2007/p/7429584.html 当使用python编程时,编码问题一直很让人头疼,程序中经常会碰到如下错误提示: UnicodeDecodeError: 'ascii' codec can't decode byte 0x?? in p 阅读全文
posted @ 2019-10-27 15:31 数之美 阅读(1361) 评论(0) 推荐(0) 编辑
摘要: https://blog.csdn.net/qq_34706955/article/details/80807091 https://blog.csdn.net/qq_34706955/article/details/80807091 Spyder(Scientific PYthon Develop 阅读全文
posted @ 2019-10-27 15:30 数之美 阅读(2681) 评论(0) 推荐(0) 编辑
摘要: Q:Python是一款解释型语言 A:https://blog.csdn.net/u012184539/article/details/81348780 计算机是不能理解高级语言的,更不能直接执行高级语言,它只能直接理解机器语言,所以使用任何高级语言编写的程序若想被计算机运行,都必须将其转换成计算机 阅读全文
posted @ 2019-10-27 15:22 数之美 阅读(1981) 评论(0) 推荐(0) 编辑
摘要: R语言几乎专注于统计分析,其第三方包无数,有着统计学的深度以及各学科统计分析应用的广度。R语言作为正统统计学软件,数据分析则是其应有之义,R语言算是与Matlab、SAS在同一起跑线上。当Python开始涉足数据分析领域时,其便渐渐形成了与R语言分庭抗礼的趋势:有着更深互联网基因的Python要比更 阅读全文
posted @ 2019-10-27 15:20 数之美 阅读(1794) 评论(0) 推荐(0) 编辑
摘要: 在一般认知中,用模型对测试集进行分类预测,结果应该是X或者X'(也可以说是或者否)。根据混淆矩阵算出TP、FP、TN、FN,进一步算出TPR、FPR。一个测试集只会有一对TPR/FPR值,那么ROC曲线就只会有一个点,何谈曲线之说?难道是用多个测试集得到多对TPR/FPR值,来绘制ROC曲线吗?实则 阅读全文
posted @ 2019-10-27 11:02 数之美 阅读(3465) 评论(0) 推荐(0) 编辑
摘要: 我们都知道机器学习要建模,但是对于模型性能的好坏我们并不知道是怎样的,很可能这个模型就是一个差的模型,对测试集不能很好的预测。那么如何知道这个模型是好是坏呢?必须有个评判的标准,需要用某个指标来衡量,这就是性能度量的意义。有了一个指标,就可以对比不同模型了,从而知道哪个模型更好,或者通过这个指标来调 阅读全文
posted @ 2019-10-27 10:59 数之美 阅读(5073) 评论(0) 推荐(0) 编辑
摘要: AdaBoost:Adaptive Boosting(自适应提升),是Boosting系列算法的典型代表。AdaBoost简单来讲,就是多个弱分类器,可能基于单层决策树,也可能基于其他算法;前一个弱分类器得到一个分类结果,根据它的错误率给这个分类器一个权重,还要更新样本的权重;基于这个权重矩阵,再去 阅读全文
posted @ 2019-10-27 10:50 数之美 阅读(1593) 评论(0) 推荐(0) 编辑
摘要: 随机森林(Random Forest,简称RF)是通过集成学习的思想将多棵树集成的一种算法,它的基本单元是决策树。假设现在针对的是分类问题,每棵决策树都是一个分类器,那么N棵树会有N个分类结果。随机森林集成了所有的分类投票结果,将投票次数最多的类别指定为最终输出。它可以很方便的并行训练。 森林表示决 阅读全文
posted @ 2019-10-27 10:47 数之美 阅读(3620) 评论(0) 推荐(0) 编辑
摘要: 机器学习的一大方法分支——集成学习(Ensemble Learning) 集成学习的思想是将若干个个体学习器组合之后产生一个新学习器。也可以说集成学习就是训练若干个个体学习器(大多数文章称为弱学习器),通过一定的结合策略,最终形成一个强学习器,以达到博采众长的目的。 也就是说集成学习只关注两个问题: 阅读全文
posted @ 2019-10-27 10:45 数之美 阅读(329) 评论(0) 推荐(0) 编辑
摘要: 介绍EM算法,必然会抛出一些比较复杂的公式。其实这些公式只是EM算法思想的数学推导,数学推导就是将算法思想用严谨的公式语言表达出来而已。理解EM算法思想,比看懂它的数学推导重要。 EM即最大期望算法(Expectation Maximization algorithm),是在高斯混合模型中寻找参数最 阅读全文
posted @ 2019-10-27 10:43 数之美 阅读(485) 评论(0) 推荐(0) 编辑