2019 年 10月 27 日随笔档案 - 数之美

2019年10月27日

摘要：用4个空格，或者设置Tab代替4个空格。对Spyder设置PEP8规则检测警告，可以有效改善编码习惯： Preferences > Editor > Code Introspection/Analysis，然后勾选Style analysis(PEP8)。用4个空格，或者设置Tab代替4个空格。阅读全文

posted @ 2019-10-27 15:36 数之美阅读(12530) 评论(0) 推荐(0) 编辑

迭代器与ITER函数

摘要：迭代器就是访问集合元素，有一个next()方法的对象，而不是通过索引来计数的。好几个G的数据，使用了迭代器后，内存使用大幅度减少，这是迭代器最大的优点。列表、字符串等都是可迭代的，即可遍历可循环的，但是要通过ITER函数变成一个迭代器，方能实现for/while等遍历循环。示例： >>>i= 阅读全文

posted @ 2019-10-27 15:34 数之美阅读(351) 评论(0) 推荐(0) 编辑

变量和按引用传递

摘要： >>>a=1 >>>b=a >>>a=a++1 >>>print b 1 >>>a=[1,2,3] >>>b=a >>>a.append(4) >>>print b [1,2,3,4] 阅读全文

posted @ 2019-10-27 15:32 数之美阅读(187) 评论(0) 推荐(0) 编辑

设置utf-8为默认编码

摘要： https://www.cnblogs.com/xqnq2007/p/7429584.html 当使用python编程时，编码问题一直很让人头疼，程序中经常会碰到如下错误提示： UnicodeDecodeError: 'ascii' codec can't decode byte 0x?? in p 阅读全文

posted @ 2019-10-27 15:31 数之美阅读(1373) 评论(0) 推荐(0) 编辑

Python语言开发环境之Spyder

摘要： https://blog.csdn.net/qq_34706955/article/details/80807091 https://blog.csdn.net/qq_34706955/article/details/80807091 Spyder(Scientific PYthon Develop 阅读全文

posted @ 2019-10-27 15:30 数之美阅读(2693) 评论(0) 推荐(0) 编辑

Python是一款解释型语言

摘要： Q:Python是一款解释型语言 A:https://blog.csdn.net/u012184539/article/details/81348780 计算机是不能理解高级语言的，更不能直接执行高级语言，它只能直接理解机器语言，所以使用任何高级语言编写的程序若想被计算机运行，都必须将其转换成计算机阅读全文

posted @ 2019-10-27 15:22 数之美阅读(2006) 评论(0) 推荐(0) 编辑

Python数据分析应用背景

摘要： R语言几乎专注于统计分析，其第三方包无数，有着统计学的深度以及各学科统计分析应用的广度。R语言作为正统统计学软件，数据分析则是其应有之义，R语言算是与Matlab、SAS在同一起跑线上。当Python开始涉足数据分析领域时，其便渐渐形成了与R语言分庭抗礼的趋势：有着更深互联网基因的Python要比更阅读全文

posted @ 2019-10-27 15:20 数之美阅读(1817) 评论(0) 推荐(0) 编辑

AUC指标之ROC曲线只有一个点的问题

摘要：在一般认知中，用模型对测试集进行分类预测，结果应该是X或者X'（也可以说是或者否）。根据混淆矩阵算出TP、FP、TN、FN，进一步算出TPR、FPR。一个测试集只会有一对TPR/FPR值，那么ROC曲线就只会有一个点，何谈曲线之说？难道是用多个测试集得到多对TPR/FPR值，来绘制ROC曲线吗？实则阅读全文

posted @ 2019-10-27 11:02 数之美阅读(3520) 评论(0) 推荐(0) 编辑

二分类算法评估指标

摘要：我们都知道机器学习要建模，但是对于模型性能的好坏我们并不知道是怎样的，很可能这个模型就是一个差的模型，对测试集不能很好的预测。那么如何知道这个模型是好是坏呢？必须有个评判的标准，需要用某个指标来衡量，这就是性能度量的意义。有了一个指标，就可以对比不同模型了，从而知道哪个模型更好，或者通过这个指标来调阅读全文

posted @ 2019-10-27 10:59 数之美阅读(5239) 评论(0) 推荐(0) 编辑

AdaBoost分类算法

摘要： AdaBoost：Adaptive Boosting（自适应提升），是Boosting系列算法的典型代表。AdaBoost简单来讲，就是多个弱分类器，可能基于单层决策树，也可能基于其他算法；前一个弱分类器得到一个分类结果，根据它的错误率给这个分类器一个权重，还要更新样本的权重；基于这个权重矩阵，再去阅读全文

posted @ 2019-10-27 10:50 数之美阅读(1614) 评论(0) 推荐(0) 编辑

随机森林分类算法

摘要：随机森林（Random Forest，简称RF）是通过集成学习的思想将多棵树集成的一种算法，它的基本单元是决策树。假设现在针对的是分类问题，每棵决策树都是一个分类器，那么N棵树会有N个分类结果。随机森林集成了所有的分类投票结果，将投票次数最多的类别指定为最终输出。它可以很方便的并行训练。森林表示决阅读全文

posted @ 2019-10-27 10:47 数之美阅读(3646) 评论(0) 推荐(0) 编辑

集成学习

摘要：机器学习的一大方法分支——集成学习（Ensemble Learning）集成学习的思想是将若干个个体学习器组合之后产生一个新学习器。也可以说集成学习就是训练若干个个体学习器（大多数文章称为弱学习器），通过一定的结合策略，最终形成一个强学习器，以达到博采众长的目的。也就是说集成学习只关注两个问题：阅读全文

posted @ 2019-10-27 10:45 数之美阅读(340) 评论(0) 推荐(0) 编辑

EM最大期望算法

摘要：介绍EM算法，必然会抛出一些比较复杂的公式。其实这些公式只是EM算法思想的数学推导，数学推导就是将算法思想用严谨的公式语言表达出来而已。理解EM算法思想，比看懂它的数学推导重要。 EM即最大期望算法（Expectation Maximization algorithm），是在高斯混合模型中寻找参数最阅读全文

posted @ 2019-10-27 10:43 数之美阅读(502) 评论(0) 推荐(0) 编辑

数之美

think big 、think long 、think deep

公告