摘要: 最近在看聚类方面的论文,接触到了MCL聚类,在网上找了许久,没什么中文的资料,可能写的最具体的便是GatsbyNewton写的 "马尔可夫聚类算法(MCL)" 这篇博客了。但是,其中仍有一些不详细的地方。而MCL这一方法是在作者在其博士论文中提出的,篇幅太长,难以细读,也不适合作为用来学习MCL这一 阅读全文
posted @ 2017-10-15 18:35 Magle 阅读(18895) 评论(2) 推荐(10) 编辑
摘要: 朴素贝叶斯算法是以后验概率最大为理论基础而得出的分类模型。要了解朴素贝叶斯,就需要先了解贝叶斯公式。 贝叶斯公式 首先,先看下面这个例子: 假设一所学校里面有40%的男生,60%的女生。 你在这所学校的大道上走,迎面走来一个人,由于比较远,看不清楚特征。现在需要你判断Ta的性别,请问你的答案是什么? 阅读全文
posted @ 2017-10-15 12:12 Magle 阅读(857) 评论(0) 推荐(0) 编辑
摘要: 转载自http://blog.sina.com.cn/s/blog_670445240102v08m.html 对于数据挖掘和分析人员来说,数据准备(Data Preparation,包括数据的抽取、清洗、转换和集成)常常占据了70%左右的工作量。而在数据准备的过程中,数据质量差又是最常见而且令人头 阅读全文
posted @ 2017-10-15 12:09 Magle 阅读(46212) 评论(0) 推荐(3) 编辑
摘要: 导入相关模块 中文显示设置 在之前,绘图时均使用的是英文,并没有使用过中文,那是因为直接使用中文会遇到乱码的问题,就比如: 当然,并不是因为matplotlib不支持中文。作为Python中的热门模块,matplotlib是支持Unicode编码的,但是在默认情况下,它使用的是自带的字体,这些字体并 阅读全文
posted @ 2017-10-15 12:06 Magle 阅读(683) 评论(0) 推荐(0) 编辑