随笔分类 -  数据挖掘

摘要:今年 6 月份,Alex Rodriguez 和 Alessandro Laio 在 Science 上发表了一篇名为《Clustering by fast search and find of density peaks》的文章,为聚类算法的设计提供了一种新的思路。虽然文章出来后遭到了众多... 阅读全文
posted @ 2014-08-29 19:30 peghoty 阅读(13517) 评论(2) 推荐(4) 编辑
摘要:本来是要调研 Latent Dirichlet Allocation 的那个 LDA 的, 没想到查到很多关于 Linear Discriminant Analysis 这个 LDA 的资料。初步看了看,觉得数学味挺浓,一时引起了很大的兴趣;再看看,就有整理一份资料的冲动了。网上... 阅读全文
posted @ 2013-09-26 10:47 peghoty 阅读(670) 评论(0) 推荐(1) 编辑
摘要:本来是要调研 Latent Dirichlet Allocation 的那个 LDA 的, 没想到查到很多关于 Linear Discriminant Analysis 这个 LDA 的资料。初步看了看,觉得数学味挺浓,一时引起了很大的兴趣;再看看,就有整理一份资料的冲动了。网上查到的相关... 阅读全文
posted @ 2013-09-26 10:47 peghoty 阅读(469) 评论(0) 推荐(0) 编辑
摘要:召回率(Recall)和精度(Precise)是广泛用于信息检索和统计学分类领域的两个度量值,用来评价结果的质量。其中召回率是是检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率。精度是检索出的相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率。 从一... 阅读全文
posted @ 2013-09-01 23:47 peghoty 阅读(667) 评论(0) 推荐(0) 编辑
摘要:本文从数学上对逻辑回归做了一个详尽的分析,其中包括回归分析、最小二乘法、sigmoid 函数以及梯度下降等知识点的介绍。目录1 回归分析 1.1 基本概念 1.2 最小二乘法2 逻辑回归 2.1 逻辑函数 2.2 梯度下降法 2.3 训练算法文中提到的相关性分析可参见《相关性分析》。若需要本文完整的... 阅读全文
posted @ 2013-09-01 22:03 peghoty 阅读(326) 评论(0) 推荐(0) 编辑
摘要:文中尺度化的一些具体公式可参见http://blog.csdn.net/itplus/article/details/10088101其他相关链接引言预备知识直接聚类法K-meansDBSCANOPTICS聚类分析的效果评测作者: peghoty出处:http://blog.csdn.net/itp... 阅读全文
posted @ 2013-08-29 08:22 peghoty 阅读(300) 评论(0) 推荐(0) 编辑
摘要:本文摘自中国科学院计算技术研究所周昭涛的硕士论文《文本聚类分析效果评价及文本表示研究》的第三章,算是一则读书笔记吧,希望对大家有点帮助。文中提到的准确率和召回率的定义可参见http://blog.csdn.net/itplus/article/details/10862059其他相关链接:引言... 阅读全文
posted @ 2013-08-26 00:27 peghoty 阅读(524) 评论(0) 推荐(0) 编辑
摘要:第一章 引言第二章 预备知识第三章 直接聚类法第四章 K-means第五章 DBSCAN第六章 OPTICS第七章聚类分析的效果评测第八章数据尺度化问题作者: peghoty出处:http://blog.csdn.net/itplus/article/details/10089323欢迎转载/分享,... 阅读全文
posted @ 2013-08-20 01:00 peghoty 阅读(519) 评论(0) 推荐(0) 编辑
摘要:第一章 引言第二章 预备知识第三章 直接聚类法第四章 K-means第五章 DBSCAN第六章 OPTICS第七章聚类分析的效果评测第八章数据尺度化问题 作者: peghoty出处:http://blog.csdn.net/itplus/article/details/10088429欢迎转载/分享... 阅读全文
posted @ 2013-08-20 00:59 peghoty 阅读(213) 评论(0) 推荐(0) 编辑
摘要:第一章 引言第二章 预备知识第三章 直接聚类法第四章 K-means第五章 DBSCAN第六章 OPTICS第七章聚类分析的效果评测第八章数据尺度化问题 作者: peghoty出处:http://blog.csdn.net/itplus/article/details/10088283欢迎转载/分享... 阅读全文
posted @ 2013-08-20 00:57 peghoty 阅读(398) 评论(0) 推荐(0) 编辑
摘要:第一章 引言第二章 预备知识第三章 直接聚类法第四章 K-means第五章 DBSCAN第六章 OPTICS第七章聚类分析的效果评测第八章数据尺度化问题 作者: peghoty出处:http://blog.csdn.net/itplus/article/details/10088101欢迎转载/分享... 阅读全文
posted @ 2013-08-20 00:57 peghoty 阅读(186) 评论(0) 推荐(0) 编辑
摘要:第一章 引言第二章 预备知识第三章 直接聚类法第四章 K-means第五章 DBSCAN第六章 OPTICS第七章聚类分析的效果评测 第八章数据尺度化问题作者: peghoty出处:http://blog.csdn.net/itplus/article/details/10087581欢迎转载/分享... 阅读全文
posted @ 2013-08-20 00:56 peghoty 阅读(251) 评论(0) 推荐(0) 编辑
摘要:第一章 引言第二章 预备知识第三章 直接聚类法第四章 K-means第五章 DBSCAN第六章 OPTICS第七章聚类分析的效果评测第八章数据尺度化问题 作者: peghoty出处:http://blog.csdn.net/itplus/article/details/10088625欢迎转载/分享... 阅读全文
posted @ 2013-08-19 16:59 peghoty 阅读(271) 评论(0) 推荐(0) 编辑
摘要:新浪微博上有人推荐了一套 《漫画统计学》的教程,于是找来读了一番。感觉这种形式的教学挺有意思的。以下摘录了书中第六章的部分内容,主要介绍相关系数、相关比和克莱姆相关系数三种考察数据相关性的指标。作者: peghoty出处:http://blog.csdn.net/itplus/article/... 阅读全文
posted @ 2013-08-18 23:49 peghoty 阅读(1127) 评论(0) 推荐(0) 编辑
摘要:在 Deep Learning 大行其道热度不减时,有机会接触到了极限学习机(Extreme Learning Machine,ELM)。这个算法是新加坡南洋理工大学的黄广斌教授提出来的,idea 始于 2003 年,2004 年正式发表文章。这种算法是针对 SLFNs (即含单个隐... 阅读全文
posted @ 2013-07-09 08:23 peghoty 阅读(1092) 评论(0) 推荐(0) 编辑
摘要:作者: peghoty出处:http://blog.csdn.net/peghoty/article/details/9079297欢迎转载/分享, 但请务必声明文章出处. 阅读全文
posted @ 2013-06-12 16:02 peghoty 阅读(396) 评论(0) 推荐(0) 编辑