摘要: 阅读全文
posted @ 2019-07-16 20:57 zoe1101 阅读(99) 评论(0) 推荐(0) 编辑
摘要: 稳定排序:假设在待排序的文件中,存在两个或两个以上的记录具有相同的关键字,在用某种排序法排序后,若这些相同关键字的元素的相对次序仍然不变,则这种排序方法是稳定的。(即原本a在b前,a=b,排序之后位置任然不变。) • 不稳定的排序算法:快速排序、希尔排序、堆排序、直接选择排序; • 稳定的排序算法: 阅读全文
posted @ 2019-04-08 16:37 zoe1101 阅读(167) 评论(0) 推荐(0) 编辑
摘要: TF-IDF是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。**字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。**即一个词语在一篇文章中出现次数越多, 同时在所 阅读全文
posted @ 2019-04-05 17:33 zoe1101 阅读(875) 评论(0) 推荐(0) 编辑
摘要: 生成式模型 P(X,Y)对联合概率进行建模,从统计的角度表示数据的分布情况,刻画数据是如何生成的,收敛速度快。 • 1. 判别式分析 • 2. 朴素贝叶斯Native Bayes • 3. 混合高斯型Gaussians • 4. K近邻KNN • 5. 隐马尔科夫模型HMM • 6. 贝叶斯网络 • 阅读全文
posted @ 2019-04-05 17:29 zoe1101 阅读(2075) 评论(0) 推荐(0) 编辑