09 2017 档案

摘要:from http://itindex.net/detail/53673-linux-redis-bgsave 一台机器如果内存用完,在进行bgsave时,可能会报错。错误信息大概如下: 当执行redis的bgsave命令时,redis会fork一个进程把redis中的内存数据写入磁盘。这样的好处是 阅读全文
posted @ 2017-09-28 11:30 princessd8251 阅读(302) 评论(0) 推荐(0) 编辑
摘要:from http://blog.csdn.net/u010381985/article/details/55211391 当数据个数比较大的时候,线性搜索寻找KNN的时间开销太大,而且需要读取所有的数据在内存中,这是不现实的。因此,实际工程上,使用近似最近邻也就是ANN问题。其中一种方法是利用随机 阅读全文
posted @ 2017-09-26 00:58 princessd8251 阅读(373) 评论(0) 推荐(0) 编辑
摘要:from http://blog.csdn.net/androidlushangderen/article/details/44985259 算法介绍 KD树的全称为k-Dimension Tree的简称,是一种分割K维空间的数据结构,主要应用于关键信息的搜索。为什么说是K维的呢,因为这时候的空间不 阅读全文
posted @ 2017-09-22 22:41 princessd8251 阅读(631) 评论(1) 推荐(0) 编辑
摘要:from http://blog.csdn.net/xiaozezepingping/article/details/27089187 这是一篇关于贝叶斯方法的科普文,我会尽量少用公式,多用平白的语言叙述,多举实际例子。更严格的公式和计算我会在相应的地方注明参考资料。贝叶斯方法被证明是非常 gene 阅读全文
posted @ 2017-09-21 17:02 princessd8251 阅读(34066) 评论(1) 推荐(3) 编辑
摘要:from http://www.ruanyifeng.com/blog/2012/09/imaginary_number.html 有人在Stack Exchange问了一个问题: "我一直觉得虚数(imaginary number)很难懂。 中学老师说,虚数就是-1的平方根。 可是,什么数的平方等 阅读全文
posted @ 2017-09-20 19:03 princessd8251 阅读(254) 评论(0) 推荐(0) 编辑
摘要:from http://www.ruanyifeng.com/blog/2013/03/cosine_similarity.html 上一次,我用TF-IDF算法自动提取关键词。 今天,我们再来研究另一个相关的问题。有些时候,除了找到关键词,我们还希望找到与原文章相似的其他文章。比如,"Google 阅读全文
posted @ 2017-09-20 19:01 princessd8251 阅读(104) 评论(0) 推荐(0) 编辑
摘要:from http://www.ruanyifeng.com/blog/2013/03/automatic_summarization.html 有时候,很简单的数学方法,就可以完成很复杂的任务。 这个系列的前两部分就是很好的例子。仅仅依靠统计词频,就能找出关键词和相似文章。虽然它们算不上效果最好的 阅读全文
posted @ 2017-09-20 19:01 princessd8251 阅读(77) 评论(0) 推荐(0) 编辑
摘要:from http://www.ruanyifeng.com/blog/2013/03/tf-idf.html 这个标题看上去好像很复杂,其实我要谈的是一个很简单的问题。 有一篇很长的文章,我要用计算机提取它的关键词(Automatic Keyphrase extraction),完全不加以人工干预 阅读全文
posted @ 2017-09-20 19:00 princessd8251 阅读(92) 评论(0) 推荐(0) 编辑
摘要:from http://www.ruanyifeng.com/blog/2013/12/naive_bayes_classifier.html 生活中很多场合需要用到分类,比如新闻分类、病人分类等等。 本文介绍朴素贝叶斯分类器(Naive Bayes classifier),它是一种简单有效的常用分 阅读全文
posted @ 2017-09-20 18:53 princessd8251 阅读(130) 评论(0) 推荐(0) 编辑
摘要:from http://www.ruanyifeng.com/blog/2012/10/spelling_corrector.html 这个系列的第一部分介绍了贝叶斯定理,第二部分介绍了如何过滤垃圾邮件,今天是第三部分。) 使用Google的时候,如果你拼错一个单词,它会提醒你正确的拼法。 比如,你 阅读全文
posted @ 2017-09-20 18:29 princessd8251 阅读(114) 评论(0) 推荐(0) 编辑
摘要:from https://cachecloud.github.io/2016/11/24/%E5%85%A8%E9%87%8F%E5%A4%8D%E5%88%B6%E9%97%AE%E9%A2%98/ 一、现象和危害 线上有台机器内存接近了90%,总内存为24G,整个部署如下图: 现要将Redis- 阅读全文
posted @ 2017-09-19 15:49 princessd8251 阅读(725) 评论(0) 推荐(0) 编辑
摘要:from https://www.jiqizhixin.com/articles/2017-08-28-3 集成方法是将几种机器学习技术组合成一个预测模型的元算法,以达到减小方差(bagging)、偏差(boosting)或改进预测(stacking)的效果。 集合方法可分为两类: 序列集成方法,其 阅读全文
posted @ 2017-09-12 11:29 princessd8251 阅读(202) 评论(0) 推荐(0) 编辑
摘要:from http://www.ruanyifeng.com/blog/2017/08/normal-distribution.html 统计学里面,正态分布(normal distribution)最常见。男女身高、寿命、血压、考试成绩、测量误差等等,都属于正态分布。 以前,我认为中间状态是事物的 阅读全文
posted @ 2017-09-12 10:42 princessd8251 阅读(348) 评论(0) 推荐(0) 编辑
摘要:一、定义: zip([iterable, ...])zip()是Python的一个内建函数,它接受一系列可迭代的对象作为参数,将对象中对应的元素打包成一个个tuple(元组),然后返回由这些tuples组成的list(列表)。若传入参数的长度不等,则返回list的长度和参数中长度最短的对象相同。利用 阅读全文
posted @ 2017-09-12 00:36 princessd8251 阅读(120) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示