摘要: 有这么一个问题,说我在看一篇文章,觉得不错,想要从书架的众多书籍中找相类似的文章来继续阅读,这该怎么办? 于是我们想到暴力解决法,我一篇一篇的比对,找出相似的 最近邻的概念很好理解,我们通过计算知道了每一篇文章和目标文章的距离,选择距离最小的那篇作为最相近的候选文章或者距离最小的一些文章作为候选文章 阅读全文
posted @ 2016-07-30 16:49 python挖掘 阅读(1408) 评论(0) 推荐(0) 编辑
摘要: 检索是什么,有什么用? 检索是指从文献资料、网络信息等信息集合中查找到自己需要的信息或资料的过程,在信息冗余的时代,高效的检索显得越发重要。 比如说我们如何从众多图片中找到和自家小狗相似的小狗的图片 如何从众多产品中找到我们想要购买的按摩椅 如何从众多电影/歌曲/电视节目中找到我们喜欢的 如何从新闻 阅读全文
posted @ 2016-07-30 15:51 python挖掘 阅读(184) 评论(0) 推荐(0) 编辑
摘要: 集中式VS分布式 集中式是指所有资源都存储在中央服务器上,所有客户端必须在连接服务器的前提下才能进行查询修改等操作 分布式是指每个终端都有一份完整的资源副本,可以在本地随意修改查询,只需要不定时的与远端交换中心进行交流以提交或获取最新版本 分布式优点: 充分利用“三个臭皮匠赛过诸葛亮”思想,具有较高 阅读全文
posted @ 2016-07-30 10:48 python挖掘 阅读(91) 评论(0) 推荐(0) 编辑