摘要:
在包目录内,所有以_test.go为后缀名的源文件在执行go build时不会被构建成包的一部分,它们是go test测试的一部分。 在*_test.go文件中,有三种类型的函数:测试函数、基准测试(benchmark)函数、示例函数。一个测试函数是以Test为函数名前缀的函数,用于测试程序的一些逻 阅读全文
摘要:
01背包问题 问题描述: 给定 n 件物品,物品的重量为 w[i],物品的价值为 c[i]。现挑选物品放入背包中,假定背包能承受的最大重量为 V,问应该如何选择装入背包中的物品,使得装入背包中物品的总价值最大? 针对这个问题,本人理解了多次,也了看各种题解,尝试各种办法总还觉得抽象;或者说,看了多次 阅读全文
摘要:
官方文档是这么解释的: All files accessible in a Unix system are arranged in one big tree, the file hierarchy, rooted at /. These files can be spread out over se 阅读全文
摘要:
1. 什么是interface在此之前,我们遇到的都是具体的类型,比如数字类型、切片类型等等。对于这些具体的类型,我们总是能知道它是什么、可以利用它来做什么,比如对于一个数字类型,我们知道可以对其进行算数操作;对于一个切片类型,我们知道可以取下标操作等等。但是,接口类型是一种抽象的类型,我们并不能知 阅读全文
摘要:
gob包("encoding/gob")管理gob流——在encoder(编码器,也就是发送器)和decoder(解码器,也就是接受器)之间交换的字节流数据(gob 就是 go binary的缩写)。一般用于传递远端程序调用(RPC)的参数和结果。 要使用gob,通过调用NewEncoder()方法 阅读全文
摘要:
规范化理论 1.数据依赖 数据依赖是一个关系内部属性和属性之间的一种约束。这种约束关系是通过属性间值的相等与否体现出来的一种关联关系,是现实语义的体现。其类型包括函数依赖(Function Dependency,FD)和多值依赖(Multi-Valued Dependency,MVD)。 什么是函数 阅读全文
摘要:
索引是计算机科学领域中非常常用的数据结构,比如数据库中的索引。索引的目的就是为了加快查找速度,具体到搜索引擎中,索引更是扮演了非常重要的角色,面对海量的网页内容,如何快速找到包含用户查询关键词的所有网页呢?——这其中就用到了倒排索引! 什么是倒排索引?如何建立倒排索引表?倒排索引表有什么作用?... 阅读全文
摘要:
场景 在搜索引擎项目中,我用到了最短编辑距离算法,用于对用户输入的查询进行纠错,从而优化查询结果。比如说,我们在输入英文单词的时候,由于疏忽或者记忆不准确,会有拼写错误的情况。以单词beautiful 为例,假设我们在搜索引擎中输入beauitful(我故意拼错了),看看会发生什么。 如下图所示,虽 阅读全文
摘要:
搜索结果排序是搜索引擎最核心的构成部分,很大程度上决定了搜索引擎的质量好坏。虽然搜索引擎在实际结果排序时考虑了上百个相关因子,但最重要的因素还是用户查询与网页内容的相关性。(ps:百度最臭名朝著的“竞价排名”策略,就是在搜索结果排序时,把广告客户给钱最多的排在前列,而不是从内容质量考虑,从而严重影响 阅读全文
摘要:
(注:本文转载自阮一峰老师的博文,原文地址:http://www.ruanyifeng.com/blog/2013/03/cosine_similarity.html) 今天,我们再来研究另一个相关的问题。有些时候,除了找到关键词,我们还希望找到与原文章相似的其他文章。比如,"Google新闻"在主 阅读全文