摘要: 集合和映射表 集合(set)是一个用于存储和处理无重复元素的高效数据结构。映射表(map)类似于目录,提供了使用键值对快速查询和获取值低功能。 可以使用集合的三个具体类HashSet,LinkedHashSet,TreeSet来创建集合(Set)。 HashSet HashSet类是一个实现类Set 阅读全文
posted @ 2021-05-15 12:16 geeks_reign 阅读(666) 评论(0) 推荐(0) 编辑
摘要: 类的基本思想是数据抽象和封装。数据抽象是一种依赖于接口和实现分离的编程技术。接口包括用户所能执行的操作,实现则包括类的数据成员,负责接口实现的函数体以及定义类所需的各种私有函数。 封装实现了类的接口和实现的分离,封装后的类隐藏了它的实现细节,也就是说,类的用户只能使用接口而无法访问实现部分。 类要实 阅读全文
posted @ 2021-03-01 10:05 geeks_reign 阅读(127) 评论(0) 推荐(0) 编辑
摘要: 1. 函数基础 一个典型的函数定义包括一下部分:返回类型,函数名字,由0个或多个形参组成的列表以及函数体。 形参以逗号隔开,位于一对圆括号内,函数执行的操作在语句块中说明,称为函数体。 通过调用运算符来执行函数,调用运算符的形式是一对圆括号,它作用于一个表达式,该表达式是函数或者指向函数的指针;圆括 阅读全文
posted @ 2021-01-30 12:38 geeks_reign 阅读(215) 评论(0) 推荐(0) 编辑
摘要: 1. 简单语句 C++语言的大多数语句都以分号结束,一个表达式末尾加上分号就变成了表达式语句。表达式语句都作用是执行表达式并丢弃掉求值结果。 空语句 空语句是最简单的语句,只含有一个单独的分号。如果程序的某个地方,语法上需要一条语句但逻辑上不需要,此时应该使用空语句,一种常见的情况是,当循环的全部工 阅读全文
posted @ 2021-01-30 12:24 geeks_reign 阅读(79) 评论(0) 推荐(0) 编辑
摘要: 1. 基础 C++定义了一元运算符和二元运算符,作用于一个运算对象的运算符是一元运算符,如取址符(&)和解引用符(*);作用于两个运算对象的运算符是二元运算符,如相等运算符(==)和加法法运算符(+)。 含有多个运算符的赋值表达式来说,要理解它的含义首先要理解运算符的优先级,结合律以及运算对象的求职 阅读全文
posted @ 2021-01-30 12:15 geeks_reign 阅读(152) 评论(0) 推荐(0) 编辑
摘要: 1. 命名空间的using声明 我们知道stdcin表示从标准输入中读取内容,作用域操作符的含义是让编译器从操作符左侧名字的作用域寻找右侧那个名字,因此std::cin就是要使用命名空间std中的名字cin。 这个命名空间表示方法略显繁琐,一种简单便捷的获取命名空间内成员的方法是使用using声明: 阅读全文
posted @ 2020-10-18 16:04 geeks_reign 阅读(156) 评论(0) 推荐(0) 编辑
摘要: 变量和基本类型 主要介绍基本内置类型,变量以及复合类型。 1.基本内置类型 C++定义了包括算术类型(arithmetic type)和空类型(void type)两类基本数据类型。 算术类型可分为:整形(integer type,包括布尔型和字符)和浮点型。 基本算术数据类型: 类型 含义 最小尺 阅读全文
posted @ 2020-09-20 17:20 geeks_reign 阅读(223) 评论(0) 推荐(0) 编辑
摘要: BitMap概述 本文介绍 BitMap 算法的应用背景,算法思想和相关实现细节。 概括而言,BitMap 主要用来解决海量数据中元素查询,去重、以及排序等问题。这里对海量数据场景的强调,似乎暗示了这个算法对空间的利用相当的精巧和经济,事实确实如此。 BitMap算法 本来数据序列的排序是一个平凡的 阅读全文
posted @ 2020-06-06 22:36 geeks_reign 阅读(2146) 评论(0) 推荐(0) 编辑
摘要: 引言 Okapi BM25,一般简称 BM25 算法,在 20 世纪 70 年代到 80 年代,由英国一批信息检索领域的计算机科学家发明。这里的 BM 是“最佳匹配”(Best Match)的缩写,Okapi 是第一个使用这种方法的信息获取系统的名称。在信息检索领域,BM25 算法是工程实践中举足轻 阅读全文
posted @ 2020-05-31 22:37 geeks_reign 阅读(4632) 评论(1) 推荐(2) 编辑
摘要: 引言 在信息检索, 文本挖掘和自然语言处理领域, IF-IDF 这个名字, 从它在 20 世纪 70 年代初被发明, 已名震江湖近半个世纪而不曾衰歇. 它表示的简单性, 应用的有效性, 使得它成为不同文本处理任务文本特征权重表示的首选方案. 如果要评选一个 NLP 领域最难以被忘记的公式, 我想, 阅读全文
posted @ 2020-05-24 19:27 geeks_reign 阅读(2659) 评论(0) 推荐(0) 编辑