摘要:
word2vec 数学推导 word2vec 是一种训练词向量的工具,可以将词库中的所有词语映射到 $k$ 维的向量中。主要有两种训练方式,CBOW 和 skip gram,CBOW 根据上下文来预测目标单词,skip gram 根据目标单词来预测上下文。下面进行两种方式的数学推导。 CBOW 1. 阅读全文
摘要:
//TODO $x^2$ 阅读全文
摘要:
中文分词技术 中文自动分词可主要归纳为“规则分词”“统计分词”和“混合分词”,规则分词主要是通过人工设立词库,按照一定方式进行匹配切分,实现简单高效,但对新词很难进行处理,统计分词能够较好应对新词发现能特殊场景,但太过于依赖语料的质量,因此实践中多是采用两者的结合,即混合分词。 1.1 规则分词 基 阅读全文
摘要:
前言,先来一道八皇后问题,开始 Python 语言的学习,加油! 1. Python for 循环语句 语法: for 循环的语法格式如下: 实例: 通过序列索引迭代: 其中的内置函数 len() 和 range(),函数 len() 返回列表的长度,即元素的个数。range() 返回一个序列的数。 阅读全文
摘要:
世界上有两种C++程序员,一种是读过Efective C++ 的,一种是没有读过的。 条款01:视 C++ 为一个语言联邦 C。 Object-Oriented C++。 Template C++。 STL。 条款02:尽量以 const, enum, inline 替换 #define 1. cl 阅读全文
摘要:
1. C++ 内存分区 C++ 内存分为:堆区、栈区、全局区/静态区、字符串常量和代码区。 栈区:由系统进行内存的管理。主要存放函数的参数以及局部变量。栈区由系统进行内存管理,在函数完成执行,系统自行释放栈区内存,不需要用户管理。整个程序的栈区的大小可以在编译器中由用户自行设定,默认的栈区大小为 3 阅读全文
摘要:
1. 最长合法括号串 给定只包含'('和')'的字符串,找出最长合法括号串的长度。 Example 1: Input: "(()" Output: 2 Explanation: The longest valid parentheses substring is "()" Example 2: In 阅读全文