摘要: word2vec 数学推导 word2vec 是一种训练词向量的工具,可以将词库中的所有词语映射到 $k$ 维的向量中。主要有两种训练方式,CBOW 和 skip gram,CBOW 根据上下文来预测目标单词,skip gram 根据目标单词来预测上下文。下面进行两种方式的数学推导。 CBOW 1. 阅读全文
posted @ 2019-07-19 01:04 Herokk 阅读(200) 评论(0) 推荐(0) 编辑
摘要: //TODO $x^2$ 阅读全文
posted @ 2018-12-20 08:15 Herokk 阅读(156) 评论(0) 推荐(0) 编辑
摘要: 中文分词技术 中文自动分词可主要归纳为“规则分词”“统计分词”和“混合分词”,规则分词主要是通过人工设立词库,按照一定方式进行匹配切分,实现简单高效,但对新词很难进行处理,统计分词能够较好应对新词发现能特殊场景,但太过于依赖语料的质量,因此实践中多是采用两者的结合,即混合分词。 1.1 规则分词 基 阅读全文
posted @ 2018-12-16 23:14 Herokk 阅读(4074) 评论(0) 推荐(0) 编辑
摘要: 前言,先来一道八皇后问题,开始 Python 语言的学习,加油! 1. Python for 循环语句 语法: for 循环的语法格式如下: 实例: 通过序列索引迭代: 其中的内置函数 len() 和 range(),函数 len() 返回列表的长度,即元素的个数。range() 返回一个序列的数。 阅读全文
posted @ 2018-11-15 10:24 Herokk 阅读(421) 评论(0) 推荐(0) 编辑
摘要: // todo 阅读全文
posted @ 2018-11-14 17:46 Herokk 阅读(450) 评论(0) 推荐(0) 编辑
摘要: 世界上有两种C++程序员,一种是读过Efective C++ 的,一种是没有读过的。 条款01:视 C++ 为一个语言联邦 C。 Object-Oriented C++。 Template C++。 STL。 条款02:尽量以 const, enum, inline 替换 #define 1. cl 阅读全文
posted @ 2018-10-18 10:41 Herokk 阅读(363) 评论(0) 推荐(0) 编辑
摘要: 1. C++ 内存分区 C++ 内存分为:堆区、栈区、全局区/静态区、字符串常量和代码区。 栈区:由系统进行内存的管理。主要存放函数的参数以及局部变量。栈区由系统进行内存管理,在函数完成执行,系统自行释放栈区内存,不需要用户管理。整个程序的栈区的大小可以在编译器中由用户自行设定,默认的栈区大小为 3 阅读全文
posted @ 2018-09-19 20:23 Herokk 阅读(697) 评论(0) 推荐(0) 编辑
摘要: 1. 最长合法括号串 给定只包含'('和')'的字符串,找出最长合法括号串的长度。 Example 1: Input: "(()" Output: 2 Explanation: The longest valid parentheses substring is "()" Example 2: In 阅读全文
posted @ 2018-05-24 20:07 Herokk 阅读(490) 评论(0) 推荐(0) 编辑