2017年2月16日
摘要: 一, 获取文本语料库 一个文本语料库是一大段文本。它通常包含多个单独的文本,但为了处理方便,我们把他们头尾连接起来当做一个文本对待。 1. 古腾堡语料库 nltk包含古腾堡项目(Project Gutenberg)电子文本档案的一小部分文本。要使用该语料库通常需要用Python解释器加载nltk包, 阅读全文
posted @ 2017-02-16 21:38 寒若雪 阅读(8056) 评论(0) 推荐(0) 编辑
  2017年2月14日
摘要: 一. NLTK的几个常用函数 1. Concordance 实例如下: 这个函数就是用来搜索单词word在text 中出现多的情况,包括出现的那一行,重点强调上下文。从输出来看 concordance 将要查询的单词,基本显示在一列,这样容易观察其上下文. 2. Similar 实例: 这个函数的作 阅读全文
posted @ 2017-02-14 16:10 寒若雪 阅读(8378) 评论(0) 推荐(0) 编辑
  2017年2月9日
摘要: NLTK 3.2.2 安装经验 原因可能有以下几方面: 1) Python版本不对:重新安装合适的Python版本 2) Python注册信息未加入到注册表中 3) Python注册信息不对 针对后面两种情况,我们可以直接通过脚本register.py(具体代码内容见本文后面)建立注册信息,然后运行 阅读全文
posted @ 2017-02-09 15:07 寒若雪 阅读(3254) 评论(0) 推荐(0) 编辑
  2016年11月7日
摘要: Ok, in my family, there are seven people including my father, mother, three sisters, one brother and I. You know, it is a very big and happy family. T 阅读全文
posted @ 2016-11-07 08:24 寒若雪 阅读(284) 评论(1) 推荐(1) 编辑
  2016年11月5日
摘要: 1. 欧式距离 欧几里得度量(euclidean metric)(也称欧氏距离)是一个通常采用的距离定义,指在m维空间中两个点之间的真实距离,或者向量的自然长度(即该点到原点的距离)。在二维和三维空间中的欧氏距离就是两点之间的实际距离。 {\displaystyle x^{2}+2\lambda y 阅读全文
posted @ 2016-11-05 21:04 寒若雪 阅读(1689) 评论(0) 推荐(1) 编辑
摘要: 最优化 随着大数据的到来,并行计算的流行,实际上机器学习领域的很多研究者会把重点放在最优化方法的研究上,如large scale computation。那么为什么要研究最优化呢?我们先从机器学习研究的目的说起。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法,这些算法可以从数据中自动 阅读全文
posted @ 2016-11-05 19:53 寒若雪 阅读(5558) 评论(0) 推荐(0) 编辑
  2016年11月1日
摘要: 1.1 定义 广义:设M是n阶方阵,如果对任何非零向量z,都有zTMz> 0,其中zT 表示z的转置,就称M正定矩阵。[1] 狭义定义:一个n阶的实对称矩阵M是正定的的条件是当且仅当对于所有的非零实系数向量z,都有zTMz> 0。其中zT表示z的转置。 1.2 定理与性质 l 正定矩阵在合同变换下可 阅读全文
posted @ 2016-11-01 22:08 寒若雪 阅读(1939) 评论(0) 推荐(0) 编辑
  2016年9月29日
摘要: 机器学习笔记(一) 名词解释 ILP:Inductive Logic Programming的简称,即归纳逻辑程序设计。 发展历程 n 二十世纪五十年代初,出现机器学习的相关研究 n 二十世纪五十年代中期, 基于神经网络的“连接主义学习开始出现 n 在二十世纪六七十年代,基于逻辑表示的“符号主义”学 阅读全文
posted @ 2016-09-29 15:06 寒若雪 阅读(1622) 评论(0) 推荐(1) 编辑
  2016年9月27日
摘要: 有关矩阵的几点总结 矩阵的除法是矩阵乘法的逆运算,分为左除和右除两种,分别用运算符号”\”和”/”表示。 其中,inv(A)指A的逆矩阵。 注意: 对于一般的二维矩阵A和B, 当进行左除运算时,要求两个矩阵的行数相等;当进行右除运算时,要求两个矩阵的列数相等。 范数的定义来自向量,如下: 对于线性空 阅读全文
posted @ 2016-09-27 21:17 寒若雪 阅读(2598) 评论(0) 推荐(0) 编辑
  2015年11月10日
摘要: 类似#include与#include等头文件的区别 标准的C++头文件没有.h扩展名,带有.h的头文件一般都是C语言的。例如#include是C++的头文件,要使用更新的编译器.,#include是C的头文件。对于C中的每一个头文件,C++标准库中都有一个不带“.h”扩展名的头文件与其相... 阅读全文
posted @ 2015-11-10 17:25 寒若雪 阅读(276) 评论(0) 推荐(0) 编辑