摘要:
1 双数组Tire树简介双数组Tire树是Tire树的升级版,Tire取自英文Retrieval中的一部分,即检索树,又称作字典树或者键树。下面简单介绍一下Tire树。1.1 Tire树Trie是一种高效的索引方法,它实际上是一种确定有限自动机(DFA),在树的结构中,每一个结点对应一个DFA状态,... 阅读全文
摘要:
利用Putty登陆到远程主机后,如果长时间没有做任何操作,服务器会与本地客户端断开连接假如设置了会话连接功能,就会每隔多少秒,客户端会发送一个空数据包给服务器,保持连接.1. 打开putty.exe→Connection;2. 登陆主机。看下图:这里注意秒数的设置,如果我这里设置了0,表示关闭会话连... 阅读全文
摘要:
import java.io.BufferedWriter;import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io.FileOutputStream;import java.io.IOExc... 阅读全文
摘要:
前记: 现在有一个想法: 实现自己的一个开源分词系统,这个计划说大不大,说小也不是很easy。目前的计划是先通读 ansj与HanLP的源码。 读源码是一种进步很快的方式,就是刚开始会感觉很痛苦,刚读就发现,所知甚少,所以 吾生也有涯而学也无涯,慢慢来吧 我想会更新一系列关于这两个项目的博文,目前看 阅读全文
摘要:
1文本分类过程例如文档:Good good study Day day up可以用一个文本特征向量来表示,x=(Good, good, study, Day, day , up)。在文本分类中,假设我们有一个文档d∈X,类别c又称为标签。我们把一堆打了标签的文档集合作为训练样本,∈X×C。例如:={... 阅读全文
摘要:
eclipse 下生成jar包第一:普通类导出jar包,我说的普通类就是指此类包含main方法,并且没有用到别的jar包。1.在eclipse中选择你要导出的类或者package,右击,选择Export子选项;2.在弹出的对话框中,选择java文件---选择JAR file,单击next;3.在JA... 阅读全文
摘要:
为什么Python使用过程中会出现各式各样的乱码问题,明明是中文字符却显示成“\xe4\xb8\xad\xe6\x96\x87”的形式?为什么会报错“UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ... 阅读全文
摘要:
此类错误的常见解决办法: 1、是因为.java文件不在项目的src路径内,也就是说源代码未被eclipse编译,字节码不存在无法运行了在项目名上右键 -> Builder Path -> Configure Build Path -> 选择Source面板 再点Add Folder, 把源代码... 阅读全文
摘要:
operator.itemgetter函数operator模块提供的itemgetter函数用于获取对象的哪些维的数据,参数为一些序号(即需要获取的数据在对象中的序号),下面看例子。a = [1,2,3] >>> b=operator.itemgetter(1) //定义函数b,获取对象的... 阅读全文
摘要:
最近在读Thinking In Java,秉着有些地方还能知道自己不会的精神,都去好好查阅了一些资料,在内存分配这一章,看到finalize()这个方法,刚开始很不理解,查阅了一些资料,顺带看了一下final、finally,现在分享一下。一、final的介绍final可用在4个地方,分别是变量(s... 阅读全文