摘要: 最近打算研究输入法的东西,看看设计原理的同时,顺带着了解了下搜狗输入法,搜狗真不愧是输入法界的老大哥,学到了很多以前不知道的用法,牛牪犇! 下面就简要的介绍下今天所了解到的搜狗输入法不是很常用但是很牛叉的用法:一、特殊符号√(dg)△▲(sjx)◇◆(lx)□■(fk)○●(yq)☆★(wjx... 阅读全文
posted @ 2014-10-09 10:42 紫巅草 阅读(1525) 评论(0) 推荐(0) 编辑
摘要: 特征抽取算是自然语言处理领域一个比较重要的概念了,近期由于需要又要重新回顾下这方面的知识,顺便也总结下所有的方法。特征抽取就是找出一些词来代表文本,主题上既能表达文本所要传递的内容,形式上又要精炼精简。那什么样的词才能代表这篇文本呢?很自然的我们就会想到经常出现的词即词频很高的词。这样又带来一个问题... 阅读全文
posted @ 2014-09-01 16:06 紫巅草 阅读(518) 评论(0) 推荐(0) 编辑
摘要: 经常会用到集合的遍历,但是还是记不住常用的遍历方法,每次都得到处去找,现在索性就都找好了放在博客里面,方便以后查阅的同时也顺带着水一篇博客。一、map遍历方法一:System.out.println("通过Map.keySet遍历key和value:");for (String key : map.... 阅读全文
posted @ 2014-09-01 10:31 紫巅草 阅读(227) 评论(0) 推荐(0) 编辑
摘要: 前段时候由于项目的原因,需要画图,然后开始接触R语言的igraph包,网上零零散散的搜罗了不少的信息,放在这边交流分享的同时也给自己留个备份吧~ 1.首先是读取文件,基本选用的都是csv文件 edge1=1]$size=4V(g)[deg>=2]$size=6V(g)[deg>=3]$size... 阅读全文
posted @ 2014-08-26 13:48 紫巅草 阅读(15212) 评论(0) 推荐(0) 编辑
摘要: 假设检验的基本原理就是小概率事件原理,即观测小概率事件在假设成立的情况下是否发生。如果在一次试验中,小概率事件发生了,那么说明假设在一定的显著性水平下不可靠或者不成立;如果在一次试验中,小概率事件没有发生,那么也只能说明没有足够理由相信假设是错误的,但是也并不能说明假设是正确的,因为无法收集到所... 阅读全文
posted @ 2014-06-17 21:29 紫巅草 阅读(1378) 评论(0) 推荐(0) 编辑
摘要: 前几天重新了下系统,所以JDK也要重新安装,顺带温故了安装及配置的过程,记录下来。(安装的版本是JDK1.7.0) 后面基本都是点下一步(i第一步选:开发工具),路径我改为E:/java/jdk 1.7.0,后面JRE的路径也是E:/java/jre7 然后一直继续就可以完成安装,剩下的就是... 阅读全文
posted @ 2014-05-20 10:12 紫巅草 阅读(198) 评论(0) 推荐(0) 编辑
摘要: stanford自然语言处理开源了很多工具,很实用也很方便,记录下来,以备后用。第一篇就从句法分析开始吧(所用的平台都是java+eclipse)。《一》操作1.http://www-nlp.stanford.edu/software/lex-parser.shtml先从这边下载(想把附件贴上来,但... 阅读全文
posted @ 2014-05-12 17:18 紫巅草 阅读(713) 评论(0) 推荐(0) 编辑
摘要: 近期由于需要重拾数据结构,然后就遇到了二叉树的遍历,众所周知,二叉树的遍历有三种:先序、中序和后序。根据其中两种遍历顺序的组合基本就可以推导出原来二叉树的样子(排除个别特殊的先序和后序的组合)。 下面我们就来总结下如何推导。先序和中序 个人觉得只要给出的遍历顺序有先序就很好办,按照先序的顺序逐个安排下元素的位置(以先为主,辅以中序),基本图形就出来。下面举个例子吧: (1)先序:-+a*b-cd/ef 中序:a+b*c-d-e/f 首先根节点一定是-,然后看-在中序中不是最后,说明-既有左子树也有右子树,那么+就是-的左孩子,然后就是a,a在中序中在+的左边,所以a是+的左孩子... 阅读全文
posted @ 2014-03-24 21:15 紫巅草 阅读(1306) 评论(0) 推荐(0) 编辑
摘要: 近期处理的数据规模比较大,正好又是统计合并的事情,想着借助excel就可以完成了,然后就了解了下java读取excel的事情。 读取的文件主要分两类:xls文件、xlsx文件。xls文件的相关操作用的是jxl.jar包,只要将这个包导入即可。xlsx文件的相关操作是利用apache的poi包。一、xls文件(一个jar包:jxl.jar)1)创建package jexcel; import java.io.*; import jxl.*; import jxl.write.*; /** * @author Ken * * To change the templ... 阅读全文
posted @ 2014-03-03 16:38 紫巅草 阅读(2114) 评论(0) 推荐(0) 编辑
摘要: 近期准备句法分析的前期工作,要进行句法分析很自然的就需要句法规则,我们用的是统计的方法,打算从清华大学的树库中抽取规则。早期也曾将清华大学的树库解析成树结构,但是直观解析出的结果是多叉树,提取规则的时候不是很方便,现在把多叉树转换成了二叉树,提取起规则来就方便多了。 多叉树与二叉树之间的转换其实比较简单,多叉树看起来更直观具体些,二叉树呢,每个节点最多只能有两个子节点,若一个节点的孩子节点个数大于两个就不好直接处理,二叉树的处理方法是左右结点明确区分开来,左节点为第一个孩子节点,右节点为第一个兄弟节点。那么两者就可以形成映射,互相转换。 举一个例子,直观点(后面这个二叉树的图我承认画... 阅读全文
posted @ 2014-02-27 10:16 紫巅草 阅读(1024) 评论(0) 推荐(0) 编辑