随笔 - 404  文章 - 0  评论 - 1037  阅读 - 136万 
03 2010 档案
JAVA io 流初学
摘要:java.io.InputStreamReaderAn InputStreamReader is a bridge from byte streams to character streams: It reads bytes and decodes them into characters using a specified charset. The charset that it uses ma... 阅读全文
posted @ 2010-03-30 15:02 finallyly 阅读(365) 评论(0) 推荐(0) 编辑
英语作业(general version an narrow version about sth)
摘要:What Is “cnblogs.com”?Due to many foreign friends’ curiosity about the website “cnblogs.com”, I will give a rough introduction below. It is a website for IT programmers t... 阅读全文
posted @ 2010-03-28 11:39 finallyly 阅读(305) 评论(0) 推荐(0) 编辑
驴子的新闻提取系统(二)
摘要:正文提取部分。这部分实现大部分是参考蛙蛙的,但是作了少许修改。主要在下面两方面:一,动态阈值。蛙蛙设置的是三百,所以他的算法对于短新闻来说失效。我的阈值设置为当前新闻正文所有汉字数量的函数。这样可以避免一些短新闻失效的情况,但还是不够完美。二。有的正文页,含有很多链接到其他新闻的URL,这部分模块汉数量也很大,所以,如果不把这种链接块儿去掉,统计字符进行正文定位的时候,容易跑偏。上代码判断两段儿文... 阅读全文
posted @ 2010-03-20 11:16 finallyly 阅读(2581) 评论(5) 推荐(2) 编辑
驴子的新闻提取系统(一)
摘要:转载请标明出处。新闻采阅系统效果图 《网页解析器设计》这个题目是我本科毕业设计的题目。时间真快哈,转眼又是一年过去了。去年的这个时候,我正忙着毕设以及考研的复试。那个时候的,未经历过社会的洗礼,对科研,都研究生生活充满了天真而或是白痴般的憧憬。 真是不吃一堑不长一智哈。经过了考研,复试的洗礼。我那幼稚单纯的心,终于开化了,作为一个具有社会属性的人,我也越发市侩和成熟啦。相信我会越走越好的,因为我不... 阅读全文
posted @ 2010-03-20 10:58 finallyly 阅读(6817) 评论(25) 推荐(4) 编辑
语种说明
摘要:提问者: yaoyao641 - 三级最佳答案屈折语屈折语以词形变化作为表示语法关系的主要手段,以印欧语系诸语言为代表,如俄语、英语、法语等。其主要特点是: 第一,有比较丰富的词形变化,通过词形变化来表示词与词之 间的关系。例如“他”在英语中居于王格的位置是he,处于宾格的 位置是him,“鹅”的单数形式是goose,复数形式是geese。所谓屈 折... 阅读全文
posted @ 2010-03-18 16:53 finallyly 阅读(665) 评论(0) 推荐(0) 编辑
初探java和matlab混合编程
摘要:最近要实现一个算法,需要用到矩阵运算,matlab的强项就是进行矩阵运算,所以要高效进行矩阵运算,就要在java中调用matlab。关于环境变量等的相关配置,请大家参考此文http://www.cnblogs.com/allanyz/archive/2009/05/04/1449081.html。下面我要讲的例子是matlab自带的例子,位置在MATLABroot\R2008a\toolbox\j... 阅读全文
posted @ 2010-03-17 23:05 finallyly 阅读(11885) 评论(8) 推荐(1) 编辑
相对熵(relative entropy或 Kullback-Leibler divergence,KL距离)的java实现(三)
摘要:代码下载http://files.cnblogs.com/finallyliuyu/KL.rar主函数代码 主函数代码 Code highlighting produced by Actipro CodeHighlighter (freeware)http://www.CodeHighlighter.com/--publicstaticvoidmain(String[]args)throwsFi... 阅读全文
posted @ 2010-03-12 10:34 finallyly 阅读(3868) 评论(1) 推荐(1) 编辑
相对熵(relative entropy或 Kullback-Leibler divergence,KL距离)的java实现(二)
摘要:实验中,我们采用两种方法计算概率。一:以字符为单位计算概率;二:以汉语词为单位计算概率在第二种情况下,我们采用Jeasy分词组件进行分词处理,该分词组件为基于前向最大匹配的分词方法,分词结果在绝大多数情况下是正确的。[代码]2.读取文件模块读取文件Code highlighting produced by Actipro CodeHighlighter (freeware)http://www.C... 阅读全文
posted @ 2010-03-12 10:21 finallyly 阅读(4443) 评论(0) 推荐(1) 编辑
使用eclipse 初学java
摘要:最近在做网页信息抽取方面的课题,从上研究生以来一直用C#,可是去年做信息检索大作业的时候发现了C#的弱点:开源的东西太少了,且不成熟。比如LUCENE.NET,WINISTA HTML PARSER 都是一编译就出N个exception,那个SHARPICT也是不够稳定,所以我要改行用JAVA了。因为JAVA这方面的开源软件已经很成熟啦。说道,做到,从现在开始就开始向JAVA进军。1. 使用ecl... 阅读全文
posted @ 2010-03-02 16:16 finallyly 阅读(624) 评论(3) 推荐(0) 编辑

点击右上角即可分享
微信分享提示