上一页 1 ··· 31 32 33 34 35 36 37 38 39 ··· 41 下一页
  2010年4月7日
摘要: 1.<beautiful data>中的例子,由于没有中文语料库,故用英文串代替,思路一样(如将finallylast)切分成['finally','last']2.代码切分模块代码 Code highlighting produced by Actipro CodeHighlighter (freeware)http://www.CodeHighlighter.com/-->importoperatordefsegment(text):"Returnalistofwordsthatisthebestsegmentationoftex 阅读全文
posted @ 2010-04-07 09:23 finallyly 阅读(3078) 评论(5) 推荐(0) 编辑
  2010年4月4日
摘要: 请你不要再迷恋哥哥只是一个传说虽然我舍不得可是我还是要说你不要再迷恋我我只是一个传说我不曾寂寞因为有你曾陪着我Rap:WheneverybodysayssomeoneisaheroNoonereallyknowsthetruthaboutanidolWhoseinsideisprettylonelynvulnerableWishingtherellbesomeonewhodoknowOnetime... 阅读全文
posted @ 2010-04-04 21:16 finallyly 阅读(356) 评论(0) 推荐(0) 编辑
摘要: http://nltk.googlecode.com/svn/trunk/doc/api/nltk-module.html http://www.tau.ac.il/~kineret/amit/scipy_tutorial/ scipy 的使用说明2)主程序所在目录是模块所在目录的父(或祖辈)目录如下面程序结构:`-- src |-- mod1.py |-- mod2 | `-- mod2.py ... 阅读全文
posted @ 2010-04-04 16:50 finallyly 阅读(1042) 评论(1) 推荐(0) 编辑
  2010年4月1日
摘要: 通过毕设,研究生课程大作业,有以下几点感悟:1.编程语言起码要掌握(C/c++ JAVA)。因为研究生(未进入)程序员工作阶段,发论文为主要工作。最重要的事情是将别人论文中的算法快速实现,将自己的思想实现。两种思路对比,才能得出自己的思路的优点,适用范围,等等诸如此类。所以采用一些稳定的开源代码是一条捷径。但是由于C++和JAVA各擅所长,比如JAVA比C++适合网络编程,而C++与脚本语言pyt... 阅读全文
posted @ 2010-04-01 18:48 finallyly 阅读(1001) 评论(1) 推荐(0) 编辑
  2010年3月30日
摘要: java.io.InputStreamReaderAn InputStreamReader is a bridge from byte streams to character streams: It reads bytes and decodes them into characters using a specified charset. The charset that it uses ma... 阅读全文
posted @ 2010-03-30 15:02 finallyly 阅读(365) 评论(0) 推荐(0) 编辑
  2010年3月28日
摘要: What Is “cnblogs.com”?Due to many foreign friends’ curiosity about the website “cnblogs.com”, I will give a rough introduction below. It is a website for IT programmers t... 阅读全文
posted @ 2010-03-28 11:39 finallyly 阅读(301) 评论(0) 推荐(0) 编辑
  2010年3月20日
摘要: 正文提取部分。这部分实现大部分是参考蛙蛙的,但是作了少许修改。主要在下面两方面:一,动态阈值。蛙蛙设置的是三百,所以他的算法对于短新闻来说失效。我的阈值设置为当前新闻正文所有汉字数量的函数。这样可以避免一些短新闻失效的情况,但还是不够完美。二。有的正文页,含有很多链接到其他新闻的URL,这部分模块汉数量也很大,所以,如果不把这种链接块儿去掉,统计字符进行正文定位的时候,容易跑偏。上代码判断两段儿文... 阅读全文
posted @ 2010-03-20 11:16 finallyly 阅读(2580) 评论(5) 推荐(2) 编辑
摘要: 转载请标明出处。新闻采阅系统效果图 《网页解析器设计》这个题目是我本科毕业设计的题目。时间真快哈,转眼又是一年过去了。去年的这个时候,我正忙着毕设以及考研的复试。那个时候的,未经历过社会的洗礼,对科研,都研究生生活充满了天真而或是白痴般的憧憬。 真是不吃一堑不长一智哈。经过了考研,复试的洗礼。我那幼稚单纯的心,终于开化了,作为一个具有社会属性的人,我也越发市侩和成熟啦。相信我会越走越好的,因为我不... 阅读全文
posted @ 2010-03-20 10:58 finallyly 阅读(6809) 评论(25) 推荐(4) 编辑
  2010年3月18日
摘要: 提问者: yaoyao641 - 三级最佳答案屈折语屈折语以词形变化作为表示语法关系的主要手段,以印欧语系诸语言为代表,如俄语、英语、法语等。其主要特点是: 第一,有比较丰富的词形变化,通过词形变化来表示词与词之 间的关系。例如“他”在英语中居于王格的位置是he,处于宾格的 位置是him,“鹅”的单数形式是goose,复数形式是geese。所谓屈 折... 阅读全文
posted @ 2010-03-18 16:53 finallyly 阅读(635) 评论(0) 推荐(0) 编辑
  2010年3月17日
摘要: 最近要实现一个算法,需要用到矩阵运算,matlab的强项就是进行矩阵运算,所以要高效进行矩阵运算,就要在java中调用matlab。关于环境变量等的相关配置,请大家参考此文http://www.cnblogs.com/allanyz/archive/2009/05/04/1449081.html。下面我要讲的例子是matlab自带的例子,位置在MATLABroot\R2008a\toolbox\j... 阅读全文
posted @ 2010-03-17 23:05 finallyly 阅读(11884) 评论(8) 推荐(1) 编辑
上一页 1 ··· 31 32 33 34 35 36 37 38 39 ··· 41 下一页