摘要: ICTCLAS是中科院计算所研发的中文分词软件,这个软件在第一届国际中文处理研究机构SigHan组织的评测中都获得了多项第一名,是公认的当今最好的中文分词软件。综合性能:ICTCLAS 2011分词速500KB/s左右,分词精度98.45%。官网地址:http://ictclas.org/软件下载下载地址:http://ictclas.org/ictclas_download.aspx下载的时候需要填下姓名和邮箱,然后就可以下载,是免费的。我下载的是C++版的,当然也有Java版的,目前只支持这两种语言。下载解压后有四个文件夹,分别是: API: Demo: Doc:使用文档 Smaple:给 阅读全文
posted @ 2012-06-28 21:17 小卡的土豆园 阅读(2969) 评论(6) 推荐(0) 编辑
摘要: SSH是一种安全的文件传输格式。一般在Linux下使用,有些客户端如putty也支持Windows。 阅读全文
posted @ 2012-06-18 21:54 小卡的土豆园 阅读(210) 评论(0) 推荐(0) 编辑
摘要: 目录命令转到home: cd ~转到目录的上层: cd ../转到目录的上上层: cd ../..返回进入当前目录前所在目录: cd -复制文件(将文件file复制到目录a下): cp file/ a复制软件安装-删除 删除软件: sudo apt-get remove SOFTNAME- 清理 清理旧版本的软件缓存: sudo apt-get autoclean 清理所有软件缓存:sudo apt-get clean 删除系统不再使用的孤立软件:sudo apt-get autoremove- 版本 查看Ubuntu版本: cat /etc/issue 查看Ubuntu... 阅读全文
posted @ 2012-06-10 14:45 小卡的土豆园 阅读(170) 评论(0) 推荐(0) 编辑
摘要: 使用方法: 使用Cygwin的binHadoop是在Linux下面的软件,会调用Shell,如果在Windows下面自然是跑不起来了,但是即使不安装Cygwin也可以在Path中添加Cygwin的bin的路径,从而使用Cygwin下一些模拟Linux环境的程序进行Linux的环境模拟。使用过程中遇到的错误之前在AWS上用没那么多事儿,不知道为什么在自己的电脑上跑就错误频频。1. 用户名错误各位看官,注意,一定一定不要把自己的电脑的用户名或者计算机名里包含上空格!!由于我装系统时候一时脑残,用左脑果断的扼死了右脑的诉求,将用户名起成:potato kaa。使用的时候瞬间内流满面了。Hadoop报 阅读全文
posted @ 2012-05-30 15:12 小卡的土豆园 阅读(2713) 评论(0) 推荐(0) 编辑
摘要: 1. 编译文件编译C++需要使用G++命令,举个栗子g++ -o 1config 1config.cpp //编译文件./1config //执行编译好的可执行文件其中-o 指定生成可执行文件的名字,由于省略的名称是a.out,如果是Cygwin下是a.exe,改个名字比较清楚一点。2. 执行文件 阅读全文
posted @ 2012-05-22 11:11 小卡的土豆园 阅读(217) 评论(0) 推荐(0) 编辑
摘要: 用到一些日期的计算和比较,需要用到java.util中的Calendar类型1. 生成日历 - 用日期生成:其中日期是Yyyy-Mm-Dd的格式的String date;Calendar calendar = TimeUtil.getCalenar(pubDate); - 用时间生成: 时间格式是Yyyy-Mm-Dd Hh:Mm:SsString time = "2012-05-08 13:18:00"java.text.DateFormat df = new java.text.SimpleDateFormat("yyyy-MM-dd HH:mm:ss" 阅读全文
posted @ 2012-05-18 13:26 小卡的土豆园 阅读(305) 评论(0) 推荐(0) 编辑
摘要: 因为只是要写个脚本下数据,o(T.T)o,所以就浅尝辄止下下。只是需要用到的用法用下。注: Cygwin环境下的,由于是模拟环境所以有些写法和Linux不一样。1. 数组简单小程序:name=(a b c d e f g h)for i in ${name[*]}doecho $idone要注意的是,首先书写不能像在C++和Java中那么随意,运算符号什么的一定要紧靠着写,譬如说上例中第一句写成:name = (a b c d e f g h ) 就会报错。或者可以直接写成for i in a b c d e f g hdoecho $idone2. While 循环While循环的判断条件不 阅读全文
posted @ 2012-04-25 19:37 小卡的土豆园 阅读(554) 评论(0) 推荐(0) 编辑
摘要: 由于Windows下文件换行符是 "\r\n",而Linux下文件换行符是 "\n",所以在windows下编辑器编辑的脚本在Cygwin下不能运行。解决办法:使用dos2Unix命令:dos2unix ./run当然这个命令还有从Linux下格式转换成Windows的,是unix2dos。 阅读全文
posted @ 2012-04-24 15:17 小卡的土豆园 阅读(815) 评论(2) 推荐(0) 编辑
摘要: 抽象类:类的设计应当保证父类包含子类的共同特征,有时为了方便会将父类设计的特别抽象以至于没有具体实例,称之为抽象类。-多重继承:需要从多个类中派生出一个子类,这种能力叫做多重继承。-单重继承:每个子类都是直接从父类继承的。(Java、C++)如:圆、椭圆、正方形等等都可以抽象成为几何图形,几何图形便是一个抽象类。几何图形中含有派生类中的一些共有函数,如计算周长和面积,这些在抽象类中都无法计算,所以设置为抽象方法。这些抽象方法会在派生类中实现。抽象类(几何图形)举例:public abstract class GeometricObject { private String color =... 阅读全文
posted @ 2012-04-15 21:37 小卡的土豆园 阅读(349) 评论(0) 推荐(0) 编辑
摘要: 1. 下载JDBC jar包 JDBC的包在mySql的官网上就有下,第一次下需要填个小表格。2. 连接数据库 使用JDBC连接数据库和ODBC差不多,需要用户名密码什么的。代码: String url = "jdbc:mysql://localhost:3306/TableName"; //建立连接 Connection conn = (Connection) DriverManager.getConnection(url, User, Password); conn.close(); //关闭连接 当然getCon... 阅读全文
posted @ 2012-04-04 21:52 小卡的土豆园 阅读(377) 评论(0) 推荐(0) 编辑