摘要:
接触自然语言处理有一年多了,最基本的一些自然是分词,词性标注,命名实体识别之类的知识,有些应用知道原理是一回事,自己动手做起来又是另外一回事了。最近又开始重操旧业:分词。分词最著名的自然就是中科院的分词系统,这几天接触的ICTCLAS5.0(下载的文件夹名称是:ICTCLAS50_Windows_32_JNI)觉得不错,摸索下,记录下心得和收获。.使用http://blog.csdn.net/wangxiafghj/article/details/8147926,我是按照这篇博客的教程操作的,基本没什么问题,可以运行。收获:1.TestMain.java文件中就是由两个函数构成,字面理解,一个 阅读全文
摘要:
接触java有很长一段时间,越来越能体会到语言真的只是一种工具,经常利用java对数据进行清洗,所以最经常用的功能就是文本的读取和写入,但是这最最基本的用法我却用的不熟练,每次用都要翻之前的project,现在特意贴在这边,也方便自己查找。1、读取文本文件 1 public static void read(String fp) throws IOException{ 2 try { 3 BufferedReader br = new BufferedReader(new InputStreamReader(new FileInputStream(fp)... 阅读全文
摘要:
发现假如没有很迫切的实际需求或者外界的压力的话,我这种人就很容易偷懒,之前看了一篇比较权威的谈django的文章,里面列举支持的数据库只有四种,可是我熟悉的数据库只有sqlserver,然后就又怠工了几天,最后还是决定熟悉下mysql(其实语句也没什么很大的区别),最后同学说支持sqlserver,然后发现竟然还真的可以,果真学习的主动性还是不够,我对做网站怎么就这么没有热情呢,反思下!下面进入正题: 安装好django之后,就可以首先创建我们的项目然后进入该目录下,运行我们的项目然后再在浏览器上输入:127.0.0.1:8000就可以看到如下界面,表示我们的项目已经初步创建成功了。接着... 阅读全文
摘要:
这两天打算摸索下和python相关的东西,然后正好小伙伴有个关于网站的任务,就怀着好奇的心态了解了下,然后就很自然地开始涉及django的问题。 首先就是django安装的问题,想不到第一步就出问题了,因为python之前就安装过了,这块没有问题,django的安装按照网上各种教程安装也没有问题,个人推荐这篇博客:http://www.admin10000.com/document/94.html django和python一起验证的时候也没有问题,但是单独验证django的时候总是出问题,敲django-admin.py --version总是得不到想要的结果,怀着科学严谨的态度(↖(^.. 阅读全文
摘要:
如何运行Python程序不少新手朋友遇到的第一个问题,不是Python的数据结构,不是Python的类库使用,更不是第三方模块、框架的应用,而是简单的“如何运行”!Python可用以下三种方式运行,举例在Windows平台上,不过Linux平台亦是如此。1. 使用Python自带的IDLE在开始-->程序-->Python2.5(视你安装的版本而不同)中找到IDLE(Python GUI),点击后弹出如下窗体:在>>>提示符后输入代码,回车,就可以执行此代码。IDLE支持语法高亮,支持自动缩进,支持方法提示,不过提示的很慢。2. 在命令行窗口上运行这种方法的前提是 阅读全文
摘要:
目前已知matlab的聚类方法有三种:一、利用 clusterdata函数对样本数据进行一次聚类,其缺点为可供用户选择的面较窄,不能更改距离的计算方法;二、层次聚类,该方法较为灵活,需要进行细节了解聚类原理,具体需要进行如下过程处理:(1)找到数据集合中变量两两之间的相似性和非相似性,用pdist函数计算变量之间的距离;(2)用 linkage函数定义变量之间的连接;(3)用 cophenetic函数评价聚类信息;(4)用cluster函数创建聚类。三、划分聚类,包括K均值聚类和K中心聚类,同样需要系列步骤完成该过程,要求使用者对聚类原理和过程有较清晰的认识。1.Matlab中相关函数介绍1. 阅读全文
摘要:
最近收到一项新任务,要求两个矩阵的相关系数,说白了就是转换成向量两两计算。本来这个工作我是想自己写个小程序搞定的,但是大家纷纷反映matlab自带了此项功能,本着活到老学到老的心态,我开始查找这个函数,目测貌似有两个函数可以直接调用,首先我们先来介绍下我们这里的相关系数。 皮尔逊积矩相关系数(Pearson product-moment correlation coefficient)通常用γ或ρ表示,是用来度量两个变量之间的相互关系(线性相关)的,取值范围在[-1,+1]之间。 下面再说下可直接调用的函数 1.corrcoefcorrcoef(X):返回从矩阵X形成的一个相关系数矩... 阅读全文