摘要: 摘选自 :CRF++: Yet Another CRF toolkit Usage: 1.输入输出文件 由许多token组成,每一行称之为一个token,每个token包含许多列,一般第0列是词本身,最后一列是词应该输出的标记(状态),中间的列是词的Pos,可以有多个,例如可以是词性等 输出文件与输 阅读全文
posted @ 2016-04-04 17:21 celia01 阅读(2829) 评论(0) 推荐(0) 编辑
摘要: Link-based Classification相关数据集DatasetsDocument Classification Datasets:CiteSeer: The CiteSeer dataset consists of 3312 scientific publications classif... 阅读全文
posted @ 2015-07-14 16:18 celia01 阅读(499) 评论(0) 推荐(0) 编辑
摘要: http://desert3.iteye.com/blog/772246 1 import csv 2 3 #从文件读取 4 reader = csv.reader(file(srcFilePath,'rb')) 5 6 for line in reader: 7 #忽略第一行 8 ... 阅读全文
posted @ 2015-06-02 22:23 celia01 阅读(335) 评论(0) 推荐(0) 编辑
摘要: 斯坦福deep learning教程中的自稀疏编码器的练习,主要是参考了 http://www.cnblogs.com/tornadomeet/archive/2013/03/20/2970724.html,没有参考肯定编不出来。。。Σ( ° △ °|||)︴ 也当自己理解了一下这里的自稀疏编码器,... 阅读全文
posted @ 2015-05-22 14:57 celia01 阅读(428) 评论(0) 推荐(0) 编辑
摘要: EM算法,之前上模式识别课上,推导过,在《统计学习方法》中没耐性的看过几次,个人感觉讲的过于理论,当时没怎么看懂,后来学lda,想要自己实现一下em算法,又忘记了,看来还是学的不够仔细,认识的不够深刻,现在做点笔记。本文是看了几篇blog和《统计学习方法》之后做的笔记,只是用来给自己做记录,很多... 阅读全文
posted @ 2015-05-10 16:40 celia01 阅读(418) 评论(0) 推荐(0) 编辑
摘要: 这是更新scipy出现的结果,需要新版本的scipy,而机器上只装了0.7的版本,更新的时候报错,找到了一个解决方法:wget http://mirror.centos.org/centos/6/os/x86_64/Packages/lapack-devel-3.2.1-4.el6.x86_64.r... 阅读全文
posted @ 2015-04-02 12:10 celia01 阅读(9431) 评论(0) 推荐(0) 编辑
摘要: 每次手推公式就会遇见各种不会的,在网上搜了个总结的还不错的常用求导公式。。。继续更新中……一、基本线性代数以下部分原文地址:http://blog.163.com/live_freely/blog/static/151142060201023154057339/在网上看到有人贴了如下求导公式:Y =... 阅读全文
posted @ 2014-12-10 16:47 celia01 阅读(1248) 评论(0) 推荐(0) 编辑
摘要: 刚开始同步系统的接触python和linux,在昊妹妹的指引下学习了使用python管理工具,希望能够通过不断熟练来学习1.记录之前先复习以下linux下常用目录./ 表示当前目录~/ 表示home目录文件夹or文件前加 . 表示隐藏文件夹or文件,ls命令无法查看隐藏文件,需要带参数-a2.pyt... 阅读全文
posted @ 2014-10-31 14:00 celia01 阅读(275) 评论(0) 推荐(0) 编辑
摘要: 开始学习用python实现机器学习的算法,用到了numpy库,好多函数不清楚。google上找到numpy的官网,可以链接到numpy的reference:http://docs.scipy.org/doc/numpy/reference/这里仅记录学习过程中用到的:【转】配置python命令tab... 阅读全文
posted @ 2014-10-30 15:53 celia01 阅读(663) 评论(0) 推荐(0) 编辑
摘要: 原文地址:http://www.itwhy.org/%E8%BD%AF%E4%BB%B6%E5%B7%A5%E7%A8%8B/python/python-%E7%AC%AC%E4%B8%89%E6%96%B9-http-%E5%BA%93-requests-%E5%AD%A6%E4%B9%A0.htmlRequests 是用Python语言编写,基于 urllib,采用 Apache2 Licensed 开源协议的 HTTP 库。它比 urllib 更加方便,可以节约我们大量的工作,完全满足 HTTP 测试需求。Requests 的哲学是以 PEP 20 的习语为中心开发的,所以它比 urll 阅读全文
posted @ 2014-04-07 19:51 celia01 阅读(326) 评论(0) 推荐(0) 编辑