上一页 1 ··· 37 38 39 40 41 42 43 44 45 ··· 78 下一页
摘要: 老套的搬用一下rsync的介绍,rsync是Linux系统下的数据镜像备份工具,从软件的命名上就可以看出来了——remote sync。rsync支持大多数的类Unix系统,无论是Linux、Solaris还是BSD上都经过了良好的测试。它的特性如下:1、可以镜像保存整个目录树和文件系统。2、可以很... 阅读全文
posted @ 2015-01-15 16:51 Django's blog 阅读(663) 评论(0) 推荐(0) 编辑
摘要: http://www.hankcs.com/nlp/parsing/crf-sequence-annotation-chinese-dependency-parser-implementation-based-on-java.html这是一个基于CRF的中文依存句法分析器,内部CRF模型的特征函数采... 阅读全文
posted @ 2015-01-15 12:12 Django's blog 阅读(1647) 评论(0) 推荐(0) 编辑
摘要: 算法+语料≈NLP这是一个六千万词汇量的分类词库,做HanLP这么久,我逐渐体会到,算法无法解决所有问题,词库也非常重要。通常一个算法可以解决80%的问题,剩下的20%无论怎么调节优化,都是拆东墙补西墙。比如上次我提到的“区人保”被HMM人名识别模块误命中的例子,这个词让HMM来看,“区”作为姓氏,... 阅读全文
posted @ 2015-01-15 12:09 Django's blog 阅读(2160) 评论(0) 推荐(2) 编辑
摘要: http://www.hankcs.com/nlp/ner/place-names-to-identify-actual-hmm-viterbi-role-labeling.html命名实体识别(Named Entity Recognition)也是自然语言处理中的一个难关,特别是中文这样没有大小写... 阅读全文
posted @ 2015-01-14 18:16 Django's blog 阅读(1222) 评论(0) 推荐(0) 编辑
摘要: 与基于隐马尔可夫模型的最短路径分词、N-最短路径分词相比,基于随机条件场(CRF)的分词对未登录词有更好的支持。本文(HanLP)使用纯Java实现CRF模型的读取与维特比后向解码,内部特征函数采用双数组Trie树(DoubleArrayTrie)储存,得到了一个高性能的中文分词器。CRF简介CRF... 阅读全文
posted @ 2015-01-14 17:50 Django's blog 阅读(1726) 评论(2) 推荐(1) 编辑
摘要: http://www.hankcs.com/nlp/part-of-speech-tagging.html词性标注(Part-of-Speech tagging 或POS tagging),又称词类标注或者简称标注,是指为分词结果中的每个单词标注一个正确的词性的程序,也即确定每个词是名词、动词、形容... 阅读全文
posted @ 2015-01-14 17:48 Django's blog 阅读(1099) 评论(0) 推荐(0) 编辑
摘要: http://www.hankcs.com/nlp/hmm-and-segmentation-tagging-named-entity-recognition.htmlHMM(隐马尔可夫模型)是用来描述隐含未知参数的统计模型,举一个经典的例子:一个东京的朋友每天根据天气{下雨,天晴}决定当天的活动{... 阅读全文
posted @ 2015-01-14 17:15 Django's blog 阅读(1315) 评论(0) 推荐(0) 编辑
摘要: 为什么要用转义字符串?HTML中,&等有特殊含义(,用于链接签,&用于转义),不能直接使用。这些符号是不显示在我们最终看到的网页里的,那如果我们希望在网页中显示这些符号,该怎么办呢?这就要说到HTML转义字符串(Escape Sequence)了。转义字符串(Escape Sequence)也称字符... 阅读全文
posted @ 2015-01-14 12:19 Django's blog 阅读(858) 评论(0) 推荐(0) 编辑
摘要: 正则表达式用于字符串处理、表单验证等场合,实用高效。现将一些常用的表达式收集于此,以备不时之需。用户名:/^[a-z0-9_-]{3,16}$/密码:/^[a-z0-9_-]{6,18}$/十六进制值:/^#?([a-f0-9]{6}|[a-f0-9]{3})$/电子邮箱:/^([a-z0-9_\.... 阅读全文
posted @ 2015-01-14 12:16 Django's blog 阅读(494) 评论(0) 推荐(0) 编辑
摘要: http://blog.csdn.net/lsldd/article/details/41223147从这一章开始进入正式的算法学习。首先我们学习经典而有效的分类算法:决策树分类算法。1、决策树算法决策树用树形结构对样本的属性进行分类,是最直观的分类算法,而且也可以用于回归。不过对于一些特殊的逻辑分... 阅读全文
posted @ 2015-01-07 19:14 Django's blog 阅读(927) 评论(0) 推荐(0) 编辑
上一页 1 ··· 37 38 39 40 41 42 43 44 45 ··· 78 下一页