摘要: UltraEdit风格正则表达式语法1、%功能说明: 匹配一行的开始位置。这个符号表示所寻找的字符在每一行的开始的位置,不包括每一行其上一行的结束字符。2、$功能说明:匹配一行的结束位置。这个符号表示所寻找的字符在每一行的结束的位置。这个$和上面说的“行头”恰恰相反,它是“行尾”。3、?功能说明:匹配每一个字符,除了“换行符”以外。4、*功能说明:匹配任意个数的任何字符,除了“换行符”以外。5、+功能说明:匹配一个或多个所提到的字符或是表达式,至少要出现一次。不匹配重复的“换行符”。6、++功能说明:匹配零次或是很多次所提到的字符或表达式,不匹配重复的“换行符”。7、^b功能说明:匹配分页符。 阅读全文
posted @ 2012-04-23 13:05 todoit 阅读(1140) 评论(0) 推荐(0) 编辑
摘要: http://blog.csdn.net/wen718/article/details/5960666在对汉语分词性能进行评估时,采用了常用的3个评测指标:准确率(P)、召回率(R)、综合指标F值(F)。准确率表示在切分的全部词语中,正确的所占的比值。召回率指在所有切分词语中(包括切分的和不应该忽略的),正确切分的词语所占的比值。准确率描述系统切分的词语中,正确的占多少。召回率表示应该得到的词语中,系统正确切分出了多少。计算公式如下:P= 准确切分的词语数/切分出的所有词语数R=准确切分的词语数/应该切分的词语数实际评估一个系统时,应同时考虑P和R,但同时要比较两个数值,很难做到一目了然。所以 阅读全文
posted @ 2012-04-23 11:27 todoit 阅读(1893) 评论(0) 推荐(0) 编辑