CRF++评测脚本CoNLL 2000

关于CRF++工具如何使用这里就不再赘述了,网上相关资源很多,如官方提供的http://crfpp.googlecode.com/svn/trunk/doc/index.html。虽然http://www.cnts.ua.ac.be/conll2000/chunking/提供了计算正确率,召回率,F值的脚本工具,并给出了使用说明,有需要的话可以自行下载。但统计方法针对IOB2标记方式,采用其它标记方式需要对此脚本进行修改。由于在之前没接触过perl脚本,折腾了一天CoNLL2000,总算看明白了。下面给出了工具中的关键结构

image

如果标记方式发生更改,只需要对统计Chunk开始和结束方法进行修改即可(O-Outside, B-Begin, I-Inside, E-这个我也不知道,End?)

startOfChunk方法,如下:

image

endOfChunk方法,如下:

image

不熟悉perl脚本的孩子,先熟悉一下定义变量规则如以下符号:@,$,%。。。

有疑问共同探讨,谢谢!!!

posted on 2014-03-20 15:52  i_bugs  阅读(1606)  评论(0编辑  收藏  举报

导航