【NLP中的BIO标注】

序列标注

序列标注是指对一段元素序列中的每一元素或部分元素进行标签标注的任务,对部分元素进行标签标注的任务又称作联合标注,而对每一元素都进行标签标注的任务称为原始标注。

BIO标注

BIO标注就是联合标注的一种,具体地B、I、O 分别表示Begin Inner Other

进一步地来说,B-X表示元素是X类型并且位于片段的起始位置,I-X表示元素是X类型并且位于元素片段的中间,O则表示元素不属于X类型。

示例:

B-NP 名词短语的起始位置

I-NP 名词短语的中间位置

O 不是名词短语

BIO标注可以用于命名实体识别中,假设我们将实体(人名、地名、组织、机构、时间)作为标签,可以得到:

B-NM

B-PLA

B-ORG等类型的标签

作者:Arkon

出处:https://www.cnblogs.com/arkon/p/16009884.html

版权:本作品采用「署名-非商业性使用-相同方式共享 4.0 国际」许可协议进行许可。

posted @   ArkonLu  阅读(3557)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 地球OL攻略 —— 某应届生求职总结
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 提示词工程——AI应用必不可少的技术
· .NET周刊【3月第1期 2025-03-02】
more_horiz
keyboard_arrow_up dark_mode palette
选择主题
点击右上角即可分享
微信分享提示