BronyaSilverwing布洛妮娅的工作室

NER

Bronya·2024-11-18 09:38·42 次阅读

Named Entity Recognition (NER)，即命名实体识别，是自然语言处理（NLP）中的一种基本任务，旨在识别文本中的特定实体并将其分类为预定义的类别。常见的命名实体类别包括：

人名（PERSON）：识别文本中的人名，例如 "马云"、"Elon Musk"。
地名（LOCATION）：识别文本中的地理位置名称，例如 "北京"、"纽约"。
机构名（ORGANIZATION）：识别公司、组织、机构名称，例如 "阿里巴巴"、"Google"。
时间（DATE/TIME）：识别日期、时间等，例如 "2023年11月"、"下午3点"。
货币（MONEY）：识别货币数额，例如 "100美元"。
百分比（PERCENT）：识别百分比值，例如 "20%"。
产品（PRODUCT）：识别产品或品牌名称，例如 "iPhone"。

举例#

假设有以下句子：

"2024年，苹果公司在纽约发布了最新款iPhone，售价为999美元。"

通过 NER 处理后，可以识别出：

"2024年" → DATE
"苹果公司" → ORGANIZATION
"纽约" → LOCATION
"iPhone" → PRODUCT
"999美元" → MONEY

NER 的应用#

信息抽取：从新闻、文章、社交媒体中抽取关键实体，方便后续数据分析。
知识图谱****构建：为知识图谱提供结构化的实体节点和关系。
搜索引擎：识别用户搜索中的关键实体，优化搜索结果。
对话系统：理解用户输入中的实体，提升对话理解和响应能力。

常用的 NER 方法#

基于规则的方法：使用预定义的模式和词典，适合结构化文本，但灵活性较低。
机器学习方法：基于统计模型（如 CRF、HMM），依赖手动特征工程，效果有限。
深度学习方法：基于 LSTM、Bi-LSTM、Transformer 等模型，效果显著提升。近年来，BERT、GPT 等预训练模型在 NER 任务中表现尤为出色。

工具和库#

SpaCy：Python 中的开源 NLP 库，支持多种语言的 NER。
NLTK：Python 中经典的 NLP 库，也包含基本的 NER 功能。
Stanza：斯坦福大学推出的 NLP 工具，支持 NER。
Hugging Face Transformers：提供多种预训练模型，可用于 NER 任务。

posted @ 2024-11-18 09:38 Bronya_Silverwing 阅读(42) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· BLEU(Bilingual Evaluation Understudy)

· 最短路径算法

· 命名实体识别(NER)简介

· Python系列：NLP系列二：命名实体识别（NER）、用深度学习实现命名实体识别（NER）

· 5分钟NLP：快速实现NER的3个预训练库总结

阅读排行：
· Manus重磅发布：全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后，我竟然真的恢复了删除的微信聊天记录！
· 没有Manus邀请码？试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY

公告

1058天14小时50分11秒

昵称： Bronya_Silverwing
园龄： 2年10个月
粉丝： 2
关注： 1

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔档案

阅读排行榜

目录

✕