spacy入门一

一.中文库下载

国内可以使用镜像https://hf-mirror.com/下载。地址:https://hf-mirror.com/spacy/zh_core_web_md/tree/main,中文所以下载的是zh_core_web_md-any-py3-none-any.whl。然后使用pip install安装。

二.简单测试

复制代码
import spacy
from spacy.language import Language
# 自定义管道组件
@Language.component("custom_component")
def custom_component(doc):
    print("自定义管道组件:",doc)
    print(type(doc))
    return doc

# 下载并加载中文模型
# 可以从 https://github.com/howl-anderson/spacy_model 获取中文模型
nlp = spacy.load('zh_core_web_md')
nlp.add_pipe("custom_component",last=True)

# 分词并打印实体
text = "中国是一个伟大的国家,它拥有庞大的人口和丰富的文化。"
doc = nlp(text)

tokens=[token.text for token in doc]
print("分词结果:",tokens)

pos_tags=[(token.text,token.pos_)for token in doc]
print("词性标注结果:",pos_tags)

entities=[(ent.text,ent.label_)for ent in doc.ents]
print("实体识别结果:",entities)

dependency_tree=[(token.text,token.dep_,token.head.text)for token in doc]
print("依赖关系分析结果:",dependency_tree)
复制代码

三、运行结果

 

posted @   社会主义接班人  阅读(128)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· Ollama——大语言模型本地部署的极速利器
· DeepSeek如何颠覆传统软件测试?测试工程师会被淘汰吗?
历史上的今天:
2016-04-10 Node.js进程管理之进程集群
2016-04-10 Node.js进程管理之子进程
点击右上角即可分享
微信分享提示