Hanlp 依存句法分析

代码:

复制代码
 1 from pyhanlp import *
 2 
 3 if __name__=="__main__":
 4     sentence=HanLP.parseDependency("1998年11月11日,马化腾和同学张志东在广东省深圳市正式注册成"
 5                                "立‘深圳市腾讯计算机系统有限公司’。")
 6     #print(sentence)
 7 
 8     print(dir(sentence))
 9     for word in sentence.iterator():#dir()可以查看sentence的方法
10         print("%s --(%s)--> %s" % (word.LEMMA, word.DEPREL, word.HEAD.LEMMA))
11     print()
12 
13     # 也可以直接拿到数组,任意顺序或逆序遍历
14     word_array=sentence.getWordArray()
15     for word  in word_array:
16         print("%s --(%s)--> %s" % (word.LEMMA, word.DEPREL, word.HEAD.LEMMA))
17     print()
18 
19     # 还可以直接遍历子树,从某棵子树的某个节点一路遍历到虚根
20     CoNLLWord = JClass("com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord")
21     head = word_array[12]
22     while head.HEAD:
23         head = head.HEAD
24         if (head == CoNLLWord.ROOT):
25             print(head.LEMMA)
26         else:
27             print(" % s - -(% s) --> " % (head.LEMMA, head.DEPREL))
复制代码

 

posted @   博二爷  阅读(1624)  评论(0编辑  收藏  举报
编辑推荐:
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· C#/.NET/.NET Core技术前沿周刊 | 第 29 期(2025年3.1-3.9)
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异
历史上的今天:
2019-10-15 Ubuntu start:未知任务:mysql
点击右上角即可分享
微信分享提示