Handlp 分词、加词典、关键字提取、摘要、短语提取、依法依据分析(含代码、直接运行即可)
简单分词:
1 from pyhanlp import * 2 content = "现如今,机器学习和深度学习带动人工智能飞速的发展,并在图片处理、语音识别领域取得巨大成功。" 3 Get_value=HanLP.segment(content) 4 print(Get_value)
输出:
加词典:
1 from pyhanlp import * 2 content = "现如今,机器学习和深度学习带动人工智能飞速的发展,并在图片处理、语音识别领域取得巨大成功。" 3 # insert会覆盖字典中已经存在的词,add会跳过已经存在的词 4 CustomDictionary.add("图片处理", "nr 300") 5 CustomDictionary.insert("语音识别", "nz 1024") 6 CustomDictionary.add("巨大成功", "nz 1024 n 1") 7 8 Get_value=HanLP.segment(content)
输出:
关键字提取:
1 from pyhanlp import * 2 document = "水利部水资源司司长陈明忠9月29日在国务院新闻办举行的新闻发布会上透露," \ 3 "根据刚刚完成了水资源管理制度的考核,有部分省接近了红线的指标," \ 4 "有部分省超过红线的指标,对一些超过红线的地方,陈明忠表示,对一些取用水项目进行区域的限批," \ 5 "严格地进行水资源论证和取水许可的批准。" 6 #关键字 7 print(HanLP.extractKeyword(document, 2))
输出:
摘要:
1 #摘要 2 print(HanLP.extractSummary(document, 4))
输出:
短语:
1 #短语 2 phrases = HanLP.extractPhrase(document,10) 3 print(phrases)
依法依词分析
1 #依法依据分析 2 sentence = HanLP.parseDependency(document) 3 for word in sentence.iterator(): # 通过dir()可以查看sentence的方法 4 print("%d %s/%s --(%s)--> %s(%s)" % (word.ID, word.LEMMA, word.POSTAG, word.DEPREL, word.HEAD.LEMMA, word.HEAD.ID))
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· C#/.NET/.NET Core技术前沿周刊 | 第 29 期(2025年3.1-3.9)
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异
2019-03-14 第三堂课测试——数组文件
2019-03-14 第三周