左手中倒影

hadoop技术控 大数据解决方案 hanlp研究爱好者
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理
上一页 1 2 3 4 5 6 7 8 ··· 19 下一页

2019年5月20日

摘要: 作者:baiziyu 关于hanlp的文章已经分享过很多,似乎好像大部分以理论性的居多。最近有在整理一些hanlp应用项目中的文章,待整理完成后会陆续分享出来。本篇分享的依然是由baiziyu 分享的一篇文章,感兴趣的可以在知乎上关注下他的专栏,写的还是挺好的! 以下为文章的主要内容: 自定义词表的 阅读全文

posted @ 2019-05-20 09:09 左手中倒影 阅读(176) 评论(0) 推荐(0) 编辑

2019年5月18日

摘要: Pyhanlp分词与词性标注的相关内容记得此前是有分享过的。可能时间太久记不太清楚了。以下文章是分享自“baiziyu”所写(小部分内容有修改),供大家学习参考之用。 简介 pyhanlp是HanLP的Python接口。因此后续所有关于pyhanlp的文章中也会写成HanLP。HanLP是完全用Ja 阅读全文

posted @ 2019-05-18 09:50 左手中倒影 阅读(413) 评论(0) 推荐(0) 编辑

2019年5月17日

摘要: 本篇给大家分享baiziyu 写的HanLP 中的N-最短路径分词。以为下分享的原文,部分地方有稍作修改,内容仅供大家学习交流! 首先说明在HanLP对外提供的接口中没有使用N-最短路径分词器的,作者在官网中写到这个分词器对于实体识别来说会比最短路径分词稍好,但是它的速度会很慢。对此我有点个人看法, 阅读全文

posted @ 2019-05-17 09:25 左手中倒影 阅读(314) 评论(0) 推荐(0) 编辑

2019年5月13日

摘要: 中文分词是中文文本处理的一个基础步骤,也是中文人机自然语言交互的基础模块。不同于英文的是,中文句子中没有词的界限,因此在进行中文自然语言处理时,通常需要先进行分词,分词效果将直接影响词性、句法树等模块的效果。当然分词只是一个工具,场景不同,要求也不同。 在人机自然语言交互中,成熟的中文分词算法能够达 阅读全文

posted @ 2019-05-13 09:50 左手中倒影 阅读(774) 评论(0) 推荐(0) 编辑

2019年5月10日

摘要: HanLP 1.7.3 发布了。HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 在提供丰富功能的同时,HanLP 内部模块坚持低耦合、模型坚持惰性加载、服务坚持静态提供、词典 阅读全文

posted @ 2019-05-10 09:24 左手中倒影 阅读(151) 评论(0) 推荐(0) 编辑

2019年5月8日

摘要: HanLP分词,如README中所说,如果没有特殊需求,可以通过maven配置,如果要添加自定义词典,需要下载“依赖jar包和用户字典". 分享某大神的示例经验: 是直接"java xf hanlp-1.6.8-sources.jar" 解压源码,把源码加入工程(依赖本地jar包,有些麻烦,有时候到 阅读全文

posted @ 2019-05-08 09:28 左手中倒影 阅读(638) 评论(0) 推荐(0) 编辑

2019年5月6日

摘要: 使用 HanLP - 汉语言处理包 来处理,他能处理很多事情,如分词、调用分词器、命名实体识别、人名识别、地名识别、词性识别、篇章理解、关键词提取、简繁拼音转换、拼音转换、根据输入智能推荐、自定义分词器 使用很简单,只要引入hanlp.jar包,便可处理(新版本的hanlp安装包可以去github下 阅读全文

posted @ 2019-05-06 10:18 左手中倒影 阅读(2704) 评论(0) 推荐(0) 编辑

2019年4月30日

摘要: 1. 整体思路 第一步:先将中文文本进行分词,这里使用的HanLP-汉语言处理包进行中文文本分词。 第二步:使用停用词表,去除分好的词中的停用词。 2. 中文文本分词环境配置 使用的HanLP-汉语言处理包进行中文文本分词。 ·HanLP-汉语言处理包下载,可以去github上下载 ·HanLP 的 阅读全文

posted @ 2019-04-30 09:09 左手中倒影 阅读(1458) 评论(0) 推荐(0) 编辑

2019年4月26日

摘要: 说明 ·目前的实现方式是以远程词库的内容重新构建CustomDictionary.trie,demo主要是为了实现同步远程词库,对性能暂不作考虑,对性能要求要以CustomDictionary.dat为基础实现 按hanlp作者述 trie后期可能会取消 目前CustomDictionary使用DA 阅读全文

posted @ 2019-04-26 10:38 左手中倒影 阅读(534) 评论(1) 推荐(0) 编辑

2019年4月24日

摘要: ·支持中文分词(N-最短路分词、CRF分词、索引分词、用户自定义词典、词性标注),命名实体识别(中国人名、音译人名、日本人名、地名、实体机构名识别),关键词提取,自动摘要,短语提取,拼音转换,简繁转换,文本推荐,依存句法分析(MaxEnt依存句法分析、CRF依存句法分析) 阅读全文

posted @ 2019-04-24 10:44 左手中倒影 阅读(690) 评论(0) 推荐(0) 编辑

上一页 1 2 3 4 5 6 7 8 ··· 19 下一页