Stanford CoreNLP使用需要注意的一点

1、Stanford CoreNLP maven依赖,jdk依赖1.8

<dependency>
<groupId>edu.stanford.nlp</groupId>
<artifactId>stanford-corenlp</artifactId>
<version>3.6.0</version>
</dependency>
<dependency>
<groupId>edu.stanford.nlp</groupId>
<artifactId>stanford-corenlp</artifactId>
<version>3.6.0</version>
<classifier>models</classifier>
</dependency>
<dependency>
<groupId>edu.stanford.nlp</groupId>
<artifactId>stanford-corenlp</artifactId>
<version>3.6.0</version>
<classifier>models-chinese</classifier>
</dependency>

2、Stanford CoreNLP分词、分句、词性标注、命名实体识别、语法分析本身支持很多,但是全部

使用会导致性能很差,比如我们实际使用中需要使用ner, parse, mention, coref可以先不适用。

annotators = segment, ssplit, pos, lemma,ner, parse, mention, coref
因为涉及复杂解析时时间复杂度很高

连接

https://stackoverflow.com/questions/29543274/stanford-nlp-annotate-text-is-very-slow

Is the text a single long sentence? The runtime of the parser is O(n^3) with respect to the length of the sentence, which gets quite slow on sentences longer than ~40 words. If you remove the "parse, dcoref, regexner" annotators, does it speed up? And, does it then slow down again if you re-add "parse"?

3、程序的配置使用还是很方便的,可以在自己开发中借鉴使用。

posted @   杉枫  阅读(2834)  评论(0编辑  收藏  举报
编辑推荐:
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
阅读排行:
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· Ollama——大语言模型本地部署的极速利器
· DeepSeek如何颠覆传统软件测试?测试工程师会被淘汰吗?
点击右上角即可分享
微信分享提示