摘要:
最近在搞聊天数据分析,对文本摘要有需求,学习一下该方法。 一、文本摘要(Document Summarization) 文本摘要,一般地我们会把它分成抽取式文本摘要和生成式文本摘要。就目前的形势而言,工业界应用广泛的还是抽取式文本摘要。抽取式文本摘要的优点很多,主题不易偏离、适应性广、速度快。 抽取 阅读全文
摘要:
在聚类时我们需要看到数据的分布情况,更直观的观察数据,可以使用这个。在遇到中文乱码时,可以使用如下代码: 阅读全文
摘要:
1.做文本聚类时,有些低频词是分词错误或者无用信息,前期需要处理掉 关键代码: 阅读全文
摘要:
以下代码可以让你更加熟悉seq2seq模型机制 参考:https://blog.csdn.net/weixin_43632501/article/details/98525673 阅读全文
摘要:
1.知识图谱建立好后,下一步怎么办? 现今,各个行业都在储备自己的数据,领域知识数据的获取已不再是问题。我们能够通过自然语言处理、爬虫技术、装饰器等技术将数据整理成结构化数据,之后再将其放入到已经定义好的知识图谱里,用于支撑上层推理。那好,当你有了知识图谱也就是说有了数据,接下来你要做什么事呢?当然 阅读全文
摘要:
比较好的一套处理工具吧,感谢作者,原文地址:https://github.com/ownthink/Jiagu 练习一下使用 阅读全文
摘要:
最近通过关键词匹配的方式查找数据中的可用样本,由于速度比较慢,所以想把多线程用上去,提高一下速度。现在熟悉一下基本的操作: 阅读全文
摘要:
在无GPU的情况下,打算安装pytorch跑几个demo练练手,但是pycharm发现总是失败,无法安装成功。错误显示如下: 无奈之下,只能够使用官方推荐的命令pip3安装,命令如下: pip3 install torch==1.2.0+cpu torchvision==0.4.0+cpu -f h 阅读全文
摘要:
1.KS值--学习器将正例和反例分开的能力,确定最好的“截断点” KS曲线和ROC曲线都用到了TPR,FPR。KS曲线是把TPR和FPR都作为纵坐标,而样本数作为横坐标。但是AUC只评价了模型的整体训练效果,并没有指出如何划分类别让预估的效果达到最好。不同之处在于,ks取的是TPR和FPR差值的最大 阅读全文
摘要:
最近有些懒散了,需要吸收新的知识。 找到一篇非常不错的文章,感谢作者,转载:https://www.cnblogs.com/the-wolf-sky/p/11298117.html 阅读全文