上一页 1 ··· 32 33 34 35 36 37 38 39 40 ··· 64 下一页
摘要: 最近在搞聊天数据分析,对文本摘要有需求,学习一下该方法。 一、文本摘要(Document Summarization) 文本摘要,一般地我们会把它分成抽取式文本摘要和生成式文本摘要。就目前的形势而言,工业界应用广泛的还是抽取式文本摘要。抽取式文本摘要的优点很多,主题不易偏离、适应性广、速度快。 抽取 阅读全文
posted @ 2019-12-04 17:36 今夜无风 阅读(4301) 评论(0) 推荐(0) 编辑
摘要: 在聚类时我们需要看到数据的分布情况,更直观的观察数据,可以使用这个。在遇到中文乱码时,可以使用如下代码: 阅读全文
posted @ 2019-11-26 19:05 今夜无风 阅读(9274) 评论(0) 推荐(0) 编辑
摘要: 1.做文本聚类时,有些低频词是分词错误或者无用信息,前期需要处理掉 关键代码: 阅读全文
posted @ 2019-11-26 09:56 今夜无风 阅读(1066) 评论(0) 推荐(0) 编辑
摘要: 以下代码可以让你更加熟悉seq2seq模型机制 参考:https://blog.csdn.net/weixin_43632501/article/details/98525673 阅读全文
posted @ 2019-11-07 11:34 今夜无风 阅读(2183) 评论(0) 推荐(0) 编辑
摘要: 1.知识图谱建立好后,下一步怎么办? 现今,各个行业都在储备自己的数据,领域知识数据的获取已不再是问题。我们能够通过自然语言处理、爬虫技术、装饰器等技术将数据整理成结构化数据,之后再将其放入到已经定义好的知识图谱里,用于支撑上层推理。那好,当你有了知识图谱也就是说有了数据,接下来你要做什么事呢?当然 阅读全文
posted @ 2019-11-04 11:07 今夜无风 阅读(310) 评论(0) 推荐(0) 编辑
摘要: 比较好的一套处理工具吧,感谢作者,原文地址:https://github.com/ownthink/Jiagu 练习一下使用 阅读全文
posted @ 2019-10-21 12:01 今夜无风 阅读(2533) 评论(0) 推荐(0) 编辑
摘要: 最近通过关键词匹配的方式查找数据中的可用样本,由于速度比较慢,所以想把多线程用上去,提高一下速度。现在熟悉一下基本的操作: 阅读全文
posted @ 2019-10-21 10:05 今夜无风 阅读(315) 评论(0) 推荐(0) 编辑
摘要: 在无GPU的情况下,打算安装pytorch跑几个demo练练手,但是pycharm发现总是失败,无法安装成功。错误显示如下: 无奈之下,只能够使用官方推荐的命令pip3安装,命令如下: pip3 install torch==1.2.0+cpu torchvision==0.4.0+cpu -f h 阅读全文
posted @ 2019-09-30 09:11 今夜无风 阅读(9761) 评论(0) 推荐(0) 编辑
摘要: 1.KS值--学习器将正例和反例分开的能力,确定最好的“截断点” KS曲线和ROC曲线都用到了TPR,FPR。KS曲线是把TPR和FPR都作为纵坐标,而样本数作为横坐标。但是AUC只评价了模型的整体训练效果,并没有指出如何划分类别让预估的效果达到最好。不同之处在于,ks取的是TPR和FPR差值的最大 阅读全文
posted @ 2019-09-25 10:04 今夜无风 阅读(8213) 评论(0) 推荐(0) 编辑
摘要: 最近有些懒散了,需要吸收新的知识。 找到一篇非常不错的文章,感谢作者,转载:https://www.cnblogs.com/the-wolf-sky/p/11298117.html 阅读全文
posted @ 2019-09-20 20:32 今夜无风 阅读(272) 评论(0) 推荐(0) 编辑
上一页 1 ··· 32 33 34 35 36 37 38 39 40 ··· 64 下一页