01 2016 档案
摘要:gensim 是处理文本的很强大的工具包,基于python环境下: 1.gensim可以做什么? 它可以完成的任务,参加gensim 主页API中给出的介绍,链接如下: http://radimrehurek.com/gensim/apiref.html 2.word2vec的使用 其中学习词向量的
阅读全文
摘要:关于word2vec,这方面无论中英文的参考资料相当的多,英文方面既可以看官方推荐的论文,也可以看gensim作者Radim Řehůřek博士写得一些文章。而中文方面,推荐 @licstar的《Deep Learning in NLP (一)词向量和语言模型》,有道技术沙龙的《Deep Learn
阅读全文
摘要:【本文转自http://ir.dlut.edu.cn/NewsShow.aspx?ID=253,感谢原作者】 word2vec是一个将单词转换成向量形式的工具。可以把对文本内容的处理简化为向量空间中的向量运算,计算出向量空间上的相似度,来表示文本语义上的相似度。 一、理论概述 (主要来源于http:
阅读全文
摘要:一,简介 LibSVM是台湾林智仁(Chih-Jen Lin)教授2001年开发的一套支持向量机的库,这套库运算速度还是挺快的,因此成为目前国内应用最多的SVM的库。详细的使用说明及博主博客见下链接: http://endual.iteye.com/blog/1267442。 这套库可以从http:
阅读全文
摘要:IR的评价指标-MAP,NDCG和MRR MAP(Mean Average Precision): 单个主题的平均准确率是每篇相关文档检索出后的准确率的平均值。主集合的平均准确率(MAP)是每个主题的平均准确率的平均值。MAP 是反映系统在全部相关文档上性能的单值指标。系统检索出来的相关文档越靠前(
阅读全文
摘要:下面是25个Java机器学习的工具&&库列表: 1. Weka 是一个数据挖掘任务机器学习算法的集合。这些算法可以直接应用于数据集或者在你自己的Java代码中调用。Weka 包含 数据预处理、分类、回归、聚类、关联规则、可视化 等工具。 2. Massive Online Analysis (MOA
阅读全文
摘要:'JAVAC' 不是内部或外部命令解决方法 'JAVAC' 不是内部或外部命令,也不是可运行的程序 或批处理文件。 'JAVA' 不是内部或外部命令,也不是可运行的程序 或批处理文件解决办法相似。 原因一:没有安装jdk,只安装了jre 1 jdk1.7.0_60+jre才是完整的,如果没有安装j
阅读全文

浙公网安备 33010602011771号