上一页 1 ··· 33 34 35 36 37 38 39 40 41 ··· 78 下一页
摘要: BM25 is a bag-of-words retrieval function that ranks a set of documents based on the query terms appearing in each document, regardless of the inter-r 阅读全文
posted @ 2016-02-16 18:18 Django's blog 阅读(5897) 评论(0) 推荐(0) 编辑
摘要: 这篇文章是对数据科学的简介,这门学科最近太火了。机器学习的竞赛也越来越多(如,Kaggle, TudedIT),而且他们的资金通常很可观。 R和Python是提供给数据科学家的最常用的两种工具。每一个工具都有其优缺点,但Python最近在各个方面都有所胜出(仅为鄙人愚见,虽然我两者都用)。这一切的发 阅读全文
posted @ 2016-02-16 15:14 Django's blog 阅读(894) 评论(0) 推荐(0) 编辑
摘要: http://blog.csdn.net/zm2714/article/details/8016323 re模块 开始使用re Python通过re模块提供对正则表达式的支持。使用re的一般步骤是先将正则表达式的字符串形式编译为Pattern实例,然后使用Pattern实例处理文本并获得匹配结果(一 阅读全文
posted @ 2016-02-16 10:51 Django's blog 阅读(346) 评论(0) 推荐(0) 编辑
摘要: TF-IDF及其算法概念 TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数... 阅读全文
posted @ 2016-01-07 12:10 Django's blog 阅读(283) 评论(0) 推荐(0) 编辑
摘要: http://www.ruanyifeng.com/blog/2013/03/cosine_similarity.html作者:阮一峰日期:2013年3月21日(一):自动提取关键词这个标题看上去好像很复杂,其实我要谈的是一个很简单的问题。有一篇很长的文章,我要用计算机提取它的关键词(Automat... 阅读全文
posted @ 2016-01-07 11:41 Django's blog 阅读(316) 评论(0) 推荐(0) 编辑
摘要: import timeitt1 = timeit.timeit('sum(x*x for x in xrange(10000))',number = 10000)print t1 阅读全文
posted @ 2015-11-19 16:43 Django's blog 阅读(250) 评论(0) 推荐(0) 编辑
摘要: 安装numpy 和 scipysudo yum install lapack lapack-devel blas blas-develsudo yum install numpy.x86_64下载scipy,解压之后sudo python setup.py install安装pip复制代码代码如下:... 阅读全文
posted @ 2015-11-19 15:49 Django's blog 阅读(561) 评论(0) 推荐(0) 编辑
摘要: fuzzywuzzy用于字符串匹配率、令牌匹配等复制代码代码如下:from fuzzywuzzy import fuzzfuzz.ratio("Hit me with your best shot", "Hit me with your pet shark")# 85 阅读全文
posted @ 2015-11-12 17:18 Django's blog 阅读(1374) 评论(0) 推荐(0) 编辑
摘要: linux sort 命令详解sort是在Linux里非常常用的一个命令,管排序的,集中精力,五分钟搞定sort,现在开始!1 sort的工作原理sort将文件的每一行作为一个单位,相互比较,比较原则是从首字符向后,依次按ASCII码值进行比较,最后将他们按升序输出。[rocrocket@rocro... 阅读全文
posted @ 2015-07-23 11:35 Django's blog 阅读(302) 评论(0) 推荐(0) 编辑
摘要: 感谢百小度治哥,该文原地址:here经Edwin Chen的推荐,认识了scikit-learn这个非常强大的python机器学习工具包。这个帖子作为笔记。(其实都没有笔记的意义,因为他家文档做的太好了,不过还是为自己记记吧,为以后节省若干分钟)。如果有幸此文被想用scikit-learn的你看见,... 阅读全文
posted @ 2015-07-20 20:24 Django's blog 阅读(673) 评论(0) 推荐(0) 编辑
上一页 1 ··· 33 34 35 36 37 38 39 40 41 ··· 78 下一页