摘要: BM25 is a bag-of-words retrieval function that ranks a set of documents based on the query terms appearing in each document, regardless of the inter-r 阅读全文
posted @ 2016-02-16 18:18 Django's blog 阅读(5897) 评论(0) 推荐(0) 编辑
摘要: 这篇文章是对数据科学的简介,这门学科最近太火了。机器学习的竞赛也越来越多(如,Kaggle, TudedIT),而且他们的资金通常很可观。 R和Python是提供给数据科学家的最常用的两种工具。每一个工具都有其优缺点,但Python最近在各个方面都有所胜出(仅为鄙人愚见,虽然我两者都用)。这一切的发 阅读全文
posted @ 2016-02-16 15:14 Django's blog 阅读(894) 评论(0) 推荐(0) 编辑
摘要: http://blog.csdn.net/zm2714/article/details/8016323 re模块 开始使用re Python通过re模块提供对正则表达式的支持。使用re的一般步骤是先将正则表达式的字符串形式编译为Pattern实例,然后使用Pattern实例处理文本并获得匹配结果(一 阅读全文
posted @ 2016-02-16 10:51 Django's blog 阅读(346) 评论(0) 推荐(0) 编辑