week07 13.3 NewsPipeline之 三News Deduper之 tf_idf 查重
摘要:
我们运行看结果 安装包sklearn 安装numpy 安装scipy 终于可以啦 我们把安装的包都写在文件里面吧 4行4列 轴对称 只需要看一半就可以 横着看 竖着看都行 数值越接近1 表示越相似 我们通过这个可以将新的新闻(还未加入数据库的新闻)放在左上角 然后mongodb存的老新闻和他比较 如 阅读全文
posted @ 2018-09-07 15:00 PoeticalJustice 阅读(234) 评论(0) 推荐(0) 编辑