摘要: 编辑Spark中conf中配置文件log4j.properties 设置日志级别为WARN,即:log4j.rootCategory=WARN, console 阅读全文
posted @ 2018-01-30 11:29 右介 阅读(439) 评论(0) 推荐(0) 编辑
摘要: 情景: 利用Solr做一批词的逆文档频率。Solr中存储的每条数据为一篇文章,此时需要查出某词在多少篇文章中出现过,然后用公式:某词逆文档频率 = 总文章数 / (出现过某词的文章数+1) 来计算。 以下两幅图为两种搜索方式的搜索结果对比: 结果:对某词进行搜索时,将某词用英文双引号括起来就是精确搜 阅读全文
posted @ 2018-01-30 10:36 右介 阅读(854) 评论(0) 推荐(0) 编辑