最近看的2个java库
最近查看新闻推荐算法的库:
https://github.com/bluemapleman/NewsRecommendSystem
基于内容+TFIDF 推荐
TF 词频 可以理解为每个词出现的次数
IDF 逆向文件概率 每个词在词料库中的权重
gecco 爬虫库
https://github.com/xtuhcy/gecco
集成深度遍历,定向采集(列表页,详情页),支持分布式,jsoup解析,json解析
最近查看新闻推荐算法的库:
https://github.com/bluemapleman/NewsRecommendSystem
基于内容+TFIDF 推荐
TF 词频 可以理解为每个词出现的次数
IDF 逆向文件概率 每个词在词料库中的权重
gecco 爬虫库
https://github.com/xtuhcy/gecco
集成深度遍历,定向采集(列表页,详情页),支持分布式,jsoup解析,json解析