比特是信息的价值。
一个一千篇网页的站,如果一个词语在所有的页面中都出现,那该词就不具备建立索引的资格。因为他不能说明哪个页面的主题。这个词用idf计算也是负值。
网页的排名,递归值的运算,主要是相关性的计算,不是精确的布尔逻辑计算。
Powered by: 博客园 Copyright © 2024 龍騎少校 Powered by .NET 8.0 on Kubernetes