【搜索引擎 (一)】绪论

  自己对搜索引擎有一些兴趣,而且也选修了这门课,看到的搜索引擎用到的知识还是挺丰富有深度的,所以准备写个系列的文章,参考《现代信息检索》(贝佐·耶茨)和一些其他教材。

  搜索引擎中用到的技术

  由于搜索引擎用到的技术实在太多,所以不能一一列举。并且事实上中文博客中搜索引擎的知识主要集中在基础的知识上,所以搜索引擎的知识要讲的话就不会再重复太多讲过的知识,而是更加系统的项目上了。

  关于搜索引擎计划要开始以下的部分:

  1. 索引和倒排索引、哈希表、跳表

  2. 文本分类

  3. Page-Rank算法

  4. 大规模爬虫、去重用的局部敏感哈希

  5. 社交网络、协同过滤

  6. 查询策略

  7. 为什么叫做搜索引擎,为什么不叫数据库?

  8. 图聚类

      这些只是一些想到的部分,以后不一定要按照顺序来写。

posted @   stackupdown  阅读(264)  评论(0编辑  收藏  举报
编辑推荐:
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
阅读排行:
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
点击右上角即可分享
微信分享提示