朋友您好,我是黄聪的笔记本博客主人。您可能对搜索引擎原理已经有所了解,也许你是一个SEO,也许你对搜索引擎很感兴趣。但如果您接触搜索引擎时间不久,而且没太多技术基础的话,在使用过程中肯定会遇到各种各样的问题。你可能并不知道如何学习搜索引擎原理,才能够快速的掌握它的精髓。
如果您愿意自己折腾,当然很好。但也有很多朋友,他们希望快速而高效的学习搜索引擎原理的知识。所以,在这里黄聪为您准备了掌握搜索引擎原理所需要的各个方面的教程。
1.1.1、黄聪:搜索引擎的工作原理-基础要求
1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介
1.1.3、黄聪:搜索引擎工作原理-预处理基础简介
1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介
1.1.5、黄聪:搜索引擎工作原理-体系结构
2.1、黄聪:页面搜集原理、技术和系统-基础知识
2.2、黄聪:页面搜集原理、技术和系统-搜集过程
2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义
2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集
2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页
2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统
2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略
2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计
3.1、黄聪:搜集信息的预处理-系统结构
3.1.1、黄聪:搜集信息的预处理-索引网页库
3.1.2、黄聪:搜集信息的预处理-中文分词技术
3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件
3.2、黄聪:搜集信息的预处理-网页净化和消重
3.2.1、黄聪:搜集信息的预处理-净化与数据提取
3.2.2、黄聪:搜集信息的预处理-网页消重
4.1、黄聪:搜集引擎信息查询服务-网页信息检索
4.2、黄聪:搜集引擎信息查询服务-中文自动摘要
4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页
4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存
5.1、黄聪:用户行为分析-用户查询与点击日志
5.2、黄聪:用户行为分析-查询日志分析
5.3、黄聪:用户行为分析-点击日志分析
6.1、黄聪:相关排序-网页权重的计算
6.2、黄聪:相关排序-网页词项权重的计算
6.3、黄聪:相关排序-链接权值的计算
6.4、黄聪:相关排序-用户评价权值的计算
6.5、黄聪:相关排序-最终权值的计算
7、黄聪:中文网页自动分类技术
8、黄聪:搜索引擎工作原理总结
附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu
附2、黄聪:如何搭建TSE搜索引擎
附3、黄聪:如何让TSE搜索引擎重新抓取网页
出处:http://www.cnblogs.com/huangcong/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。