当当网搜索引擎系统
当当网是目前全球最大的中文网上书店之一,提供20多万种中文图书及超过1万种音像商品,每天为成千上万的网上消费者提供服务,有着大量的商品、用户群,以及PageView流量,到当当网进行查询的用户60%以上以网络购物为目的,基于以上特点分析,当当网搜索引擎应具备两个特征:1)超强的查询效率 2)商品检索功能强大。
8848公司为当当网采用了基于倒排文档的检索系统,这种检索技术适合于基于网页的搜索查询。其优点是:查询效率高,速度快,一般为毫秒级,可满足大量并发查询请求。 商品搜索的目的是引导潜在购物者精确选定所需商品,完成购物行为。故所有功能的设计应该以方便用户,并为用户提供各种商品信息为出发点。
主要有以下十大功能 ↓
以下为系统的效果图及功能示意 ↓
8848公司为当当网采用了基于倒排文档的检索系统,这种检索技术适合于基于网页的搜索查询。其优点是:查询效率高,速度快,一般为毫秒级,可满足大量并发查询请求。 商品搜索的目的是引导潜在购物者精确选定所需商品,完成购物行为。故所有功能的设计应该以方便用户,并为用户提供各种商品信息为出发点。
主要有以下十大功能 ↓
全文检索 | 此功能为基本功能,可以根据用户输入的关键词对商品数据进行全文搜索,查找出和关键词匹配的商品结果。支持多关键词查询,方便用户精确命中预期结果 |
多条件检索 | 商品的属性较多,如价格,分类,出版日期等,允许用户通过多种条件进行查询,并按多种属性值排序输出结果。我们允许用户通过多关键字查询,或指定分类进行查询,查询的结果可以按价格从高到低,价格从低到高,出版日期升序,出版日期降序以及按最佳匹配程度等规则输出搜索结果 |
自动滤除重复记录 | 在实际的应用系统中,数据量大的情况下,往往会有重复记录。如当当网的商品会有重复的现象,这样的话用户的搜索结果中可能会出现多个同样的商品的情况,用户体验不好,故本系统应有滤除重复记录的功能 |
关键词纠错 | 用户—特别是使用拼音输入法的用户,查询时可能会将关键词输错,如果系统能自动纠正用户的错误,将可能的正确的关键词提示给用户,则系统的交互性非常好。如:用户输入“兄弟联”,而并没有和此关键词相关的产品,系统会自动提示用户“兄弟连”,避免一些用户因为输入的问题导致找不到自己需要的商品。 |
拼音搜索 | 用户直接输入拼音,我们也会把最可能的关键词提示给用户。这样省去了用户切换输入法的麻烦,方便了用户 |
相关搜索词 | 商品搜索系统的一个主要使命就是引导协助潜在用户完成购物行为。这就需要我们把尽可能多的商品相关信息展示给用户,给用户提供更多的选择,从而增大完成购物行为的几率。 用户通过关键词进行搜索后,系统会提示相关的关键词,用户直接点击就可以查询到相关的内容。如,用户搜索“猫”这个关键词,则系统会自动提示用户很多相关的关键词“波斯猫 大熊猫 黑猫警长 机器猫 加菲猫 蓝猫 老猫 龙猫 猫和老鼠 猫头鹰 猫眼 熊猫”等 |
自动显示折扣信息 | 系统能根据商品的价格属性自动计算折扣信息,并以图片的方式显示给用户。将用户得到的优惠情况直观的表现给用户 |
相关搜索词统计 | 系统每日将用户搜索的关键词进行汇总,并计算出查询量最多的词。而这些词则是商家的最具价值的参考资料,通过这些词商家可以分析出用户最感兴趣的内容,并据引调整进货,存储以及销售的策略,创造更多的效益 |
自动更新数据 | 系统可完全自动更新数据,无人值守的情况下也能正常运转,并可自由设置更新时间,自动备份数据 |
自动监测网站运行状况 | 用户可通过服务器端软件监控指定服务器,当出现服务停止,结果异常等情况时按预定策略处理,如重启网络服务,重启服务器等,保障网络服务的正常运转,有效减轻工作人员的工作量 |
以下为系统的效果图及功能示意 ↓