solr相关文章

 

Solr集群架构概述及delta-import详细配置

背景 由于项目原因,重新熟悉了下Solr,版本为3.6,搭建了主从Solr服务,并使用DIH从RDBMS数据源增量更新索引。 其实也没什么技术含量,就是简单做个总结,分别从部署架构和增量更新两个方面说明下。 Solr Replication solr的主从其实是他的replication集群,从本质上说是通过ReplicationHandler来实现的,除了solr server之间可以互相同步之外,每个solr实例内部的core之间也是可以实现同步的,而能自身同步自身的实例称为Repeater,它的存在...
 阅读(225) 评论(0)
 
 

学术分享搜索平台——中期报告

一、      项目概况 学术分享搜索引擎主要基于爬取的学术数据,提供搜索,可视化,推荐三大块功能,并且支持用户分享感兴趣的学术资源,结合“众包”来打造一个更社交化的学术搜索平台。相比于传统的学术搜索,可视化和用户的加入能让平台帮助用户发现更多的东西。 我的工作是整个平台的开发和搭建。从数据上说,涵盖了数据爬取,数据处理,分布式存储,建立索引等工作;从功能上说,涵盖了网站搭建,搜索服务,可视化...
 阅读(599) 评论(0)
 
 

学术分享搜索平台——设计方案

项目背景 有两类和我们大学生息息相关的产品。一类是微博,人人,豆瓣这些偏SNS的社交平台,推荐同学朋友的信息,帮助我们找到可能认识的人,可能喜欢的书,可能爱看的电影等等。另一类是学术相关的搜索引擎,比如Google Scholar,Microsoft Academic Search Engine,通过搜索关键字,提供一些匹配度最高的学术论文,提供很多便利。 然而,学术搜索引擎是一个比较通用...
 阅读(1001) 评论(2)
 
 

Solr搜索服务架构图

分享我自己的Solr搜索服务架构图以及几张Solr的架构图。 在Google Doc上的两页ppt: 刚开始在gliffy上画的同上的一张图 Solr的整体架构图: 更具体的solr request: Solr兼容lucene,多种方式建立索引的架构图: 更多关于如何定制solr搜索服务的文章,见之...
 阅读(1315) 评论(1)
 
 

solr进阶: 如何定制搜索服务,扩展搜索逻辑

前两天发了篇"剖析solr实用性",主要黑了solr建索引让我觉得不舒服,还黑了solr只是个通用的丢入了servlet容器里的简单服务,事实证明我错了。这篇博客我要纠正并回答那篇博客里自己总结的问题:如何定制solr实现自己的搜索服务。 solr是一个可扩展的服务,我们可以添加自己的包和类,在solr已经实现的default处理逻辑之上,再添加我们自己的搜索逻辑。实现手段就是继承solr的基础...
 阅读(1364) 评论(6)
 
 

剖析solr实用性

我的使用经历 使用solr3.6版本,配合自己用lucene3.6建立的索引,搭建了一个搜索服务,前台通过http访问solr服务,获取由solr排序后的结果集。环境是linux ubuntu,servlet容器是tomcat。这个搜索服务是提供给php开发人员使用的。根据我现在对solr的理解和使用感受,我想说说solr这玩意儿的实用性。 我对solr的理解 solr包装了luce...
 阅读(716) 评论(0)
 
 

Solr配置搜索服务

背景 我用Lucene3.6,为php语言搭建的平台提供一套搜索服务,但是lucene只是个提供索引操作的库,需要一个web-service来提供给java外的语言,使之可以通过http方式发送搜索请求并得到如json, xml格式的查询结果集数据。而Solr是一个二次包装了Lucene库的搜索服务容器,兼容lucene的api,可以在jetty或者Tomcat这样的容器里以web服务的方式启动...
 

Solr的配置及从数据库建立索引

    Solr 是一个基于 Lucene 的 Java 搜索引擎服务器。 Solr 提供了层面搜索、命中醒目显示并且支持多种输出格式(包括 XML/XSLT 和 JSON 格式)。它易于安装和配置,而且附带了一个基于 HTTP 的管理界面。 Solr 已经在众多大型的网站中使用,较为成熟和稳定。 Solr 包装并扩展了 Lucene ,所以 Solr 的基本上沿用了 Lucene 的相关术语。更重要的是, Solr 创建的索引与 Lucene 搜索引擎库完全兼容。通过对 Solr 进行适当的配置,某些情况下可能需要进行编码, Solr 可以阅读和使用构建到其他 Lucene 应用程序中的索引。此外,很多 Lucene 工具(如 Nutch 、 Luke )也可以使用 Solr 创建的索引。

 

Apache SolrCloud介绍及安装

在我们应用还很渺小的时候,一台Solr服务器能完全胜任这份工作,随着我们应用慢慢长大,访问也越来越多,一台Solr服务器的弊病也逐渐显现如查询变慢了,机器宕机就无法继续提供服务,于是乎我们引入了Solr集群,通过前端负载均衡和索引Replication来分担一台机器的压力,这样既能提高查询速度,也能避免单机故障问题而且是可伸缩的解决方案,一切看起来很OK,问题也暂时解决了,但是好景不长,随着应用的发展,数据也在与日俱增,需要索引的数据也越来越多,索引文件变得越来越庞大,Replication索引变得越来越低效高成本,每个Solr实例都保存全量大索引数据的方式显然又成了系统性能和可伸缩性的瓶颈,如果能将大索引文件切分,分布在集群中不同机器中且查询的准确性和可用性又不会受到影响该是件多么美好的事情啊,于是SolrCloud出现了...
SolrCloud是基于ZooKeeper和Solr的分布式解决方案,为Solr添加分布式功能,用于建立高可用,高伸缩,自动容错,分布式索引,分布式查询的Solr服务器集群;SolrCloud并非一个新的软件发布包,而是Solr4.0版本新增组件用于跟ZooKeeper配合提供分布式功能,部署时只是修改启动配置;
 
 

Apache Solr DataImportHandler Scheduler

I'm creating this project so that people don't have to build DIH Scheduler source themselves.

The source was originally published in Solr Wiki and soon after, understandably, more and more people started asking for compiled version so they can just drop a JAR file in their deployed Solr's lib folder, customize their scheduler params and start using it.

So here it is (on the Downloads page). Enjoy it and please feel free to post any questions and suggestions here.

 

Solr Documentation

Official documentation for the latest release of Solr can be found on the Solr website. Of particular note is the Solr Reference Guide which is published by the project after each minor release.

The rest of this wiki is community edited and captures version agnostic information, User submitted Tips & Tricks, historical information on Solr, as well as some areas of Solr not yet covered in the Reference Guide.

 

 

Java 技术专区技术播客系列:第3 季Grant Ingersoll 谈Mahout 与机器 ...

搜索结果描述:Grant Ingersoll 讲解本次课程,Grant 是Lucid Imagination 首席科学家, ... 项目的 推崇者,我想我们可以开始我们的会话了,Grant,请首先介绍一下什么是. Mahout。 
搜索结果 URL:http://www.ibm.com/developerworks/cn/java/j-gloverpodcast3/glover-ingersoll-110811-zh.pdf

搜索结果标题:

使用Apache Lucene 和Solr 4 实现下一代搜索和分析

搜索结果描述:2013年12月5日 ... Grant Ingersoll 是Lucid Imagination 的创始人和技术成员之一。Grant 的编程兴趣 包括信息检索、机器学习、文本分类和提取。Grant 是Apache ... 
搜索结果 URL:http://www.ibm.com/developerworks/cn/java/j-solr-lucene/

搜索结果标题:

Grant Ingersoll 探讨Solr 和Lucene - IBM

搜索结果描述:浏览IBM developerWorks 中国网站Java technology 专区所有文章的列表。您可以 按作者或主题查看列表,也可以按日期或技术级别排序列表。 
搜索结果 URL:http://www.ibm.com/developerworks/cn/views/java/libraryview.jsp?sort_by=&show_abstract=true&show_all=&search_flag=&contentarea_by=Java+technology&search_by=apache+solr&topic_by=-1&type_by=%E6%89%80%E6%9C%89%E7%B1%BB%E5%88%AB&ibm-search=%E6%90%9C%E7%B4%A2

搜索结果标题:

Apache Mahout 简介

搜索结果描述:2009年10月12日 ... Grant Ingersoll 是Lucid Imagination 的创始人及技术人员之一。Grant 的编程兴趣 包括信息检索、机器学习、文本分类和提取。Grant 是Apache ... 
搜索结果 URL:http://www.ibm.com/developerworks/cn/java/j-mahout/

搜索结果标题:

Apache Mahout:适合所有人的可扩展机器学习框架

搜索结果描述:2011年12月15日 ... Apache Mahout 专家Grant Ingersoll 引领您快速了解最新版本Mahout 中的机器 学习库,并通过示例说明如何部署和扩展Mahout 的某些最常用的 ... 
搜索结果 URL:http://www.ibm.com/developerworks/cn/java/j-mahout-scaling/

搜索结果标题:

使用Apache Lucene 和Solr 进行位置感知搜索

搜索结果描述:2010年2月22日 ... Grant Ingersoll 是Lucid Imagination 的创始人和技术成员之一。Grant 的编程兴趣 包括信息检索、机器学习、文本分类和提取。Grant 是Apache ... 
搜索结果 URL:http://www.ibm.com/developerworks/cn/java/j-spatial/

搜索结果标题:

Java 技术播客系列: Andrew Glover 采访多位技术专家的访谈记录

搜索结果描述:2013年12月9日 ... 立即收听 (中文对话脚本): Apache Mahout 和创始人Grant Ingersoll 介绍了机器 学习和所涉及的概念,并解释了如何将其应用到现实环境应用程序中 ... 
搜索结果 URL:http://www.ibm.com/developerworks/cn/java/j-gloverpodcast3/

搜索结果标题:

使用Apache Solr 实现更加灵巧的搜索,第1 部分: 基本特性和Solr 模式

搜索结果描述:2007年7月2日 ... 在这篇分两部分的文章中,Lucene Java™ 的提交人Grant Ingersoll 将介绍Solr 并 向您展示如何轻松地将其表现优异的全文本搜索功能加入到Web ... 
搜索结果 URL:http://www.ibm.com/developerworks/cn/java/j-solr1/

搜索结果标题:

使用Apache Solr 实现更加灵巧的搜索,第2 部分: 用于企业的Solr

搜索结果描述:2007年7月2日 ... 在本部分中,Lucene Java 的提交人Grant Ingersoll 通过对用于企业的特性(包括 管理界面、高级配置选项)以及与性能相关的特性(比如缓存、复制和 ... 
搜索结果 URL:http://www.ibm.com/developerworks/cn/java/j-solr2/

搜索结果标题:

IBM developerWorks 中国: Java technology : 文档库

搜索结果描述:Lucene 和Solr 提交者Grant Ingersoll 介绍了与相关性、分布式搜索和分面(facet) 相关的最新Lucene 和Solr 功能。本文将学习如何利用这些功能构建快速、高效、可 ... 
搜索结果 URL:http://www.ibm.com/developerworks/cn/views/java/articles.jsp?view_by=search&search_by=lucene

搜索结果标题:

IBM developerWorks : Open source : 文档库

搜索结果描述:Lucene 和Solr 提交者Grant Ingersoll 介绍了与相关性、分布式搜索和分面(facet) 相关的最新Lucene 和Solr 功能。本文将学习如何利用这些功能构建快速、高效、可 ... 
搜索结果 URL:http://www.ibm.com/developerworks/cn/views/opensource/libraryview.jsp?search_by=Lucene

搜索结果标题:

IBM developerWorks : Open source : 文档库

搜索结果描述:在这篇分两部分的文章中,Lucene Java 的提交人Grant Ingersoll 将介绍Solr 并向 您展示如何轻松地将其表现优异的全文本搜索功能加入到Web 应用程序中。 
搜索结果 URL:http://www.ibm.com/developerworks/cn/views/opensource/articles.jsp?search_by=Apache

搜索结果标题:

数据科学与开源

搜索结果描述:2013年8月9日 ... “Apache Mahout:适合所有人的可扩展机器学习框架”(Grant Ingersoll, developerWorks,2011 年11 月):Mahout 提交者Ingersoll 介绍了Mahout ... 
搜索结果 URL:http://www.ibm.com/developerworks/cn/opensource/os-datascience/index.html?ca=drs-

搜索结果标题:

IBM developerWorks 中国: Java technology : 文档库

搜索结果描述:Apache Mahout 项目旨在帮助开发人员更加方便快捷地创建智能应用程序。Mahout 的创始者Grant Ingersoll 介绍了机器学习的基本概念,并演示了如何使用Mahout ... 
搜索结果 URL:http://www.ibm.com/developerworks/cn/views/java/libraryview.jsp?site_id=10&contentarea_by=Java&sort_by=Title&sort_order=1&start=1&end=34&topic_by=SPRING&product_by=&type_by=%E6%8A%80%E6%9C%AF%E6%96%87%E7%AB%A0&show_abstract=true&search_by=&industry_by=&series_title_by=

搜索结果标题:

IBM developerWorks 中国: Information management : 文档库

搜索结果描述:在这篇分两部分的文章中,Lucene Java 的提交人Grant Ingersoll 将介绍Solr 并向 您展示如何轻松地将其表现优异的全文本搜索功能加入到Web 应用程序中。 
搜索结果 URL:http://www.ibm.com/developerworks/cn/views/data/libraryview.jsp?search_by=%E6%90%9C%E7%B4%A2

搜索结果标题:

基于Apache Mahout 构建社会化推荐引擎

搜索结果描述:2010年1月21日 ... “Apache Mahout 简介” (Grant Ingersoll,developerWorks,2009 年10 月):Mahout 的创始者Grant Ingersoll 介绍了机器学习的基本概念,并演示了 ... 
搜索结果 URL:http://www.ibm.com/developerworks/cn/java/j-lo-mahout/?cmp=dw&cpb=dw&ct=dwcom&cr=dwcom&ccy=cn

搜索结果标题:

IBM developerWorks 中国: 文档库

搜索结果描述:Lucene 和Solr 提交者Grant Ingersoll 介绍了与相关性、分布式搜索和分面(facet) 相关的最新Lucene 和Solr 功能。本文将学习如何利用这些功能构建快速、高效、可 ... 
搜索结果 URL:http://www.ibm.com/developerworks/cn/library/

搜索结果标题:

Apache Solr 的新特性

搜索结果描述:2008年11月25日 ... 在本文中,Solr 和Lucene 的负责人Grant Ingersoll 详细介绍了Solr 1.3 的新改进, 包括分布式搜索、轻松数据库导入、集成拼写检查和新的扩展API ... 
搜索结果 URL:http://www.ibm.com/developerworks/cn/java/j-solr-update/?...2012-06-09

搜索结果标题:

IBM developerWorks 中国: Security : 文档库

搜索结果描述:Lucene 和Solr 提交者Grant Ingersoll 介绍了与相关性、分布式搜索和分面(facet) 相关的最新Lucene 和Solr 功能。本文将学习如何利用这些功能构建快速、高效、可 ... 
搜索结果 URL:http://www.ibm.com/developerworks/cn/views/security/tutorials.jsp?cv_doc_id=85035

搜索结果标题:

IBM developerWorks : Open source : 文档库

搜索结果描述:Apache Mahout 项目旨在帮助开发人员更加方便快捷地创建智能应用程序。Mahout 的创始者Grant Ingersoll 介绍了机器学习的基本概念,并演示了如何使用Mahout ... 
搜索结果 URL:http://www.ibm.com/developerworks/cn/views/opensource/libraryview.jsp?end_no=221&lcl_sort_order=asc&type_by=%E6%89%80%E6%9C%89%E7%B1%BB%E5%88%AB&sort_order=asc&start_no=1&show_all

 

探索推荐引擎内部的秘密,第3 部分: 深入推荐引擎相关算法- 聚类

搜索结果描述:2011年3月24日 ... “Apache Mahout简介” (Grant Ingersoll,developerWorks,2009 年10 月):Mahout 的创始者Grant Ingersoll 介绍了机器学习的基本概念,并演示了 ... 
搜索结果 URL:http://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy3/

搜索结果标题:

IBM developerWorks : Open source : 文档库

搜索结果描述:Lucene 和Solr 专家Grant Ingersoll 将逐步向您介绍空间搜索的基础知识,并演示 如何利用这些功能来增强您的下一个位置感知应用程序。 2010年02月22日. 
搜索结果 URL:https://www.ibm.com/developerworks/cn/views/opensource/libraryview.jsp?site_id=10&contentarea_by=Open%20source&sort_by=Date&sort_order=2&start=1&end=250&topic_by=&product_by=&type_by=%E6%8A%80%E6%9C%AF%E6%96%87%E7%AB%A0&show_abstract=true&search_by=Apache&industry_by=

搜索结果标题:

IBM developerWorks 中国: WebSphere : 文档库

搜索结果描述:Lucene 和Solr 提交者Grant Ingersoll 介绍了与相关性、分布式搜索和分面(facet) 相关的最新Lucene 和Solr 功能。本文将学习如何利用这些功能构建快速、高效、可 ... 
搜索结果 URL:http://www.ibm.com/developerworks/cn/views/websphere/libraryview.jsp?sort_by=&show_abstract=true&show_all=&search_flag=&contentarea_by=WebSphere'search_by=BPM+%E8%BF%81%E7%A7%BB&product_by=-1&topic_by=-1&type_by=%E6%8A%80%E6%9C%AF%E6%96%87%E7%AB%A0

搜索结果标题:

IBM developerWorks 中国: Information management : 文档库

搜索结果描述:在本文中,Solr 和Lucene 的负责人Grant Ingersoll 详细介绍了Solr 1.3 的新改进, 包括分布式搜索、轻松数据库导入、集成拼写检查和新的扩展API 等等。 技术文章 ... 
搜索结果 URL:http://www.ibm.com/developerworks/cn/views/data/libraryview.jsp?site_id=10&contentarea_by=Information%20%20management&sort_by=&sort_order=2&start=101&end=200&topic_by=&product_by=&type_by=%E6%89%80%E6%9C%89%E7%B1%BB%E5%88%AB&show_abstract=true&search_by=%E6%90%9C%E7%B4%A2&industry_by=&series_title_by=

搜索结果标题:

IBM developerWorks 中国: Java technology : 文档库

搜索结果描述:在本文中,Solr 和Lucene 的负责人Grant Ingersoll 详细介绍了Solr 1.3 的新改进, 包括分布式搜索、轻松数据库导入、集成拼写检查和新的扩展API 等等。 技术文章 ... 
搜索结果 URL:http://www.ibm.com/developerworks/cn/views/java/libraryview.jsp?site_id=10&contentarea_by=Java&sort_by=Date&sort_order=2&start=1&end=47&topic_by=&product_by=&type_by=%E6%89%80%E6%9C%89%E7%B1%BB%E5%88%AB&show_abstract=true&search_by=XML&industry_by=&series_title_by=

搜索结果标题:

IBM developerWorks 中国: Java technology : 文档库

搜索结果描述:Apache Mahout 专家Grant Ingersoll 引领您快速了解最新版本Mahout 中的机器 学习库,并通过示例说明如何部署和扩展Mahout 的某些最常用的算法。 技术文章 ... 
搜索结果 URL:http://www.ibm.com/developerworks/cn/views/java/libraryview.jsp?lcl_sort_order=asc&type_by=%E6%89%80%E6%9C%89%E7%B1%BB%E5%88%AB&sort_order=desc&start_no=1&sort_by=Title&search_by=&topic_by=%E4%BD%93%E7%B3%BB%E6%9E%B6%E6%9E%84&search_flag=

搜索结果标题:

探索推荐引擎内部的秘密,第2 部分: 深入推荐引擎相关算法- 协同过滤

搜索结果描述:2011年3月21日 ... Apache Mahout简介:Mahout 的创始者Grant Ingersoll 介绍了机器学习的基本概念 ,并演示了如何使用Mahout 来实现文档集群、提出建议和组织 ... 
搜索结果 URL:http://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy2/?cmp=dw&cpb=dw&ct=dwcom&cr=dwcom&ccy=cn

搜索结果标题:

IBM developerWorks 中国: Java technology : 文档库

搜索结果描述:Mahout 的创始者Grant Ingersoll 介绍了机器学习的基本概念,并演示了如何使用 Mahout 来实现文档集群、提出建议和组织内容。 2009年10月12日. 使用Java Debug ... 
搜索结果 URL:https://www.ibm.com/developerworks/cn/views/java/libraryview.jsp?site_id=10&contentarea_by=Java&sort_by=&sort_order=2&start=501&end=600&topic_by=&product_by=&type_by=%E6%8A%80%E6%9C%AF%E6%96%87%E7%AB%A0&show_abstract=true&search_by=&industry_by=&series_title_by=

搜索结果标题:

IBM developerWorks 中国: Java technology : 文档库

搜索结果描述:Lucene 和Solr 专家Grant Ingersoll 将逐步向您介绍空间搜索的基础知识,并演示 如何利用这些功能来增强您的下一个位置感知应用程序。 技术文章, 2010年02月22  ... 
搜索结果 URL:http://www.ibm.com/developerworks/cn/views/java/libraryview.jsp?site_id=10&contentarea_by=Java&sort_by=&sort_order=2&start=401&end=500&topic_by=&product_by=&type_by=%E6%89%80%E6%9C%89%E7%B1%BB%E5%88%AB&show_abstract=true&search_by=&industry_by=&series_title_by=

搜索结果标题:

IBM developerWorks 中国: Java technology : 文档库

搜索结果描述:Apache Mahout 专家Grant Ingersoll 引领您快速了解最新版本Mahout 中的机器 学习库,并通过示例说明如何部署和扩展Mahout 的某些最常用的算法。 2011年12 ... 
搜索结果 URL:https://www.ibm.com/developerworks/cn/views/java/libraryview.jsp?sort_by=Date&show_abstract=true&show_all=false&search_flag=&topic_by=%E7%BC%96%E7%A0%81&type_by=%E6%8A%80%E6%9C%AF%E6%96%87%E7%AB%A0&search_by=

搜索结果标题:

IBM developerWorks 中国: Information management : 文档库

搜索结果描述:Apache Mahout 专家Grant Ingersoll 引领您快速了解最新版本Mahout 中的机器 学习库,并通过示例说明如何部署和扩展Mahout 的某些最常用的算法。 2011年12 ... 
搜索结果 URL:http://www.ibm.com/developerworks/cn/views/data/libraryview.jsp?end_no=100&lcl_sort_order=asc&type_by=%E6%8A%80%E6%9C%AF%E6%96%87%E7%AB%A0&sort_order=asc&start_no=1&sort_by=Title&search_by=&topic_by=%E4%BD%93%E7%B3%BB%E6%9E%B6%E6%9E%84&search_flag=

搜索结果标题:

使用PHP 和Apache Solr 实现企业搜索

搜索结果描述:2008年2月14日 ... 在Solr 专家Grant Ingersoll 所撰写的“使用Apache Solr 实现更加灵巧的搜索,第1 部分:基本特性和Solr 模式” 和“第2 部分: 用于企业的Solr” 阅读 ... 
搜索结果 URL:http://www.ibm.com/developerworks/cn/opensource/os-php-apachesolr/

 
posted @ 2014-01-02 13:01  清新每一天  阅读(289)  评论(0编辑  收藏  举报