君子博学而日参省乎己 则知明而行无过矣

博客园 首页 新随笔 联系 订阅 管理
上一页 1 ··· 77 78 79 80 81 82 83 84 85 ··· 106 下一页

2012年6月8日 #

摘要: 智能推荐大都基于海量数据的计算和处理,然而我们发现在海量数据上高效的运行协同过滤算法以及其他推荐策略这样高复杂的算法是有很大的挑战的,在面对解决这个问题的过程中,大家提出了很多减少计算量的方法,而聚类无疑是其中最优的选择之一。 聚类 (Clustering) 是一个数据挖掘的经典问题,它的目的是将数据分为多个簇 (Cluster),在同一个簇中的对象之间有较高的相似度,而不同簇的对象差别较大。聚类被广泛的应用于数据处理和统计分析领域。Apache Mahout 是 ASF(Apache Software Foundation) 的一个较新的开源项目,它源于 Lucene,构建在 Hadoop 阅读全文
posted @ 2012-06-08 00:09 刺猬的温驯 阅读(246) 评论(0) 推荐(0) 编辑

摘要: 本系列的第一篇为读者概要介绍了推荐引擎,下面几篇文章将深入介绍推荐引擎的相关算法,并帮助读者高效的实现这些算法。 在现今的推荐技术和算法中,最被大家广泛认可和采用的就是基于协同过滤的推荐方法。它以其方法模型简单,数据依赖性低,数据方便采集 , 推荐效果较优等多个优点成为大众眼里的推荐算法“No.1”。本文将带你深入了解协同过滤的秘密,并给出基于 Apache Mahout 的协同过滤算法的高效实现。Apache Mahout 是 ASF 的一个较新的开源项目,它源于 Lucene,构建在 Hadoop 之上,关注海量数据上的机器学习经典算法的高效实现。集体智慧和协同过滤什么是集体智慧集体智慧 阅读全文
posted @ 2012-06-08 00:06 刺猬的温驯 阅读(219) 评论(0) 推荐(0) 编辑

2012年6月7日 #

摘要: 随着 Web 技术的发展,使得内容的创建和分享变得越来越容易。每天都有大量的图片、博客、视频发布到网上。信息的极度爆炸使得人们找到他们需要的信息将变得越来越难。传统的搜索技术是一个相对简单的帮助人们找到信息的工具,也广泛的被人们所使用,但搜索引擎并不能完全满足用户对信息发现的需求,原因一是用户很难用恰当的关键词描述自己的需求,二是基于关键词的信息检索在很多情况下是不够的。而推荐引擎的出现,使用户获取信息的方式从简单的目标明确的数据的搜索转换到更高级更符合人们使用习惯的上下文信息更丰富的信息发现。“探索推荐引擎内部的秘密”系列将带领读者从浅入深的学习探索推荐引擎的机制,实现方法,其中还涉及一些基 阅读全文
posted @ 2012-06-07 22:41 刺猬的温驯 阅读(135) 评论(0) 推荐(0) 编辑

摘要: 表征状态转移(英文:Representational State Transfer,简称REST)是Roy Fielding博士在2000年他的博士论文中提出来的一种软件架构风格。目前在三种主流的Web服务实现方案中,因为REST模式的Web服务与复杂的SOAP和XML-RPC对比来讲明显的更加简洁,越来越多的web服务开始采用REST风格设计和实现。例如,Amazon.com提供接近REST风格的Web服务进行图书查找;雅虎提供的Web服务也是REST风格的。宗旨REST 从资源的角度来观察整个网络,分布在各处的资源由URI确定,而客户端的应用通过URI来获取资源的表征。获得这些表征致使这些 阅读全文
posted @ 2012-06-07 22:19 刺猬的温驯 阅读(293) 评论(0) 推荐(0) 编辑

摘要: 转载http://www.ibm.com/developerworks/cn/web/wa-restful/index.htmlSpring,构建 Java™ 平台和 Enterprise Edition (Java EE) 应用程序的著名框架,现在在其模型-视图-控制器(Model-View-Controller ,MVC)层支持具象状态传输 (REST)。RESTful web 服务根据客户端请求生成多个具象(representations)很重要。在本篇文章中,学习使用 HttpMessageConverter 生成多个具象。代码示例展示如何使用 RestTemplate 和 HttpM 阅读全文
posted @ 2012-06-07 17:19 刺猬的温驯 阅读(1367) 评论(0) 推荐(0) 编辑

摘要: 跟随 Web Service 一路走来, 记忆中的 Apache SOAP, Apache Axis, XFire, 标准化的JAX-RPC, JAX-WS, 到后来半路杀出的的 Spring-WS, CXF一切刚刚开始,一切望尘莫及,短命是纯技术的特征。RPC 的平台局限性,SOAP 的类型 bind 的易脆性, JAX-WS 工具的信赖度, Spring-WS contract first 使一个小时可以完成(甚至在IDE中十分钟可以完成)的工作,要整一天,还要到看到 JUnit 的 Green bar 才算数。已经标准化的JAX-RS,证明 RESTful 已经成为SOA加架的主流,以至 阅读全文
posted @ 2012-06-07 16:46 刺猬的温驯 阅读(8068) 评论(0) 推荐(0) 编辑

摘要: 1. Controller 代码非常简单Java代码packageorg.pprun.hjpetstore.web.rest;importorg.apache.commons.logging.Log;importorg.apache.commons.logging.LogFactory;importorg.pprun.hjpetstore.persistence.jaxb.Products;importorg.pprun.hjpetstore.service.rest.HjpetstoreService;importorg.springframework.beans.factory.annot 阅读全文
posted @ 2012-06-07 16:44 刺猬的温驯 阅读(611) 评论(0) 推荐(0) 编辑

摘要: 一个简单的基于注解的 Controller使用过低版本 Spring MVC 的读者都知道:当创建一个 Controller 时,我们需要直接或间接地实现 org.springframework.web.servlet.mvc.Controller 接口。一般情况下,我们是通过继承 SimpleFormController 或 MultiActionController 来定义自己的 Controller 的。在定义 Controller 后,一个重要的事件是在 Spring MVC 的配置文件中通过 HandlerMapping 定义请求和控制器的映射关系,以便将两者关联起来。来看一下基于注 阅读全文
posted @ 2012-06-07 15:36 刺猬的温驯 阅读(278) 评论(0) 推荐(0) 编辑

摘要: lucene特点及作用文章里就不说了,网上有的是。我就简单说下个人理解,正常 sql 查询时:name like '%继中%' 想必大家一定明白这样不会走索引的,然后就在多行数据级别查询相应时间会很慢,对吧,因为数据库在一行行扫呢。所以我们自然会想到怎样能让它走索引?解决方案之一:lucene出来了。其实它就是帮你把文章拆分成若干个关键词,这样以便按关键词查询时能通过关键词直接查询来锁定哪些文章匹配该关键词并快速返回。说再直白点,就是 sql语句的查询不用like ,而是 name ='继中',这样就走索引了,所以就快了而已。下面来说正题,spring框架下配置 阅读全文
posted @ 2012-06-07 15:33 刺猬的温驯 阅读(4063) 评论(0) 推荐(0) 编辑

摘要: 本文内容遵从CC版权协议转载请注明出自matrix67.com这篇文章是漫话中文分词算法的续篇。在这里,我们将紧接着上一篇文章的内容继续探讨下去:如果计算机可以对一句话进行自动分词,它还能进一步整理句子的结构,甚至理解句子的意思吗?这两篇文章的关系十分紧密,因此,我把前一篇文章改名为了《漫话中文自动分词和语义识别(上)》,这篇文章自然就是它的下篇。我已经在很多不同的地方做过与这个话题有关的演讲了,在这里我想把它们写下来,和更多的人一同分享。什么叫做句法结构呢?让我们来看一些例子。“白天鹅在水中游”,这句话是有歧义的,它可能指的是“白天有一只鹅在水中游”,也可能指的是“有一只白天鹅在水中游”。不 阅读全文
posted @ 2012-06-07 12:22 刺猬的温驯 阅读(788) 评论(0) 推荐(0) 编辑

上一页 1 ··· 77 78 79 80 81 82 83 84 85 ··· 106 下一页