07 2016 档案

摘要:1. 文本指纹介绍 互联网网页存在大量的重复内容网页,无论对于搜索引擎的网页去重和过滤、新闻小说等内容网站的内容反盗版和追踪、还是社交媒体等文本去重和聚类,都需要对网页或者文本进行去重和过滤。 最简单的文本相似性计算方法可以利用空间向量模型,计算分词后的文本的特征向量的相似性,这种方法存在效率的严重 阅读全文
posted @ 2016-07-29 13:35 ido 阅读(917) 评论(0) 推荐(0) 编辑
摘要:http://www.infoq.com/cn/articles/kafka-analysis-part-1/ Kafka是由LinkedIn开发的一个分布式的消息系统,使用Scala编写,它以可水平扩展和高吞吐率而被广泛使用。目前越来越多的开源分布式处理系统如Cloudera、Apache Sto 阅读全文
posted @ 2016-07-27 17:30 ido 阅读(1185) 评论(0) 推荐(0) 编辑
摘要:相当长一段时间以来,大数据社区已经普遍认识到了批量数据处理的不足。很多应用都对实时查询和流式处理产生了迫切需求。最近几年,在这个理念的推动下,催生出了一系列解决方案,Twitter Storm,Yahoo S4,Cloudera Impala,Apache Spark和Apache Tez纷纷加入大 阅读全文
posted @ 2016-07-27 15:34 ido 阅读(1159) 评论(0) 推荐(0) 编辑
摘要:一个从asp.net mvc 3升级到asp.net mvc 4的项目发生了如下错误: [A]System.Web.WebPages.Razor.Configuration.HostSection cannot be cast to [B]System.Web.WebPages.Razor.Conf 阅读全文
posted @ 2016-07-12 20:25 ido 阅读(489) 评论(0) 推荐(0) 编辑
摘要:https://github.com/vladen/SolrNet 原来我们在我们的项目里用的是根据数据库路由到不同的单机Solr服务器,但是这样的话,每次Solr配置的修改都要修改三台不通的服务器,而且一台服务器挂了,必定会影响一部分用户不能使用搜索功能,而且还会造成一定程度的丢数据,所以我们换一 阅读全文
posted @ 2016-07-09 16:56 ido 阅读(669) 评论(1) 推荐(1) 编辑
摘要:http://www.iis.net/downloads/microsoft/application-initialization IIS7.5也有Warm Up功能 让ASP.NET第一次Request不变慢 Overview IIS Application Initialization for 阅读全文
posted @ 2016-07-08 11:07 ido 阅读(662) 评论(0) 推荐(0) 编辑
摘要:Step1: 检测系统是否自带安装mysql # yum list installed | grep mysql Step2: 删除系统自带的mysql及其依赖命令: # yum -y remove mysql-libs.x86_64 Step3: 给CentOS添加rpm源,并且选择较新的源命令: 阅读全文
posted @ 2016-07-06 20:53 ido 阅读(5640) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示