上一页 1 2 3 4 5 6 7 8 ··· 22 下一页
摘要: 谷歌这些年的一系列举动,从Android到Chrome,从语音搜索到谷歌TV,都是其对未来搜索认识的投影。 许多人曾经怀疑,搜索技术还能走多远,甚至前几年,还有人说,搜索能够做的90%的事情都已经做完了。但谷歌里的极客们认为,这种观点是固守杜威分 类时代传统思维的短视和浅薄之见。谷歌的极客们有资格不屑于这种观点,因为他们最了解搜索的科学。“搜索是一个可以不断发展几百年的科学”... 阅读全文
posted @ 2010-07-09 16:34 searchDM 阅读(274) 评论(0) 推荐(0) 编辑
摘要: 翻译一篇技术评论社的文章,是讲memcached的连载。fcicq同学说这个东西很有用,希望大家喜欢。 发表日:2008/7/2 作者:长野雅广(Masahiro Nagano) 原文链接:http://gihyo.jp/dev/feature/01/memcached/0001 我是mixi株式会社开发部系统运营组的长野。 日常负责程序的运营。从今天开始,将分几次针对最近在Web应用的可扩... 阅读全文
posted @ 2010-06-26 10:21 searchDM 阅读(500) 评论(4) 推荐(0) 编辑
摘要: 摘要:由于互联网具有海量信息并且快速增长,提高搜索引擎的信息采集器Web Spider的数据采集和更新速度有重要意义。本文利用ProActive网格网络并行分布计算中间件提供的主动对象(Active Object)技术、网络并行计算技术、自动部署机制等设计和实现了一个名为P-Spider的分布式并行Web Spider,实验表明该Web Spider方便管理和部署,并且比多线程Web Spider... 阅读全文
posted @ 2010-06-26 09:46 searchDM 阅读(576) 评论(0) 推荐(0) 编辑
摘要: nutch的爬虫和搜索可以说是分离的两块,爬虫可以是M/R作业,但搜索不是M/R作业。搜索有两种方式:一是将爬虫数据(或者称索引数据)放在本地硬盘,进行搜索。二是直接搜索HDFS中的爬虫数据。这里介绍如何使用nutch-1.0的WEB前端检索本地爬虫数据:(1)Nutch的搜索可以独立于hadoop集群,只要将爬虫下来的数据copy到任何机器,在此机器上安装一个tomcat,并运行nutch自带的... 阅读全文
posted @ 2010-06-25 10:08 searchDM 阅读(606) 评论(0) 推荐(0) 编辑
摘要: 从Hadoop技术论坛一个牛人那了解到,nutch-1.1使用的是hadoop-0.20.2,目前nutch-1.1还未发布,但在SVN上能够下载到,http://svn.apache.org/repos/asf/nutch/tags/1.1/ 用户可以chech out到Nutch-1.1nutch-1.1要正常运行要首先这样做: (1) nutch-default.xml下的plugin.fo... 阅读全文
posted @ 2010-06-25 10:08 searchDM 阅读(586) 评论(0) 推荐(0) 编辑
摘要: nutch-1.0命令行中搜索有结果,但是到web前端搜索,始终无结果,无论怎么配置,搜索关键字,一直提示以下令人郁闷的信息:第0-0项 (共有 0 项查询结果) 很是郁闷,今天终于解决了。 (1)浏览器解压nutch-1.0.war后修改nutch-site.xml后必须重启tomcat。(每次修改Nutch-site.xml后请重启tomcat,再搜索) nutch-site.xml必须配置... 阅读全文
posted @ 2010-06-25 10:07 searchDM 阅读(531) 评论(0) 推荐(0) 编辑
摘要: Linux下Nutch分布式配置和使用 目 录 介绍 0 集群网络环境介绍 1 /etc/hosts文件配置 2 SSH无密码验证配置 2.1配置所有节点之间SSH无密码验证 3 JDK安装和Java环境变量配置 3.1 安装 JDK 1.6 3.2 Java环境变量配置 4 Hadoop集群配置 5 Hadoop集群启动 6 Nutch分布式爬虫 6.1配置Nutch配置文件 6.2 执行Nu... 阅读全文
posted @ 2010-06-25 10:06 searchDM 阅读(1875) 评论(1) 推荐(0) 编辑
摘要: 英文排版靠基线对齐,所以虽然英文字母有不同的高度深度,通过基线的对齐就能让读者感到文字不凌乱。而单词间的空格和单词长度的不同,能够让读者的视线产 生错落有致的张弛感。但对于中文排版而言,问题就没有那么复杂。中文排版没有空格,而且都是方块字,所以整体的感觉每行都是一条黑带子,而虽然汉字是方块 字,视觉上而言,阅读时仍然可能出现上下左右的波动。这是因为,每个汉字都有视觉中心,而人眼在阅读时,经过每个汉... 阅读全文
posted @ 2010-06-21 17:47 searchDM 阅读(1986) 评论(2) 推荐(1) 编辑
摘要: 一.饱和度与易读性:上周在做F同学的一个项目时,涉及到较多列表性的文字链接。目前除去频道和首页,全站文字链接使用一致的蓝色,色值为#014ccc,饱和度较高,在用户浏览时更易于吸引注意,但同样也容易引起视觉疲劳,高饱和度的文字并不易于阅读。上图中,下半部分的文字降低了饱和度,是不是比上半部分读起来更舒服?其实,大多数门户类的网站也是使用低饱和度的蓝色作为列表链接颜色的:结论一:颜色饱和度达到一定值... 阅读全文
posted @ 2010-06-21 08:50 searchDM 阅读(591) 评论(2) 推荐(0) 编辑
摘要: Google Analytics和百度统计都是网站常用的网站流量分析工具,与其他流量统计工具不同,Google Google Analytics和百度统计不只记录点击流数据,更注重点击流的分析与测量;并尽量将这些结果向Web分析和网络营销引导。这里是读者投递的一篇比较Google Analytics和百度统计的文章,供大家参考。  百度统计与Google Analytics相同的地方:  1、工具... 阅读全文
posted @ 2010-06-21 08:48 searchDM 阅读(755) 评论(2) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 ··· 22 下一页