摘要:
Man page of xargs
xargs reads items from the standard input, delimited by blanks (which can be protected with double or single quotes or a backslash) or newlines, and executes the command (default is... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(297)
评论(0)
推荐(0)
摘要:
以前在做项目的时候简单的研究过一致性hash,后来看Dynamo的实现原理时,对里面的虚拟节点不是很理解,也一直没有找到好的资料解释这个问题,昨天在光谷书城偶然看到一本讲网络爬虫的书上分析了这个问题,今天再在网上找了些资料,加深了对这个问题的认识。 一致性hash原理:http://blog.csdn.net/sparkliang/archive/2010/02/02/5279393.aspx
... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(620)
评论(0)
推荐(0)
摘要:
最近几天看了些搜索引擎方面的书,主要阅读了《自己动手写搜索引擎》、《自己动手写网络爬虫》、《搜索引擎技术实践》、《搜索模式》、《瞬间之美》等书,都很不错,也学到了不少知识,本文谈一下我对构建搜索引擎的认识。 要构建一个搜索引擎,首先要确定搜索源,也即被搜索的对象。被搜索的对象可以是一堆文档,用户需要确定包含某关键字的文档集合;可以是一系列网页,用户需要确定跟关键字内容相关的网页;或是一系列的图片... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(935)
评论(0)
推荐(0)
摘要:
腾讯的纯真IP数据库收集了包括中国电信、中国移动、中国联通、长城宽带、聚友宽带等 ISP 的最新准确 IP 地址数据,包含了IP地址与国家/地区的对应关系,其信息保存在QQWry.dat文件中。 IP数据库应用的场合较为广泛,下面举几个常见的例子:
1.根据客户的IP地址确定客户来源,为后期的客户行为分析提供基础,例如需要统计学生群体的访问特点,这时我们就是通过分析来自教育网的IP地址的那些请... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(568)
评论(0)
推荐(0)
摘要:
最近两个月都在研究元数据组织与检索的问题,没有方向、没有借鉴,没有取得任何进展。在调研的过程中,发现自己很out,win7的强大是我之前没有想到的,以为Win7只是界面绚丽了一些,用户体验好了一点点,但没有发现Win7的库那么强大,据我所知,很多Win7的用户并不使用库。 Win7的库是建立在文件系统之上,按照文件的属性/标签(可设置)建立索引(以文件的形式),通过库能很方便的管理系统的文档、... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(171)
评论(0)
推荐(0)
摘要:
经常有网友问到关于fuse内部实现原理方面的问题,下面的内容是给一个网友的回复,简单的讲述了fuse的原理,并分析了一个特定请求的处理过程。 fuse主要包含3个模块:
一个fuse文件系统模块(1),一个设备驱动模块(2),一个用户空间模块(3) fuse文件系统这一部分跟其它的文件系统实现差不多,实现了一个文件系统应该提供的借口(如read,write,open等),这就是为什么你挂在了用... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(1705)
评论(0)
推荐(0)
摘要:
/dev/sda1为ext3格式的分区,使用dumpe2fs /dev/sda1可查看文件系统的总体信息。
#dumpe2fs /dev/sda1 Filesystem OS type: Linux
Inode count: 491520
Block count: 1965402
Reserved block count: 98270
Free blocks: 1020744
Free ino... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(292)
评论(0)
推荐(0)
摘要:
递归是指函数在执行的过程中调用到自身已完成需要的功能,用递归能解决的问题通常能将问题不断缩小为性质相同但规模更小的问题(递归情况),直到问题足够小能够直接解决(基本情况),如下面简单的例子:
#include<stdio.h>
void f(int n)
{ printf("Level %d:n location %p\n",n,&n); /* 语句1 */ if(n < 3) f(n+1)... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(312)
评论(0)
推荐(0)
摘要:
1. 内核与普通进程获取内存时有何不同?
内核是操作系统中优先级最高的成分,如果某个内核函数请求动态内存,则其必定有正当的理由发出那个请求,内核的内存请求应该立即被满足;内核信任自己,所有的内核函数都被假定是没有错误的,内核函数不必考虑编程错误的保护措施。
而当用户态进程请求分配内存时,进程对动态内存的请求被认为是不紧迫的,当进程的可执行文件被装入时,进程并不一定立即对所有的代码页进行访问,同样的... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(292)
评论(0)
推荐(0)
摘要:
同一硬件高速缓存行可以映射RAM中多个不同的块,相同大小的对象倾向于存放在高速缓存内相同的偏移量处。在不同slab内具有相同偏移量的对象最终很可能映射到同一高速缓存行中。而使用slab分配器的对象通常是频繁使用的小对象,高速缓存的硬件可能因此而花费内存周期在同一高速缓存行与RAM内存单元之间来来往往的传送两个对象。 如下例:假设cache行为32Bytes,CPU包含512个cache行(缓存大... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(1055)
评论(0)
推荐(1)
浙公网安备 33010602011771号