摘要:
(原创作品 转载请务必注明出处!) 在Bochs模拟器下给0.12内核的linux增加一个系统调用 sethostname2(char* hostname, int len),以实现:给系统设置主机名称并在屏幕上打印 "this system call is created by chriswang"这样的功能。a. 修改内核代码修改 kernel/sys.c 增加系统调用的实现 。在 sys.c里的sethostname 函数后面添加sethostname2,我们把sethostname 函数直接复制下来,然后再修改成我们要实现的sethostname2。命令在setho 阅读全文
摘要:
一淘网上线,很多同学和同行对一淘网的系统架构和面临的关键技术问题都很感兴趣,这篇短文希望能给予简要的介绍。系统架构一淘的系统架构如上图所示。可以看到,一淘有三个数据来源:互联网、外部合作方和淘宝主站。其中,互联网数据通过crawl的方式获得,而后两者则通过feed的方式提供。抓取系统的功能包括:网页抓取、抓取调度、域名解析、死链检测、JavaScript执行等。目前,一淘的资讯、话题、问答combo中的大部分数据都是通过抓取系统从互联网获得的。它是一淘一个重要的“原料厂”。离线处理系统是一个功能众多、可灵活定制的Pipeline,其主要功能有:网页编码识别与转换、网页解析与内容抽取、购物相关站 阅读全文