摘要: 1搜索引擎的发展的历史 1990年以前,没有任何人能搜索互联网。所有搜索引擎的祖先,是1990年由Montreal的McGill University学生Alan Emtage,Peter Deutsch.BillWheelan发明的Archie(Archie FAQ)。一个可以用文件名查找文件的系统,于是便有了Archie.Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的 搜索引擎。1995年12月,Altavista永远改变了搜索引擎的定义。AltaVista是第一个支持自然语言搜索的搜索引擎,AltaVista 是第一个实现高级搜索语法的搜索引擎(如AN.. 阅读全文
posted @ 2012-03-07 23:15 甲今文 阅读(3422) 评论(0) 推荐(0) 编辑
摘要: The Anatomy of a Large-Scale Hypertextual Web Search EngineSergey Brin and Lawrence Page{sergey, page}@cs.stanford.eduComputer Science Department, Stanford University, Stanford, CA 94305Abstract In this paper, we present Google, a prototype of a large-scale search engine which makes heavy use of the 阅读全文
posted @ 2012-03-03 18:21 甲今文 阅读(898) 评论(0) 推荐(0) 编辑
摘要: 堆和栈都是运行时内存中分配的一个数据区,因此也被称为堆区和栈区,但是二者存储的数据类型和处理速度不同。堆(heap) 用于为复杂数据类型分配空间,例如数据对象,Object对象。 它是在运动时动态分配内存的,因此存取速度比较慢。栈(stack)中主要存放一些基本类型的变量和对象的应用。其优势是存取速度比堆要快,并且栈内的数据可以共享。但缺点是存在栈中的数据大小与生存期必须是确定的,缺乏灵活性。栈有一个很重要的特性,就是存在栈中的数据可以共享。 阅读全文
posted @ 2012-02-19 21:56 甲今文 阅读(208) 评论(0) 推荐(0) 编辑
摘要: (原创作品 转载请务必注明出处!) 在Bochs模拟器下给0.12内核的linux增加一个系统调用 sethostname2(char* hostname, int len),以实现:给系统设置主机名称并在屏幕上打印 "this system call is created by chriswang"这样的功能。a. 修改内核代码修改 kernel/sys.c 增加系统调用的实现 。在 sys.c里的sethostname 函数后面添加sethostname2,我们把sethostname 函数直接复制下来,然后再修改成我们要实现的sethostname2。命令在setho 阅读全文
posted @ 2011-12-25 23:46 甲今文 阅读(3601) 评论(0) 推荐(1) 编辑
摘要: 一淘网上线,很多同学和同行对一淘网的系统架构和面临的关键技术问题都很感兴趣,这篇短文希望能给予简要的介绍。系统架构一淘的系统架构如上图所示。可以看到,一淘有三个数据来源:互联网、外部合作方和淘宝主站。其中,互联网数据通过crawl的方式获得,而后两者则通过feed的方式提供。抓取系统的功能包括:网页抓取、抓取调度、域名解析、死链检测、JavaScript执行等。目前,一淘的资讯、话题、问答combo中的大部分数据都是通过抓取系统从互联网获得的。它是一淘一个重要的“原料厂”。离线处理系统是一个功能众多、可灵活定制的Pipeline,其主要功能有:网页编码识别与转换、网页解析与内容抽取、购物相关站 阅读全文
posted @ 2011-12-25 14:12 甲今文 阅读(397) 评论(0) 推荐(0) 编辑
摘要: 一、完整性的概念之所以要引入数据完整性是为了在数据的添加、删除、修改等操作中不出现数据的破坏或多个表数据不一致。数据完整性是指存储在数据库中的数据正确无误并且相关数据具有一致性。二、完整性的类型 四类完整性约束:域完整性约束:实体完整性约束: PRIMARY KEY引用完整性约束:FOREIGN KEY,REFERENCE用户定义完整性约束: CHECK, DEFAULT, NOT NULL1)实体完整性实体:表中的记录,一个实体就是指表中的一条记录。实体完整性:在表中不能存在完全相同的记录,且每条记录都要具有一个非空且不重复的主键值。实现实体完整性的方法:设置主键、惟一索引、惟一约束2)域. 阅读全文
posted @ 2011-12-16 16:42 甲今文 阅读(1132) 评论(0) 推荐(2) 编辑
摘要: 关键字: oracle sqlplusOracle的sql*plus是与oracle进行交互的客户端工具。在sql*plus中,可以运行sql*plus命令与sql*plus语句。 我们通常所说的DML、DDL、DCL语句都是sql*plus语句,它们执行完后,都可以保存在一个被称为sql buffer的内存区域中,并且只能保存一条最近执行的sql语句,我们可以对保存在sql buffer中的sql 语句进行修改,然后再次执行,sql*plus一般都与数据库打交道。 除了sql*plus语句,在sql*plus中执行的其它语句我们称之为sql*plus命令。它们执行完后,不保存在sql buf 阅读全文
posted @ 2011-12-10 14:08 甲今文 阅读(535) 评论(0) 推荐(0) 编辑
摘要: Oracle认证中SQLPLUS的常用指令收集与技巧Oracle认证中SQLPLUS的常用指令收集与技巧,主机字符串空或者是@+你的服务名,在本地登陆不需要本地服务名。Oracle中SQLPLUS的常用指令收集与技巧安装了oracle9i,进入sal*plus需要输入用户名、口令和主机标志符system/managersys/change_on_intallscott/tigerinternal/oracle以上为初始密码主机字符串空或者是@+你的服务名,在本地登陆不需要本地服务名。下面就介绍一下一些常用的sql*plus命令:首先查看当前使用的数据库实例:select name from V 阅读全文
posted @ 2011-12-10 11:18 甲今文 阅读(205) 评论(0) 推荐(0) 编辑
摘要: DataSet类是ADO.NET中最核心的成员之一,也是各种开发基于.Net平台程序语言开发数据库应用程序最常接触的类。每一个DataSet都有很多个DataTables和Relationships。RelationShip应该也是一种表,特殊的是,这个表只是用来联系两个数据表的。每一个DataTable都有很多datarows和datacols, 也包括ParentRelations,ChildRelations 和一些限制条件像主键不可以重复的限制。 DataSet每一行有一个RowState属性。主要是反映当前行是否已经被删掉了,被更新了,还是本没变。有如下的几个选项: Deleted, 阅读全文
posted @ 2011-11-26 18:26 甲今文 阅读(256) 评论(0) 推荐(0) 编辑
摘要: M接受的字符串的集合称为M的语言,或被M识别的语言,记为L(M)。如果一个语言能被某一图灵机识别,则称该语言是图灵可识别的。在输入上运行一个TM时,可能产生三种结果:接受,拒绝或循环(这里的循环仅仅指机器不停机)对所有输入都停机的图灵机,即永不循环,这种机器叫判定器(为什么叫判定器?因为它们总能决定是接受还是拒绝),同时也称识别某语言的判定器判定该语言。如果一个语言能被某一个图灵机判定,则称它是图灵可判定的,简称可判定的。每一个多带图灵机都等价于某一个单带图灵机。每一个非确定性图灵机都等价于某一个确定型图灵机。确定型单带图灵机在多项式时间内可以判定的语言类叫P类.多项式时间可验证机的语言类叫N 阅读全文
posted @ 2011-11-25 11:51 甲今文 阅读(913) 评论(0) 推荐(1) 编辑