94julia

2012年6月20日

摘要： Intemet已经成为目前世界上最大的信息资源库,面对如此巨大的信息海洋,为了满足人们对快速、准确而全面获取信息的要求,搜索引擎应运而生。依靠搜索引擎,可以帮助用户在网络上方便地查找到自己需要的信息。1　搜索引擎简介搜索引擎是指通过网络爬虫类程序来获得网站网页资料,并能建立数据库提供查询的系统。按工作原理分有两个基本类别:全文搜索引擎(Full Text SearchEngine)和分类目录(Directory)。全文搜索引擎的数据库是依靠一个叫“网络爬虫(crawlers)”的软件,通过网络上的各种链接自动获取大量网页信息内容,并按一定的规则分析整理形成的。Google、百度都是比... 阅读全文

posted @ 2012-06-20 20:52 94julia 阅读(1148) 评论(0) 推荐(0)

本体论研究综述

摘要： 1　引言起源于哲学的本体论(ontology)近年来受到信息科学领域的广泛关注[1,2],其重要性也已在许多方面表现出来并得到广泛认同[1,3,4]·尤其最近本体论在Web上的应用导致了语义Web[3,4]的诞生,在W3C的主导下有望解决Web信息共享时的语义问题,从而实现世界范围内的知识共享和智能信息集成· 本文将从本体论的起源、发展(第2节)出发,分别对本体论的定义(第3节),本体论描述语言(第4节)以及构建方法论(第5节),本体论与语义Web(第6节),以及本体论的应用等(第7节)研究现状进行综述·最后在第8节给出进一步展望。2　本体论的起源和发展2&# 阅读全文

posted @ 2012-06-20 19:53 94julia 阅读(2337) 评论(0) 推荐(0)

Ontology研究综述

摘要： 0　引　言近些年来,随着计算机应用需求的不断增强,计算机科学与技术的发展日新月异。然而在这种快速发展的同时,也面临着种种的困难。主要的困难包括:知识的表示、信息的组织、软件的复用等。特别是由于因特网的快速发展,面对信息的海洋,如何组织、管理和维护海量信息并为用户提供有效的服务也就成为一项重要而迫切的研究课题。为了适应这些要求,Ontology作为一种能在语义和知识层次上描述信息系统的概念模型建模工具,自被提出以来就引起了国外众多科研人员的关注,并在计算机的许多领域得到了广泛的应用,如知识工程、数字图书馆、软件复用、信息检索和Web上异构信息的处理、语义Web等。本文对Ontology及.. 阅读全文

posted @ 2012-06-20 15:39 94julia 阅读(609) 评论(0) 推荐(0)

2012年6月19日

1抓取网页

摘要：网络爬虫的基本操作是抓取网页。那么如何才能随心所欲地获得自己想要的页面？这一节将从URL开始讲起，然后告诉大家如何抓取网页，并给出一个使用Java语言抓取网页的例子。最后，要讲一讲抓取过程中的一个重要问题：如何处理HTTP状态码。1.1.1 深入理解URL 抓取网页的过程其实和读者平时使用IE浏览器浏览网页的道理是一样的。比如，你打开一个浏览器，输入猎兔搜索网站的地址，如图1.1所示。图1.1 使用浏览器浏览网页 “打开”网页的过程其实就是浏览器作为一个浏览的“客户端”，向服务器端发送了一次请求，把服务器端的文件“抓”到本地，再进... 阅读全文

posted @ 2012-06-19 19:27 94julia 阅读(1244) 评论(0) 推荐(1)

公告