Semantic Web：为什么需要语义网？（转http://www.guwendong.cn/post/2006/origin_of_semantic_web.html）

据最近报道，全世界互联网上的站点已经超过了1亿个，互联网也成为了人类有史以来构建的最大的数据库，它涉及几乎所有已知的领域。现在的互联网使用 HTML语言编写的页面作为数据的载体，它们通过超链接相互交织在一起，使得人们可以方便地访问这些数据。HTML语言是互联网的支撑技术之一，它为互联网的繁荣起到了不可磨灭的作用。但不可否认，HTML语言有着其与生俱来的缺陷——作为一种面向表现的标记语言，它只定义了用来格式化数据显示的标记集，而缺乏明确说明数据含义的标记。这导致在HTML页面里，数据与其表现形式是糅合在一起的，计算机只明白如何显示一个页面，但并不能真正地“理解”这个页面的信息。因此，基于互联网的一些应用，如电子商务、智能信息检索、智能代理等，始终无法真正实现智能化和自动化。互联网的研究者们，一直都在试图解决这个问题。目前为止，搜索引擎技术是最成功的一种尝试。搜索引擎技术以自然语言处理（Natural Language Processing，NLP）为基础，在相关领域展开了大量的理论研究和应用实践，但是依然面临着巨大的困难，信息查询的查准率和查全率很难进一步提高。现在的搜索引擎，大多是通过关键字进行搜索，在找到你所需信息的同时，也会带来大量毫不相关的干扰信息，需要我们再进行人工过滤。例如，如果你用关键字“苹果”搜索，搜索引擎根本无法知道你是在找一种水果，还是在找苹果公司的信息，抑或是苹果牌牛仔裤。问题的根源，在于“苹果”这个词对计算机来说根本不具备“语义”。

语义网致力于改变这种状况，它研究的重点就是如何把信息表示为计算机能够理解和处理的形式，即带有“语义”。在语义网概念中，“语义”是核心，能够在人与计算机之间、计算机与计算机之间以无偏差的方式传递的信息，就是语义。语义网的基本思想是对互联网上任意的资源，进行结构化的描述并引入语义，使得计算机可以理解互联网上的信息。当然，计算机不可能真正像人一样进行思考，但是通过制定标准，使用标准描述信息的含义，计算机就可以根据标准进行自动分析和推理，将网络上的服务集成在一起，从而使得自动化智能服务成为可能。

I have a dream for the Web [in which computers] become capable of analyzing all the data on the Web – the content, links, and transactions between people and computers. A ‘Semantic Web’, which should make this possible, has yet to emerge, but when it does, the day-to-day mechanisms of trade, bureaucracy and our daily lives will be handled by machines talking to machines. The ‘intelligent agents’ people have touted for ages will finally materialize. (Berners-Lee, 1999)

还是不明白语义网会对互联网产生多大改变？那就看看 Paul Ford 在2002年写的这篇文章吧，很有意思，非常生动形象！《August 2009: How Google beat Amazon and Ebay to the Semantic Web》。

posted on 2008-08-13 15:53 冢边木阅读(276) 评论(0) 编辑收藏举报

刷新页面返回顶部

时间需要一分一秒的过，事情需要一点一滴的做！

公告