时间需要一分一秒的过,事情需要一点一滴的做!

渴望!勇气!自信!坚持!

博客园 首页 新随笔 联系 订阅 管理
据最近报道,全世界互联网上的站点已经超过了1亿个,互联网也成为了人类有史以来构建的最大的数据库,它涉及几乎所有已知的领域。现在的互联网使用 HTML语言编写的页面作为数据的载体,它们通过超链接相互交织在一起,使得人们可以方便地访问这些数据。HTML语言是互联网的支撑技术之一,它为互联 网的繁荣起到了不可磨灭的作用。但不可否认,HTML语言有着其与生俱来的缺陷——作为一种面向表现的标记语言,它只定义了用来格式化数据显示的标记集, 而缺乏明确说明数据含义的标记。这导致在HTML页面里,数据与其表现形式是糅合在一起的,计算机只明白如何显示一个页面,但并不能真正地“理解”这个页 面的信息。因此,基于互联网的一些应用,如电子商务、智能信息检索、智能代理等,始终无法真正实现智能化和自动化。互联网的研究者们,一直都在试图解决这 个问题。目前为止,搜索引擎技术是最成功的一种尝试。搜索引擎技术以自然语言处理(Natural Language Processing,NLP)为基础,在相关领域展开了大量的理论研究和应用实践,但是依然面临着巨大的困难,信息查询的查准率和查全率很难进一步提 高。现在的搜索引擎,大多是通过关键字进行搜索,在找到你所需信息的同时,也会带来大量毫不相关的干扰信息,需要我们再进行人工过滤。例如,如果你用关键 字“苹果”搜索,搜索引擎根本无法知道你是在找一种水果,还是在找苹果公司的信息,抑或是苹果牌牛仔裤。问题的根源,在于“苹果”这个词对计算机来说根本 不具备“语义”。

语义网致力于改变这种状况,它研究的重点就是如何把信息表示为计算机能够理解和处理的形式,即带有“语义”。在语义网概 念中,“语义”是核心,能够在人与计算机之间、计算机与计算机之间以无偏差的方式传递的信息,就是语义。语义网的基本思想是对互联网上任意的资源,进行结 构化的描述并引入语义,使得计算机可以理解互联网上的信息。当然,计算机不可能真正像人一样进行思考,但是通过制定标准,使用标准描述信息的含义,计算机 就可以根据标准进行自动分析和推理,将网络上的服务集成在一起,从而使得自动化智能服务成为可能。

I have a dream for the Web [in which computers] become capable of analyzing all the data on the Web – the content, links, and transactions between people and computers. A ‘Semantic Web’, which should make this possible, has yet to emerge, but when it does, the day-to-day mechanisms of trade, bureaucracy and our daily lives will be handled by machines talking to machines. The ‘intelligent agents’ people have touted for ages will finally materialize. (Berners-Lee, 1999)

还是不明白语义网会对互联网产生多大改变?那就看看 Paul Ford 在2002年写的这篇文章吧,很有意思,非常生动形象!《August 2009: How Google beat Amazon and Ebay to the Semantic Web》。
posted on 2008-08-13 15:53  冢边木  阅读(274)  评论(0编辑  收藏  举报