摘要: Google 宣布,他们即将对扫描文档进行索引并投入搜索,这意味着极其庞大的处理资源,以及高级图象处理能力。和普通文本文件不同,扫描文档不包含任何文字数据供 Google 索引,相反,Google 使用 OCR 软件对扫描的文档进行辨认,并转换成文字内容。过去,Google也曾尝试索引这些扫描的文档图片,但只能对文件名,以及附近的元数据进行索引,对图片内容则无能为力。从现在开始,Google 搜索将包含这些通过OCR 软件辨认出来的文字内容,用户在搜索中遇到扫描文档,Google 会提供选项,让你以 PDF 或 HTML 格式阅读。这类技术早已存在,但准确性一直是个问题,同样,如此大规模的作业 阅读全文
posted @ 2008-10-31 16:56 mytec 阅读(151) 评论(0) 推荐(0) 编辑
摘要: Read Write Web 昨天发表的一篇文章 Google becoming an OpenID provider (用 Google 帐户登陆其它网站)提到 Google 自己的 OpenID 服务,随后,有不少报道表示 Google 没有遵守 OpenID 标准,而是自行其事以使 OpenID 符合他们自己的框架。Google 对 OpenID 的实现存在这样的问题,就是用户无法简单地使用他们的 Gmail 帐户登陆基于 OpenID 的站点,同时,Google 自己的服务也不支持 OpenID。今天,Google 在他们的官方博客(Google Code Blog)上发表了一篇文章, 阅读全文
posted @ 2008-10-31 13:23 mytec 阅读(238) 评论(0) 推荐(0) 编辑