2008 年 10月 31 日随笔档案 - mytec

2008年10月31日

摘要： Google 宣布，他们即将对扫描文档进行索引并投入搜索，这意味着极其庞大的处理资源，以及高级图象处理能力。和普通文本文件不同，扫描文档不包含任何文字数据供 Google 索引，相反，Google 使用 OCR 软件对扫描的文档进行辨认，并转换成文字内容。过去，Google也曾尝试索引这些扫描的文档图片，但只能对文件名，以及附近的元数据进行索引，对图片内容则无能为力。从现在开始，Google 搜索将包含这些通过OCR 软件辨认出来的文字内容，用户在搜索中遇到扫描文档，Google 会提供选项，让你以 PDF 或 HTML 格式阅读。这类技术早已存在，但准确性一直是个问题，同样，如此大规模的作业阅读全文

posted @ 2008-10-31 16:56 mytec 阅读(151) 评论(0) 推荐(0) 编辑

Google 澄清其 OpenID 策略

摘要： Read Write Web 昨天发表的一篇文章 Google becoming an OpenID provider （用 Google 帐户登陆其它网站）提到 Google 自己的 OpenID 服务，随后，有不少报道表示 Google 没有遵守 OpenID 标准，而是自行其事以使 OpenID 符合他们自己的框架。Google 对 OpenID 的实现存在这样的问题，就是用户无法简单地使用他们的 Gmail 帐户登陆基于 OpenID 的站点，同时，Google 自己的服务也不支持 OpenID。今天，Google 在他们的官方博客(Google Code Blog)上发表了一篇文章，阅读全文

posted @ 2008-10-31 13:23 mytec 阅读(238) 评论(0) 推荐(0) 编辑

公告