Google高级技巧—google Hack★★★★
google hacking事实上并算不上什么新东西,当时并没有重视这样的技术,觉得webshell什么的,并无太大实际用途.google hacking事实上并非如此简单...
经常使用的googlekeyword:
foo1 foo2 (也就是关联,比方搜索xx公司 xx美女)
operator:foo
filetype:123 类型
site:foo.com 相对直接看网站更有意思,能够得到很多意外的信息
intext:foo
intitle: fooltitle 标题哦
allinurl:foo 搜索xx网站的全部相关连接。(踩点必备)
links:foo 不要说就知道是它的相关链接
allintilte:foo.com
我们能够辅助"-" "+"来调整搜索的精确程度
直接搜索password:(引號表示为精确搜索)
当然我们能够再延伸到上面的结果里进行二次搜索
"index of" htpasswd / passwd
filetype:xls username password email
"ws_ftp.log"
"config.php"
allinurl:admin mdb
service filetype:pwd ....或者某个比方pcanywhere的password后缀cif等
越来越有意思了,再来点更敏感信息
"robots.txt" "Disallow:" filetype:txt
inurl:_vti_cnf (FrontPage的关键索引啦,扫描器的CGI库一般都有地)
allinurl: /msadc/Samples/selector/showcode.asp
/../../../passwd
/examples/jsp/snp/snoop.jsp
phpsysinfo
intitle:index of /admin
intitle:"documetation"
inurl: 5800(vnc的端口)或者desktop port等多个keyword检索
webmin port 10000
inurl:/admin/login.asp
intext:Powered by GBook365
intitle:"php shell*" "Enable stderr" filetype:php 直接搜索到phpwebshell
foo.org filetype:inc
ipsec filetype:conf
intilte:"error occurred" ODBC request where (select|insert) 说白了就是说,能够直接试着查查数据库检索,针对眼下流行的sql注射,会发达哦
"Dumping data for table" username password
intitle:"Error using Hypernews"
"Server Software"
intitle:"HTTP_USER_AGENT=Googlebot"
"HTTP_USER_ANGET=Googlebot" THS ADMIN
filetype:.doc site:.mil classified 直接搜索军方相关word
检查多个keyword:
intitle:config confixx login password
"mydomain.com" nessus report
"report generated by"
"ipconfig"
"winipconfig"
google缓存利用(hoho,最有影响力的东西)推荐大家搜索时候多"选搜索全部网站"
特别推荐:administrator users 等相关的东西,比方名字,生日等……最慘也能够拿来做字典嘛
……
一些技巧集合:
1) index.of.password
1) filetype:blt "buddylist"
2) "access denied for user" "using password"
2) intitle:"index of" inurl:ftp (pub | incoming)
3) "http://*:*@www" domainname
3) filetype:cnf inurl:_vti_pvt access.cnf
4) auth_user_file.txt
4) allinurl:"/*/_vti_pvt/" | allinurl:"/*/_vti_cnf/"
5) The Master List
5) inurl:"install/install.php"
6) allinurl: admin mdb
6) intitle:"welcome.to.squeezebox"
7) passlist.txt (a better way)
7) intext:""BiTBOARD v2.0" BiTSHiFTERS Bulletin Board"
8) "A syntax error has occurred" filetype:ihtml
8) intitle:Login intext:"RT is ? Copyright"
9) "# -FrontPage-" inurl:service.pwd
9) ext:php program_listing intitle:MythWeb.Program.Listing
10) orA-00921: unexpected end of SQL command
10) intitle:index.of abyss.conf
NO2:
--------------------------------------------------------------------------------
google hacking的简单实现
使用google中的一些语法能够提供给我们很多其它的信息(当然也提供给那些习惯攻击的人很多其它他们所想要的.),以下就来介绍一些经常使用的语法.
intext:
这个就是把网页中的正文内容中的某个字符做为搜索条件.比如在google里输入:intext:动网.将返回全部在网页正文部分包括"动网"的网页.allintext:用法和intext相似.
intitle:
和上面那个intext差点儿相同,搜索网页标题中是否有我们所要找的字符.比如搜索:intitle:安全天使.将返回全部网页标题中包括"安全天使"的网
页.同理allintitle:也同intitle相似.
cache:
搜索google里关于某些内容的缓存,有时候或许能找到一些好东西哦.
define:
搜索某个词语的定义,搜索:define:hacker,将返回关于hacker的定义.
filetype:
这个我要重点推荐一下,不管是撒网式攻击还是我们后面要说的对特定目标进行信息收集都须要用到这个.搜索指定类型的文件.比如输入
:filetype:doc.将返回全部以doc结尾的文件URL.当然假设你找.bak、.mdb或.inc也是能够的,获得的信息或许会更丰富:)
info:
查找指定网站的一些基本信息.
inurl:
搜索我们指定的字符是否存在于URL中.比如输入:inurl:admin,将返回N个相似于这样的连接http://www.xxx.com/xxx/admin,用来找管理员登
陆的URL不错.allinurl也同inurl相似,可指定多个字符.
link:
比如搜索:inurl:www.4ngel.net能够返回全部和www.4ngel.net做了链接的URL.
site:
这个也非常实用,比如:site:www.4ngel.net.将返回全部和4ngel.net这个站有关的URL.
对了另一些*作符也是非常实用的:
+ 把google可能忽略的字列如查询范围
- 把某个字忽略
~ 允许词
. 单一的通配符
* 通配符,可代表多个字母
"" 精确查询
以下開始说说实际应用
以下内容均在google上搜索,对于一个居心叵測的攻击者来说,可能他最感兴趣的就是password文件了.而google正由于其强大的搜索能力往往会
把一些敏感信息透露给他们.用google搜索以下内容:
intitle:"index of" etc
intitle:"Index of" .sh_history
intitle:"Index of" .bash_history
intitle:"index of" passwd
intitle:"index of" people.lst
intitle:"index of" pwd.db
intitle:"index of" etc/shadow
intitle:"index of" spwd
intitle:"index of" master.passwd
intitle:"index of" htpasswd
"# -FrontPage-" inurl:service.pwd
有时候由于各种各样的原因一些重要的password文件被毫无保护的暴露在网络上,假设被别实用心的人获得,那么危害是非常大的
相同能够用google来搜索一些具有漏洞的程序,比如ZeroBoard前段时间发现个文件代码泄露漏洞,能够用google来找网上使用这套程序的网站:
intext:ZeroBoard filetype:php
或者使用:
inurl:outlogin.php?_zb_path= site:.jp
来寻找我们所须要的页面.phpmyadmin是一套功能强大的数据库*作软件,一些网站由于配置失误,导致我们能够不使用password直接对phpmyadmin进行*作.我们能够用google搜索存在这样漏洞的程序URL:
intitle:phpmyadmin intext:Create new database
还http://www.xxx.com/_vti_bin/..%5C..%5C..%5C..%5C..%5C../winnt/system32/cmd.exe? dir吗?用google找找,你或许还能够找到非常多古董级的机器。相同我们能够用这个找找有其它cgi漏洞的页面。
allinurl:winnt system32
前面已经简单的说过能够用google来搜索数据库文件,用上一些语法来精确查找能够获得很多其它东西(access的数据库,mssql、mysql的连接文件等等).举个样例演示样例一下:
allinurl:bbs data
filetype:mdb inurl:database
filetype:inc conn
inurl:data filetype:mdb
intitle:"index of" data //在一些配置不对的apache+win32的server上经常出现这样的情况,和上面的原理一样,我们还能够用google来找后台.
利用google全然是能够对一个网站进行信息收集和渗透的,以下我们用google对特定网站进行一次測试。
首先用google先看这个网站的一些基本情况(一些细节部分就略去了):
site:xxxx.com
从返回的信息中,找到几个该校的几个系院的域名:
http://a1.xxxx.com
http://a2.xxxx.com
http://a3.xxxx.com
http://a4.xxxx.com
顺便ping了一下,应该是在不同的server.学校一般都会有不少好的资料,先看看有什么好东西没
site:xxxx.com filetype:doc
得到N个不错的doc。
先找找网站的管理后台地址:
site:xxxx.com intext:管理
site:xxxx.com inurl:login
site:xxxx.com intitle:管理
超过获得2个管理后台地址:
http://a2.xxxx.com/sys/admin_login.asp
http://a3.xxxx.com:88/_admin/login_in.asp
还算不错,看看server上跑的是什么程序:
site:a2.xxxx.com filetype:asp
site:a2.xxxx.com filetype:php
site:a2.xxxx.com filetype:aspx
site:a3.xxxx.com filetype:asp
site:.......
......
a2server用的应该是IIS,上面用的是asp的整站程序,另一个php的论坛
a3server也是IIS,aspx+asp。web程序都应该是自己开发的。有论坛那就看看能不能遇见什么公共的FTP帐号什么的:
site:a2.xxxx.com intext:ftp://*:*
没找到什么有价值的东西。再看看有没有上传一类的漏洞:
site:a2.xxxx.com inurl:file
site:a3.xxxx.com inurl:load
在a2上发现一个上传文件的页面:
http://a2.xxxx.com/sys/uploadfile.asp
用IE看了一下,没权限訪问。试试注射,
site:a2.xxxx.com filetype:asp
得到N个asp页面的地址,体力活就让软件做吧,这套程序明显没有对注射做什么防范,dbowner权限,尽管不高但已足矣,back a shell不太喜
欢,并且看起来数据库的个头就不小,直接把web管理员的password暴出来再说,MD5加密过。一般学校的网站的password都比較有规律,通常都是域名+
电话一类的变形,用google搞定吧。
site:xxxx.com //得到N个二级域名
site:xxxx.com intext:*@xxxx.com //得到N个邮件地址,还有邮箱的主人的名字什么的
site:xxxx.com intext:电话 //N个电话
把什么的信息做个字典吧,挂上慢慢跑。过了一段时间就跑出4个帐号,2个是学生会的,1个管理员,另一个可能是老师的帐号。登陆上去:
name:网站管理员
pass:a2xxxx7619 //说了吧,就是域名+4个数字
要再怎么提权那就不属于本文讨论訪问了,呵呵,到此为止。
这段时间在国外的一些google hack的研究网站看了看,事实上也都差点儿相同是一些基本的语法的灵活运用,或者配合某个脚本漏洞,主要还是靠
个人的灵活思维。国外对于google hack方面的防范也并非非常多,所以大家还是点到为止,不要去搞破坏拉,呵呵。对于一些在win上跑
apache的网管们应该多注意一下这方面,一个intitle:index of就差点儿相同都出来了:)
1.查找利用php webshell
intitle:"php shell*" "Enable stderr" filetype:php
(注: intitle—网页标题 Enable stderr—UNIX标准输出和标准错误的缩写filetype—文件类型)。搜索结果中,你能找到非常多直接在机器上执
行命令的web shell来。假设找到的PHPSHELL不会利用,假设你不熟悉UNIX,能够直接看看LIST,这里就不具体说了,有非常多利用价值。要说明
的是,我们这里搜索出来的一些国外的PHPSHELL上都要使用UNIX命令,都是system调用出来的函数(事实上用百度及其它搜索引擎都能够,仅仅是填
写搜索的内容不同)。这个PHPWEBSHELL是能够直接Echo(Unix经常使用命令)。一句话就把首页搞定了:
echo "召唤" > index.jsp
如今看看首页,已经被我们改成: "召唤" 了。
我们也能够用WGET上传一个文件上去(比方你要替换的叶子吧)。然后execute Command输入 cat file > index.html or echo "" > file
echo "test" >> file
这样一条条打出来,网站首页就成功被替换了。相同的也能够
uname -a;cat /etc/passwd
只是有点要注意,有些WEBSHELL程序有问题,运行不了的,
2.搜索INC敏感信息
在google的搜索框中填入:
Code:
.org filetype:inc
===
info:xx.com 返回一些基本信息
site:xx.com 返回全部与该有关的url
link:xx.com 返回全部与该站做了连接的站
site:xx.com filetype:txt 查找TXT文件 其它的依次内推
查找后台
site:xx.com intext:管理
site:xx.com inurl:login
site:xx.com intitle:后台
查看server使用的程序
site:xx.com filetype:asp
site:xx.com filetype:php
site:xx.com filetype:jsp
site:xx.com filetype:aspx
查看上传漏洞:
site:xx.com inurl:file
site:xx.com inurl:load
查找注射点:
site:xx.com filetype:asp
Google(www.google.com)是一个搜索引擎,由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年9月发明,Google Inc. 于1999年创立。2000年7月份,Google替代Inktomi成为Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎。98年至今,GOOGLE已经获得30多项业界大奖。
二,GOOGLE特色
GOOGLE支持多达132种语言,包括中文简体和繁体中文;
GOOGLE站点仅仅提供搜索引擎功能,没有花里胡哨的累赘;
GOOGLE速度极快,据说有8000多台server,200多条T3级宽带;
GOOGLE的专利网页级别技术PageRank能够提供高命中率的搜索结果;
GOOGLE的搜索结果摘录查询网页的部分详细内容,而不仅仅是站点简单介绍;
GOOGLE智能化的“手气不错”功能,提供可能最符合要求的站点;
GOOGLE的“网页快照”功能,能从GOOGLEserver里直接取出缓存的网页。
三,基本搜索:+,-,OR
GOOGLE无需用明文的“+”来表示逻辑“与”操作,仅仅要空格就能够了。
演示样例:搜索全部包括关键词“易筋经”和“吸星**”的中文网页
搜索:“易筋经 吸星**”
结果:已搜索有关易筋经 吸星**的中文(简体)网页。共约有726项查询结果,这是第1-10项。搜索用时0.13秒。
注意:文章中搜索语法外面的引號仅起引用作用,不能带入搜索栏内。
GOOGLE用减号“-”表示逻辑“非”操作。
演示样例:搜索全部包括“易筋经”而不含“吸星**”的中文网页
搜索:“易筋经 -吸星**”
结果:已搜索有关易筋经 -吸星**的中文(简体)网页。共约有5,440项查询结果,这是第1-10项。搜索用时0.13秒。
注意:这里的“+”和“-”号,是英文字符,而不是中文字符的“+”和“-”。此外,操作符与作用的keyword之间,不能有空格。比方“易筋经 - 吸星**”,搜索引擎将视为逻辑“与”操作,中间的“-”被忽略。
GOOGLE用大写的“OR”表示逻辑“或”操作。可是,keyword为中文的或查询似乎还有BUG,无法得到正确的查询结果。
演示样例:搜索包括布兰妮“Britney”或者披头士“Beatles”、或者两者均有的中文网页。
搜索:“britney OR beatles”
结果:已搜索有关britney OR beatles的中文(简体)网页。共约有14,600项查询结果,这是第1-10项。搜索用时0.08秒。
搜索:“布兰妮 OR 披头士”
结果:找不到和您的查询-布兰妮 OR 披头士-相符的网页。
注意:小写的“or”,在查询的时候将被忽略;这样上述的操作实际上变成了一次“与”查询。
“+”和“-”的作用有的时候是同样的,都是为了缩小搜索结果的范围,提高查询结果命中率。
例:查阅天龙八部详细是哪八部。
分析:假设光用“天龙八部”做keyword,搜索结果有26,500项,并且排前列的主要与金庸的小说《天龙八部》相关,非常难找到所须要的资讯。能够用两个方法降低无关结果。
1,假设你知道八部中的某一部,比方阿修罗,添加�“阿修罗”keyword,搜索结果就仅仅有995项,能够直接找到全部八部,“天龙八部 阿修罗”。
2,假设你不知道八部中的不论什么一部,但知道这与佛教相关,能够排除与金庸小说相关的记录,查询结果为1,010项,能够迅速找到须要的资料,“天龙八部 佛教 -金庸”。
四,辅助搜索:通配符、大写和小写、句子、忽略字符以及强制搜索
GOOGLE不支持通配符,如“*”、“?”等,仅仅能做精确查询,keyword后面的“*”或者“?”会被忽略掉。
GOOGLE对英文字符大写和小写不敏感,“GOD”和“god”搜索的结果是一样的。
GOOGLE的keyword能够是词组(中间没有空格),也能够是句子(中间有空格),可是,用句子做keyword,必须加英文引號。
演示样例:搜索包括“long, long ago”字串的页面。
搜索:“"long, long ago"”
结果:已向英特网搜索"long, long ago". 共约有28,300项查询结果,这是第1-10项。搜索用时0.28秒。
注意:和搜索英文keyword串不同的是,GOOGLE对中文字串的处理并不十分完好。比方,搜索“"啊,我的太阳"”,我们希望结果中含有这个句子,事实并不是如此。查询的非常多结果,“啊”、“我的”、“太阳”等词语是全然分开的,但又不是“啊 我的 太阳”这种与查询。显然,GOOGLE对中文的支持尚有欠缺之处。
GOOGLE对一些网路上出现频率极高的词(主要是英文单词),如“i”、“com”,以及一些符号如“*”、“.”等,作忽略处理,假设用户必须要求keyword中包括这些经常使用词,就要用强制语法“+”。
演示样例:搜索包括“Who am I ?”的网页。假设用“"who am i ?"”,“Who”、“I”、“?”会被省略掉,搜索将仅仅用“am”作keyword,所以应该用强制搜索。
搜索:“"+who +am +i"”
结果:已向英特网搜索"+who +am +i". 共约有362,000项查询结果,这是第1-10项。搜索用时0.30秒。
注意:英文符号(如问号,句号,逗号等)无法成为搜索keyword,加强制也不行。
五,高级搜索:site,link,inurl,allinurl,intitle,allintitle
“site”表示搜索结果局限于某个详细站点或者站点频道,如“sina.com.cn”、“edu.sina.com.cn”,或者是某个域名,如“com.cn”、“com”等等。假设是要排除某站点或者域名范围内的页面,仅仅需用“-站点/域名”。
演示样例:搜索中文教育科研站点(edu.cn)上全部包括“金庸”的页面。
搜索:“金庸 site:edu.cn”
结果:已搜索有关金庸 site:edu.cn的中文(简体)网页。共约有2,680项查询结果,这是第1-10项 。搜索用时0.31秒。
演示样例:搜索包括“金庸”和“古龙”的中文新浪站点页面,
搜索:“金庸 古龙 siteina.com.cn”
结果:已在sina.com.cn搜索有关金庸 古龙的中文(简体)网页。共约有869项查询结果,这是第1-10项。搜索用时0.34秒。
注意:site后的冒号为英文字符,并且,冒号后不能有空格,否则,“site:”将被作为一个搜索的keyword。此外,站点域名不能有“http”以及“www”前缀,也不能有不论什么“/”的文件夹后缀;站点频道则仅仅局限于“频道名.域名”方式,而不能是“域名/频道名”方式。诸如“金庸 site:edu.sina.com.cn/1/”的语法是错误的。
“link”语法返回全部链接到某个URL地址的网页。
演示样例:搜索全部含指向华军软件园“www.newhua.com”链接的网页。
搜索:“link:www.newhua.com”
结果:搜索有链接到www.newhua.com的网页。共约有695项查询结果,这是第1-10项。搜索用时0.23秒。
注意:“link”不能与其它语法相混合操作,所以“link:”后面即使有空格,也将被GOOGLE忽略。
inurl语法返回的网页链接中包括第一个keyword,后面的keyword则出如今链接中或者网页文档中。有非常多站点把某一类具有同样属性的资源名称显示在文件夹名称或者网页名称中,比方“MP3”、“GALLARY”等,于是,就能够用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项详细资料。INURL语法和基本搜索语法的最大差别在于,前者通常能提供非常精确的专题资料。
演示样例:查找MIDI曲“沧海一声笑”。
搜索:“inurl:midi 沧海一声笑”
结果:已搜索有关inurl:midi 沧海一声笑的中文(简体)网页。共约有14项查询结果,这是第1-10项。搜索用时0.01秒。
演示样例:查找微软站点上关于windows2000的安全课题资料。
搜索:“inurlecurity windows2000 site:microsoft.com”
结果:已在microsoft.com内搜索有关 inurlecurity windows2000的网页。共约有198项查询结果,这是第1-10项。搜索用时0.37秒。
注意:“inurl:”后面不能有空格,GOOGLE也不正确URL符号如“/”进行搜索。GOOGLE对“cgi-bin/phf”中的“/”当成空格处理。
allinurl语法返回的网页的链接中包括全部查询keyword。这个查询的对象仅仅集中于网页的链接字符串。
演示样例:查找可能具有PHF安全漏洞的公司站点。通常这些站点的CGI-BIN文件夹中含有PHF脚本程序(这个脚本是不安全的),表如今链接中就是“域名/cgi-bin/phf”。
语法:“allinurl:"cgi-bin" phf +com”
搜索:已向英特网搜索allinurl:"cgi-bin" phf +com. 共约有40项查询结果,这是第1-10项。搜索用时0.06秒。
allintitle和intitle的使用方法相似于上面的allinurl和inurl,仅仅是后者对URL进行查询,而前者对网页的标题栏进行查询。网页标题,就是HTML标记语言title中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,仅仅查询标题栏,通常也能够找到高相关率的专题页面。
演示样例:查找禁止发有关政治的贴子明星藤原纪香的照片集。
搜索:“intitle:藤原纪香 写真”
结果:已搜索有关intitle:藤原纪香 写真的中文(简体)网页。共约有284项查询结果,这是第1-10项。搜索用时0.03秒。
GOOGLE的罕用高级搜索语法:related,cache,info
related用来搜索结构内容方面相似的网页。例:搜索全部与中文新浪网主页相似的页面(如网易首页,搜狐首页,中华网首页等),“related:www.sina.com.cn/index.shtml”。
cache用来搜索GOOGLEserver上某页面的缓存,这个功能同“网页快照”,通经常使用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。
info用来显示与某链接相关的一系列搜索,提供cache、link、related和全然包括该链接的网页的功能。
演示样例:查找和新浪首页相关的一些资讯。
搜索:“infwww.sina.com.cn”
结果:有关www.sina.com.cn的网页信息。
新浪首页
北京站 上海站 广东站. ... 游戏世界, |, 影音娱乐, |, Club缘, |, 男
人女人, |, 论坛聊天, |, 时尚潮流, |, 文教育儿, |, 车行天下, |,
软件下载. ...
Google 提供这个网址的信息:
查看Google网页快照里www.sina.com.cn的存档
寻找和www.sina.com.cn相似的网页
寻找网页有链接到www.sina.com.cn
寻找网页包括有`www.sina.com.cn`
六,其它重要功能
文件夹服务
假设不想搜索网页,而是想寻找某些专题站点,能够訪问GOOGLE的分类文件夹“http://directory.google.com/”,中文文件夹是“http://directory.google.com/Top/World/Chinese_Simplified/”。只是由于GOOGLE的文件夹由志愿者服务,而GOOGLE在国内名气相对照较小,因此中文文件夹下收录站点非常少。
工具条
为了方便搜索者,GOOGLE提供了工具条,集成于浏览器中,用户无需打开GOOGLE主页就能够在工具条内输入keyword进行搜索。此外,工具条还提供了其它很多功能,如显示页面PageRank等。最方便的一点在于用户能够快捷的在GOOGLE主页、文件夹服务、新闻组搜索、高级搜索和搜索设定之间切换。欲安装GOOGLE的工具条,能够訪问“http://toolbar.google.com/”,按页面提示能够自己主动下载并安装。
新闻组(USENET)搜索
新闻组中有大量的有价值信息,DEJA一直是新闻组搜索引擎中的佼佼者。2001年2月份,GOOGLE将DEJA收购并提供了全部DEJA的功能。如今,除了搜索之外,GOOGLE还支持新闻组的WEB方式浏览和张贴功能。
输入“http://groups.google.com/”后,便进入GOOGLE新闻组界面。可惜如今还没有中文界面。由于新闻组中的帖子实在是多,所以我点击“Advaced Groups Search”进入高级搜索界面http://groups.google.com/advanced_group_search。新闻组高级搜索界面提供对keyword、新闻组、主题、作者、帖子序号、语言和公布日期的条件搜索。当中作者项指作者发帖所用的唯一识别号电子信箱。比方要在alt.chinese.text内搜索著名老牌网络写手图雅的帖子,能够用下列指令“group:alt.chinese.text author:tuya@ccmail.uoregon.edu”。只是一般而言,我更推荐使用图形搜索界面,方便并且直观。
搜索结果翻译
以前为那些你不懂的法文、西班牙文页面烦恼么?如今,GOOGLE支持一项搜索结果翻译功能,能够把非英文的搜索结果翻译成英文!!尽管眼下仅仅支持有限的拉丁语、法语、西班牙语、德语和葡萄牙文,可是我不得不承认,这是个伟大的改进。
只是,眼下仅仅能在英文状态GOOGLE下实现这个功能。进入GOOGLE的设置页面,http://www.google.com/preferences,有一个“BETA: Enable translation of search results into your interface language. ”的选项,把它选中,就OK了。
搜索结果过滤
网络上的成人内容浩如烟海,并且非常多站点具有欺骗或者其它不良企图,浏览者非常easy掉入当中的陷阱。为此,GOOGLE新设立了成人内容过滤功能,见GOOGLE的设置页面,http://www.google.com/preferences,最底下有一个选项SafeSearch Filtering。只是,中文状态下的GOOGLE尚没有这个功能。
PDF文档搜索
我对GOOGLE尤其赞赏的一点就是它提供对PDF文档内文的检索。眼下GOOGLE检索的PDF文档大约有2500万左右。这真是太美妙了。PDF是ADOBE公司开发的电子文档格式,如今已经成为互联网的电子化出版标准。PDF文档一般是一些图文并茂的综合性文档,提供的资讯一般比較集中全面。
演示样例:搜索关于电子商务(ECOMMERCE)的PDF文档。
搜索:“inurldf ecommerce”
结果:已向英特网搜索inurldf ecommerce. 共约有19,200项查询结果,这是第1-10项。搜索用时0.11秒。
以下是某项搜索结果:
[PDF] www.usi.net/pdf/outsoucing-ecommerce.pdf
Outsourcing Electronic Commerce Business Case White Paper By: John P. Sahlin, Product
Marketing Professonial (PMP) Implementation Manager, Web Engineering ...
一般文字档 - 相似网页
能够看到,GOOGLE在PDF档前加上了[PDF]的标记,并且,GOOGLE把PDF文件转换成了文字档,点击“一般文字档”,能够粗略的查看该PDF文档的大致内容。当然,PDF原有的图片以及格式是没有了。
图像文档搜索
GOOGLE提供了Internet上图像文件的搜索功能!!眼下该功能尚在B測试阶段,但已经非常好用。訪问地址是“images.google.com”。你能够在keyword栏位内输入描写叙述图像内容的keyword,如“britney spears”,也能够输入描写叙述图像质量或者其它属性的keyword,如“high quality”。
GOOGLE给出的搜索结果具有一个直观的缩略图(THUMBNAIL),以及对该缩略图的简单描写叙述,如图像文件名,以及大小等。点击缩略图,页面分成两祯,上祯是图像之缩略图,以及页面链接,而下祯,则是该图像所处的页面。屏幕右上角有一个“Remove Frame”的button,能够把框架页面迅速切换到单祯的结果页面,非常方便。GOOGLE还提供了对成人内容图像的限制功能,能够让搜索者免受不必要的骚扰。
只是,非常遗憾的是,图像搜索功能还不支持中文。