渗透之路 信息收集【第四篇】网站四大套件识别
国内网站架构情况
特性1: 开源cms搭建(直接找cms漏洞) 非cms搭建(即需要代码开发) 特性2: 阿里云,腾讯云等(自带防护,难度最大) 小中型IDC空间商 企业内部服务器 特性3: 单一站点 多域名站点 多目录站点(多程序站点) 混合站点(ip:port,多域名等)
web架构四大组件
服务器操作系统:
Windows linux
搭建平台:
Iis apache nginx tomcat
数据库类型:
Access,mssql,mysql,oracle,postsql,db2,sybase
脚本类型:
Asp php aspx jsp cgi do pl py js
获取网站架构
工具识别
御剑web指纹识别系统(win软件)
whatweb(kali工具、win软件)
Wapplyzer Whatruns(网页插件)
在线平台识别
http://www.yunsee.cn/finger.html
http://whatweb.bugscaner.com/look/
获取操作系统
1.1ttl值判断(不准确)
1.2大小写问题
Windows 大小写不敏感
Linux 大小写敏感
获取搭建平台
工具(wwwscan,wvs,破壳等扫描工具),第三方平台(站长之家)
wwwscan
浏览器
站长工具(SEO查询)
获取数据库类型
1.端口扫描(扫描不到端口的可能性:数据库在内网;修改了端口)
Access 没有端口, Mssql(sql server):1433 1434 ,Mysql:3306,Oracle:1521
2.组合判断(IIS不能和Linux搭,nginx不能和windos搭,apache可以和linux、windows搭,php一般和mysql搭,asp和acess(小型网站)、sqlserver(中大型网站)搭,jsp一般和sqlserver、oracle搭)
搭建平台 脚本 数据库
asp + access
iis6.0 +asp +mssql
apche +php +mysql
iis6.0 +php +mysql
iis6.0 +aspx +mssql
tomcat + jsp +oracle
获取脚本类型
1.搜索引擎
百度、必应、谷歌:site:ecit.edu.cn inurl:php/asp/jsp
缺点:1.新网站很多页面未被收录无法识别;2.伪静态页面导致无法识别 ;3.restful风格页面无法识别
2.插件
3 .浏览器抓包
静态:特点是,该页面内容需要修改html源代码。
动态:特点是,该页面内容不需要修改html源代码,只需要修改动态脚本。
可见,一些小型网站、简单的网站可能会采用静态,大中型网站会采用动态
3.扫描爬虫
工具扫描...