检查网站是否有问题步骤:

1. ping www.baidu.com  --> icmp协议基础(高速公路有没有修通),防火墙可以禁止icmp协议

  ping -c3 -i2 -s512 www.baidu.com 可以不使用参数,这条命令表示ping3次,每隔2秒,每次的数据包大小为512字节

2. traceroute www.baidu.com --> 基础检查,各个高速节点有没有修通

[root@oldboy ~]# traceroute www.baidu.com -n
traceroute to www.baidu.com (183.232.231.172), 30 hops max, 60 byte packets
 1  192.168.0.1  3.417 ms  4.474 ms  4.581 ms  # 局域网,在同一内网
 2  192.168.1.1  8.179 ms  12.224 ms  33.483 ms # 局域网 对方和您在同一内部网
 3  100.114.0.1  47.350 ms  49.684 ms  52.549 ms # 运营商级NAT IP地址
 4  183.213.14.213  69.411 ms  78.604 ms  83.214 ms  # 浙江省温州市 移动
 5  221.183.47.13  101.701 ms  101.843 ms  106.099 ms  # 浙江省温州市 移动
 6  221.183.41.41  138.743 ms  148.730 ms *  # 海南省海口市 移动
 7  221.183.59.158  175.552 ms  176.081 ms  179.727 ms # 海南省海口市 移动
 8  120.241.49.38  174.741 ms 120.241.49.234  161.142 ms 120.241.49.226  176.737 ms # 广东省广州市 移动
 9  * * *
10  * * *
11  * * *
12  * * *
13  * * *
14  * * *
15  * * *
16  * * *
17  * * *
18  * * *
19  * * *
20  * * *
21  * * *
22  * * *
23  * * *
24  * * *
25  * * *
26  * * *
27  * * *
28  * * *
29  * * *
30  * * *

 

3. telent 10.0.2.15 80 --> 检查服务器web有没有开启,服务有没有开,以及防火墙有没有挡住

nmap 10.0.2.15 -p 80 和telnet一样的想过,但nmap只能在linux中使用

不通的原因:

  • 1. 80服务没开,或端口不存在
  • 2. fw防火墙阻拦了
  • 3. 服务监听的端口不在连接的IP上
  • 4. 运营商默认不开,申请开端口

4. 检查是否是防火墙阻拦

  /etc/init.d/iptables stop

 

ssh故障排查思路示例:

 


 

抓包工具

  • tcpdump命令
    • tcpdump -n icmp -i eth0
  • nmap
  • windows系统有: wireshark (), sniffer, 科来网络分析等几个软件

 


题目:

1. 作为网管,局域网的某个机器无法上网排错(局域网个人电脑)

答:

以win32客户端为例:排查方法

提示:基本检查思路,在win32客户端上执行

(1) 单个机器无法上网思路

  • ping www.baidu.com 外网;高速有没有修通
    • 如果通,还不能上网:可能是浏览器的问题,或者是中毒了
  • ping 192.168.0.1 网关
    • 目的是排除物理链路(网线,网卡,驱动,IP设置等)
    • 如果ping网关不通,则查看ip设置,然后ping 自身ip 或ping网内其它机器IP
      • 如果ping自己ip不通:检查ip设置、网卡驱动、物理链路。
      • 如果ping网内其它机器IP是通的:很可能是网关屏蔽联网了
  • ping网关通的情况下,检查dns的设置情况是否正确
    • 检查方法:ping公网ip,看通常情况ping 183.232.231.174(百度的ip)
    • host,dig,nslookup 检查域名解析
  • 上网路由器以及ISP线路问题
    • 登陆路由,检查上级线路,打电话给ISP线路问题。
  • 辅助排查:IP地址冲突,其他人能否上网,ARP病毒,核心交换机坏了,交换机环路(看日志)。

(2)大面积上不了网的思路

  • 路由器,ISP,核心交换机,ARP病毒欺骗网关,网关地址被占用,LDNS出问题,核心交换机坏了,交换机环路。

 

2. 作为linux运维,客户反应打开网站服务器访问慢,如何排错。(运维角度)

答:

(1)单个个例,还是全部

自己把自己当作用户测试网站,如果没问题,就从客户的角度思考;如果自己测试也有同样的问题,则按下面的思路进行排查:

1. 路是否通的问题

  • ping www.etiantian.org 外网;高速公路有没有修好;
    • 如果ping是通的,也不丢包。表示服务器的icmp的协议没问题,则可能是http服务的问题(服务宕机了,服务过载了)
    • 如果ping是通的,但是丢包。可能是机房的带宽不稳定。各个线路不稳定。
    • 如果ping不通,ping www.baidu.com通。则还是http服务的问题,或则机房宕机的问题。
  • traceroute -d www.oldboy.me 高速的各个路段有没有修好;从客户端到服务器之间各个线路,让机房配合查。
    • windows系统则是:tracert www.oldboy.me -d命令

2. 机房业务是否正常ok

  • telnet 10.0.2.25 80 检查服务器web服务有没有开启,以及防火墙有没有挡住
    • 等价命令 nmap 10.0.2.25 -p 80,仅linux可用
    • curl www.oldboy.me 或者 wget www.oldboy.me,相当于浏览器访问。
  • 提供服务的服务器是否资源过载,服务器及服务连接数过多,负载高,CPU高,IO高等

3. 外部问题

  • 服务器购买的带宽满了,通过流量监控服务查看。
  • 内链外链(调用外部网站网址有问题)
    • 重要的调试网站前端的工具
    • 根据网站URL调试网站:
      • google浏览器直接F12
      • 火狐,firebug,yslow
      • le httpwatch

4. 其它问题:

个别客户自身问题。

例如:用户的线路和网站带宽的线路不符。

5. 集群架构(数百台服务器提供服务):

  • web服务
  • 数据库问题,登陆数据库,看是否有慢查询语句show processlist,调整mysql配置,优化sql语句
  • 存储等的问题。是不是存储服务器,如NFS,MFS的负载及磁盘IO高?

 

posted on 2019-11-22 16:39  Zoe233  阅读(1025)  评论(0编辑  收藏  举报