转[编程感想]我做互联网的犯过的几个牛逼的错误
1 2001年 大型物流网络中心,本来是对一个目录做了一个连结,ln -s /opt/webroot web,后来删除web这个link,使用rm -fr web/,结果这个网站被删除,损失惨重。原因是别多加/就行,unlink也可以,我在使用rm的时候总是习惯使用TAB键补全命令,但是TAB补全命令的时候,最后是以“/”结尾的。
2 2003
年 远程教育网络中心,一个win2k server,单网卡, 部署 jboss
服务器,需要重启jboss。我使用windows的远程登录。因为jboss只要有连接接入就不会关闭,最简单的办法就是关闭网卡,断开所有链接,然后
重启服务器。但是我关闭网卡后,远程登录也断开了,最后还是小尚从70多台没有显示器的机子中找到了这个没有任何标识的服务器,开启了网卡。
3 如果一个错误犯一次,我也就不是我了。2005年 大型图书门户网站,需要配置tomcat集群,因此需要配置多播,发现多播配置不生效,需要重启网卡,我就输入ifconfig eth0 down,结果ssh断了。网卡只有一个,只好去IDC机房,跑了一趟。以后宁可重启机子,也不重启网卡。
4 2005年 大型图书门户网站,我配置的一个samba服务发现有人攻击,只要使用iptables 关闭端口,因为加班到晚上两点,头有些晕,命令输入错误,服务器外网无法访问,远程ssh无法联入,不得不又去IDC机房一趟。做网络测试,一定要先做好个crond 回复的脚本,尤其搞iptables得时候 小心把自己卡死,必须做crond 10分钟重启iptables。
5 2006
年 大型图书门户网站,一台服务器要装oracle8,在linux装oracle 8 是高技术的活,因为oracle
基于jdk1.1开发,如果使用redhat 7.2以上的linux,需要降低glibc的库,强制降库成功后,oracle
8环境变量配置,需要重新登陆,发现ssh无法连接。跑到IDC机房才发现,低版本的glibc下,opensshd无法启动,不得不升级glibc。建议装oracle 由专业DBA做。