2016,我的互联网运维阶段性总结|共勉 转

2016,我的互联网运维阶段性总结|共勉

1.
一个网站运维最重要的是域名,不能被劫持,密码一定要保存好。不然就被人把你的网站黑掉了。另外要注册多个域名,一旦一个域名不能用了,就尽快换另一个域名。域名也要买防DDos攻击,也要买cdn(用来做缓存和代理)。dns服务商最好买云计算dns,这样可以把真正的IP地址隐藏起来。
 
2.
一定要用代理服务器,这样可以把真正的服务器隐藏起来,核心数据库服务器一定要做主从复制,每天dump备份,还有远程灾备,要不然用到的时候哭都来不及。数据库必备知识要会bin-log还原,也要会根据dump备份还原某一个表。
 
3.
根据服务器性能,看看是否需要做web服务器的负载均衡,最好用nginx服务器。apache服务器在这里提一句,模块很多,功能很多,也比较稳定,但是性能方面真的是nginx是轻量级的,nginx还是更快一些。
 
4.
网站安全这块,一定要注意购买机房的高防,带宽一定要大,代理服务器和核心服务器之间,往连通性很重要,要经常查看他俩之间的网络连通性,看看是服务器性能配置低,还是网络带宽不够用,还是网通电信原因导致通信慢。要有一台服务器实时监控他俩之间的网络连通性,直接就访问一个index.html页面就可以监控了。只要不丢包就没问题。如果是网通电信的问题,那么要核心服务器要有多个IP地址,有的IP地址是网通的,有的IP地址是电信的,有的是移动的。所以肉盾机遍布全国各地,肉盾机连接核心服务器的哪个IP地址更快就连接哪个地址就可以了。
 
5.
密码这里要每3个月就修改一次密码,全部修改。包括邮箱的密码,因为邮箱注册的域名,还有邮箱会注册dns管理账号。所以密码管理一定要重视,可以使用keepass来做密码管理。
 
6.
局域网的管理一定要以稳定为主,网路一定要稳定,别让问题出在局域网这里,那就太不值得了。网络设备都用比较贵的比较稳定的设备。服务器一定要有raid配置,cpu一定要够大,内存也要多条,大内存,这样工作起来才会提高效率。电源这块一定要保证稳定,不行就使用ups设备,一个人一个ups也可以考虑。不然断电情况下数据丢了,那可就太影响工作效率了。
 
7.
运维要懂数据库,还有开发也要懂,硬件也要懂,网络也要懂,反正得非常全面,要不然做不好运维的。
 
8.
可以找一台硬件高配服务器,要品牌机,要有raid配置。然后做一个虚拟机,这样可以把不是很重要的服务器放在这台虚拟机上,这样就可以节省资源。
 
9.
运维一定要会写shell脚本,这样很多重复工作都不用做了,省时。还有加班的一些重复工作也不用做了,配合程序上传文件什么的,都可以让程序自己完成上传文件的工作了。
 
10.
所有的工作一定要做笔记,一定要做笔记,还要有每天的工作日志,最好使用onenote,不然要查某一天的事情,用脑袋真是记不住啊。
 
11.
定期做备份的恢复测试,看看你的备份是否好用。
 
12.
监控:一定要有监控服务器,还要有报警,只有监控服务器才能看出你的服务器是否被攻击,有报警才能及时的联系到你。如果人手充足情况下,要有人24小时监控服务器。磁盘容量监控,磁盘IO监控,cpu监控,多少用户登录服务器监控,服务器某些文件否是有改动的监控,数据库的监控。等等,建议使用zabbix监控系统。最重要的是网络的监控,还有服务器存活状态的监控,还有服务是否死掉的监控。
 
13.
所有生产服务器的配置,都要基于测试环境充分测试成功的基础上,不然千万别动生产环境。生产服务器一定要有优化配置,内核的优化,操作系统的优化,服务的优化。
 
14.
访问用户量超过2000人的时候,那就是比较大的用户量,相关的配置将会不一样,但最好的优化还是硬件的优化,硬件强大了优化就好做了。我现在还没有做过在线人数超过2000的环境,需要学习。
 
15.
再就是作为运维人员平时的工作习惯了。首先是一定要保持清醒头脑,然后是最工作一定要仔细认真,这个工作不需要太快,除非故障排错的时候。但是一定要仔细,不能出错。我工作9年了,我深深总结了这一点。平时多学习,用到的时候别人会感觉你很专业,其实都是平时的积累。一时之间就只能总结出这些内容,以上是一些阶段性的总结,这段时间服务器总是被攻击,可能是我们离职的员工干的。所以总
结了以上内容。
 
文章出处:http://blog.chinaunix.net/uid-15866552-id-5749001.html
 
(完)
 
posted @ 2017-09-07 21:38  HR·  阅读(199)  评论(0编辑  收藏  举报