06 2014 档案

摘要:最近,我们干了一件“惊天动地”的事——对改了十年、代码混乱无比、WebForms与MVC混血、ADO.NET与Entity Framework混合的博客程序,用.NET 4.5的async/await特性进行了异步化改造。主要的异步化改造已于昨天完成,并在昨天晚上发布了异步化改造后的博客程序。 阅读全文
posted @ 2014-06-30 10:01 博客园团队 阅读(10403) 评论(39) 推荐(35) 编辑
摘要:热点随笔:·【求职经历】腾讯游戏实习生面试体验(王选易)·在外包的这几年,技术和管理经验总结($慧哥)·程序员级别鉴定书 ----中级.NET开发者(北冥冰皇)·从程序员的月薪谈起(喝咖啡的螃蟹)·.NET里简易实现AOP(金源)·移动端网页设计经验与心得(wingkun)·开源项目练习EF+jQu... 阅读全文
posted @ 2014-06-30 08:27 博客园团队 阅读(1353) 评论(0) 推荐(1) 编辑
摘要:本来美美地想着用阿里云的磁盘快照功能进行发布程序的版本管理。将程序放在一个单独的数据磁盘中,每次发布前创建一个快照,如果发布后出现问题,立即回滚快照。可是后来发现回滚快照时,竟然要将整个云服务器关机,美好的想法就这么破灭了。。。了解了一下AWS,回滚数据磁盘快照并不需要将整个EC2关机。 阅读全文
posted @ 2014-06-24 12:13 博客园团队 阅读(4007) 评论(2) 推荐(0) 编辑
摘要:热点随笔: · 讨论:程序员高手和菜鸟的区别是什么?(道法自然) · POCO Controller 你这么厉害,ASP.NET vNext 知道吗?(田园里的蟋蟀) · BrnShop开源网上商城第一讲:架构设计(时间都去哪了) · 适合程序员的智能家居(... 阅读全文
posted @ 2014-06-23 08:48 博客园团队 阅读(1982) 评论(0) 推荐(1) 编辑
摘要:阿里云的负载均衡产品叫SLB,七层负载均衡用的是LVS+Tengine,四层负载均衡用的是LVS。昨天七层SLB出现了波动,我们后来改用了四层SLB。使用后意外地发现,用户请求的响应内容TCP出包走的是云服务器的公网网卡。 阅读全文
posted @ 2014-06-18 12:11 博客园团队 阅读(7043) 评论(8) 推荐(1) 编辑
摘要:今天早上7:00开始的从阿里云虚拟机到物理机的切换,由于遭遇阿里云网络问题提前结束,14:38更改了DNS解析将流量切换回虚拟机。网络问题是我们在14:30左右发现的,当时用浏览器打不开网站。用Firefox测试,显示连接超时。从服务器上的Windows性能监视器看请求量没有明显变化,可能是部分网络线路的用户受影响。 阅读全文
posted @ 2014-06-17 16:34 博客园团队 阅读(4169) 评论(19) 推荐(6) 编辑
摘要:为了解决神奇诡异的“黑色1秒”问题,我们与阿里云一直在努力着!今天早上7点左右,我们将主站(www.cnblogs.com)的流量切换到了阿里云提供的物理机上,以观察黑色1秒是否依然会出现。如果不出现,说明是虚拟机的问题,那阿里云会投入更多力量去优化Xen。如果依然出现,说明是Windows的问题,那我们会借助ASP.NET vNext的东风将Windows换成Linux。 阅读全文
posted @ 2014-06-17 08:16 博客园团队 阅读(3430) 评论(33) 推荐(9) 编辑
摘要:大家都知道在IIS中有个HTTP keep-alive设置,很多人可能和我们一样,以为这样设置后,IIS会就在发送响应内容时加上这个http header——Connection: keep-alive。今天在偶然的情况下突然发现——不是这样的,这是一个让人瞠目结舌的骗局——只要用的是http 1.1协议,IIS坚决不发keep-alive响应头。 阅读全文
posted @ 2014-06-16 19:28 博客园团队 阅读(8259) 评论(17) 推荐(5) 编辑
摘要:热点随笔:·重磅来袭,开源Asp.Net MVC网上商城BrnShop正式发布,提供源码下载(时间都去哪了)·分享我对 ASP.NET vNext 的一些感受,也许多年回过头看 So Easy!(田园里的蟋蟀)·Windows平台分布式架构实践 - 负载均衡(下)(Jesse Liu)·自己动手打造... 阅读全文
posted @ 2014-06-16 08:48 博客园团队 阅读(1849) 评论(0) 推荐(3) 编辑
摘要:这篇博文分享的是我们针对一个耗时20秒的请求,用Wireshark进行抓包分析的过程。请求的流程是这样的:客户端浏览器 -> SLB(负载均衡) -> ECS(云服务器) -> SLB -> 客户端浏览器。从分析的情况看,SLB与客户端的网络环境都可能引起这个问题。但是从IIS日志来看,有些耗时长的请求竟然达到了140秒,什么样的客户端会傻到一直等2分多钟而不断开TCP连接或重发请求? 阅读全文
posted @ 2014-06-15 17:30 博客园团队 阅读(23832) 评论(6) 推荐(8) 编辑
摘要:超过70秒的请求是通过分析IIS日志发现的,通过Wireshark抓包分析请求是9:22:21收到的。这个请求响应内容的长度是:Content-Length 1154110(1.1MB),云服务器在收到请求后,发了一个ACK包。接下来就是一堆的TCP segment of a reassembled PDU。 阅读全文
posted @ 2014-06-15 10:29 博客园团队 阅读(5239) 评论(8) 推荐(2) 编辑
摘要:这是今天遇到的第3次故障,故障是首先被园友发现的,访问园子出现来自SLB的错误提示:400 Bad Request - Powered by Tengine。查看Windows性能监视器发现,在故障期间SLB中的2台云服务器的http.sys的ArriveRate明显下降。 阅读全文
posted @ 2014-06-12 16:58 博客园团队 阅读(1473) 评论(5) 推荐(2) 编辑
摘要:这是今天遇到的第2次故障,主站1台云服务器在14:40:33-14:41:09期间出现CPU突然跑满的状况,而CPU跑满之前,请求量并没有明显增长。向阿里云提交之后,说晚上会对这台云服务器的虚拟机进行优化。 阅读全文
posted @ 2014-06-12 16:33 博客园团队 阅读(1189) 评论(3) 推荐(0) 编辑
摘要:今天中午12:00左右,在Windows性能监视器中突然发现SLB中的两台云服务器的IIS请求到达量(ArriveRate)突然下降,我们推测在12:00-12:10之间,SLB(阿里云负载均衡)出了什么状况?这个问题有待继续观察。 阅读全文
posted @ 2014-06-12 13:37 博客园团队 阅读(1064) 评论(0) 推荐(0) 编辑
摘要:今天下午17:00-17:05之间,在请求量没有明显变化的情况下,SLB中的1台云服务器的CPU突然串到100%(当时SLB中一共有3台云服务器)。造成的直接后果是请求执行时间变得超长,最长竟然达到了53秒。另外伴随的表现是大量请求排队。从这些现象分析,我们猜测CPU 100%那台云服务器出现了CPU资源争抢问题。 阅读全文
posted @ 2014-06-11 17:41 博客园团队 阅读(1543) 评论(2) 推荐(0) 编辑
摘要:“黑色1秒”问题经过一个多月的艰苦奋战,今天终于取得了重要进展!我们终于有了足够的数据证明不是微软IIS的问题,就是阿里云Xen虚拟机的问题。这篇博文分享的是我们如何进行证明的,而且这次证明连Window性能监视器都不需要。下面我们来分析一下今天10:37:35出现的“黑色1秒” 阅读全文
posted @ 2014-06-10 13:14 博客园团队 阅读(6847) 评论(42) 推荐(7) 编辑
摘要:(注:由于阿里云SLB管理控制台监控数据不准,实际故障时间是18:07-18:20。)17:55-18:2018:07-18:20,我们使用的阿里云SLB(负载均衡)中有3台出现突发故障,造成全站无法访问,给您带来了麻烦,请谅解!目前已经恢复正常,从阿里云那得知的故障原因是——由于杭州地区的SLB所... 阅读全文
posted @ 2014-06-09 18:37 博客园团队 阅读(4150) 评论(40) 推荐(12) 编辑
摘要:热点随笔: · 为生活可以忍,侮辱技术行不行?(沈逸) · 程序员跳槽注意事项(麒麟子(Alex)) · 中国的程序员们是否要声援微软小冰?(徐少侠) · 让 asp.net 在 mac 上飞(linli8) · 一次由注释引发的“血案”(An... 阅读全文
posted @ 2014-06-09 08:08 博客园团队 阅读(1659) 评论(0) 推荐(2) 编辑
摘要:当今天早上在日志中发现这样的错误之后,对阿里云OCS(mecached缓存服务)的积怨倾泻而出。这个问题我们4月份发现过的,当时给OCS起了个外号叫“会断连接的memcached”,用了近1个月时间才解决。这次升级后又出现了,虽然不是故意为之,但是如果是淘宝用的memcached,你们敢断连接吗? 阅读全文
posted @ 2014-06-08 19:13 博客园团队 阅读(10415) 评论(37) 推荐(21) 编辑
摘要:向大家分享一下最近排查“黑色1秒”问题的进展,“黑色1秒”的问题表现详见什么是黑色1秒。1.发生在w3wp进程内;2.请求未进入.NET线程池;3.发生在处于user-mode的IIS核心模块;4.最大的两个嫌疑对象:w3tp与w3dt。 阅读全文
posted @ 2014-06-07 19:19 博客园团队 阅读(3999) 评论(18) 推荐(9) 编辑
摘要:我们用的Memcached缓存服务是阿里云OCS,今天晚上遇到了一次OCS挂掉的情况(计划中的升级),看一下性能监视器中的表现,也许对分析黑色1秒问题有帮助。 阅读全文
posted @ 2014-06-05 21:34 博客园团队 阅读(2327) 评论(1) 推荐(0) 编辑
摘要:今天下午遇到了自使用阿里云以来首次遇到的新情况——http.sys的ArrivalRate突降(说明请求到达IIS的请求数量少了),而且SLB中的3台ECS都出现了这个问题。初步怀疑是SLB或者SLB的网络问题,已向阿里云提交了工单。 阅读全文
posted @ 2014-06-04 17:28 博客园团队 阅读(1472) 评论(3) 推荐(0) 编辑
摘要:今天早上9:06左右,Windows性能监视器监测到主站的Web服务器出现了CPU 100%的情况,伴随着Requests/Sec的上升。QPS最高冲到了601。IIS的Current Connections也随之上升。 阅读全文
posted @ 2014-06-04 10:21 博客园团队 阅读(845) 评论(3) 推荐(0) 编辑
摘要:这篇博文记录一下6月1日在阿里云上遇到的奇怪的CPU 100%问题,希望多年以后能真相大白。那天负载均衡(SLB)中只放了1台云服务器(平时都放2台),由于是节假日,虽然只放了一台,但这台服务器的负载也没有平时高。但在上午的时候突然出现了CPU 100%问题,然后切换到另外一台云服务器恢复正常。 阅读全文
posted @ 2014-06-03 21:51 博客园团队 阅读(4799) 评论(3) 推荐(0) 编辑
摘要:热点随笔: · [歪谈]员工(人才),留得住是因为本身就留得住;留不住的,你永远留不住(沈逸) · 离开北京之前我把过去四年做过的项目的全部源码公开了、需要的联系我、不需要的也欢迎喷水(Suzuki.kakeru) · 关于公司开发突然转语言的问题(任岩磊) ... 阅读全文
posted @ 2014-06-02 08:26 博客园团队 阅读(1472) 评论(0) 推荐(1) 编辑