白话BigPipe[转载]
所谓BigPipe,指的是Facebook开发的用来改善客户端响应速度的技术。本质上讲,其实它并不是新事物,原理上等同于Yahoo在Best Practices for Speeding Up Your Web Site里提出的Flush the Buffer Early,不过BigPipe的实现更灵活,所以有必要了解一二。
我们平常浏览网页时的体验通常是串行的:浏览器发起请求,服务器收到后渲染页面,在此期间,浏览器除了等待别无选择,演示代码如下:
<?php sleep(1); $header = 'header'; sleep(1); $content = 'content'; sleep(1); $footer = 'footer'; ?> <html> <head> <title>test</title> </head> <body> <div id="header"><?php echo $header; ?></div> <div id="content"><?php echo $content; ?></div> <div id="footer"><?php echo $footer; ?></div> </body> </html>
注:代码里用sleep模拟服务端耗时的操作。
如果我们把串行改成并行的方式呢?每当服务器生成新的内容立刻发送给浏览器,浏览器立刻渲染,不必等到接收到全部数据再处理,毫无疑问会提升用户体验,演示代码如下:
需要说明的是代码仅运行于Apache + Mod PHP环境,旧版本Apache可能需要关闭GZip。
<html> <head> <title>test</title> </head> <body> <?php sleep(1); ?> <div id="header"><?php echo str_pad('header', 1024); ?></div> <?php ob_flush(); flush(); ?> <?php sleep(1); ?> <div id="content"><?php echo str_pad('content', 1024); ?></div> <?php ob_flush(); flush(); ?> <?php sleep(1); ?> <div id="footer"><?php echo str_pad('footer', 1024); ?></div> <?php ob_flush(); flush(); ?> </body> </html>
注:某些浏览器必须接收到一定长度的内容才开始渲染,所以代码里用到了str_pad。
代码里用到ob_flush和flush把页面分块刷新缓存到浏览器,此时如果使用Firebug查看响应头的话,会发现:Transfer-Encoding=chunked,如此一来浏览器就可以实现分块渲染了。
BigPipe在此基础上更进一步,演示代码如下:
<html> <head> <title>test</title> </head> <body> <div id="header"></div> <div id="content"></div> <div id="footer"></div> <?php ob_flush(); flush(); ?> <?php sleep(1); $header = str_pad('header', 1024); ?> <script> document.getElementById("header").innerHTML = "<?php echo $header; ?>"; </script> <?php ob_flush(); flush(); ?> <?php sleep(1); $content = str_pad('content', 1024); ?> <script> document.getElementById("content").innerHTML = "<?php echo $content; ?>"; </script> <?php ob_flush(); flush(); ?> <?php sleep(1); $footer = str_pad('footer', 1024); ?> <script> document.getElementById("footer").innerHTML = "<?php echo $footer; ?>"; </script> <?php ob_flush(); flush(); ?> </body> </html>
使用BigPipe,先刷新布局(Layout),然后按块(header,content,footer)刷新相应的Javascript代码,从而实现页面内容的填充。
BigPipe之所以使用Javascript渲染页面,是因为这样一来渲染页面的时候,就不会被块的位置束缚住,如果我们的服务器支持多线程,那么就可以同时处理多块内容,哪块先处理好就把哪块刷新到浏览器,即便不支持多线程,服务器也可以按照内容的重要程度分主次先后渲染,不必拘泥于HTML代码的物理顺序。此外还应注意一下BigPipe和Ajax二者的区别,对于一个分成若干个块的页面而言,如果使用Ajax的话,每一块都需要单独发送一个HTTP请求,而如果使用BigPipe的话,不管有多少块,都仅有一个HTTP请求。所以Ajax对服务器造成的压力会是BigPipe的若干倍。
提醒:BigPipe不利于SEO,应用时可通过User Agent判断请求是人还是搜索引擎,如果是人的话,则应用BigPipe渲染模式,如果是搜索引擎的话,则应用传统渲染模式。
补充:在Nginx + PHP FastCGI环境运行文中的代码,会发现无效,这是缓存造成的。在Nginx FastCGI环境下,如果数据小于fastcgi_buffers,会缓存到内存中,否则如果数据小于fastcgi_max_temp_file_size,会缓存到硬盘上。因为flush是Apache环境下才有效的函数,不适用于Nginx环境,所以唯一的出路就是想办法关闭缓存,可通过实验发现即便把fastcgi_buffers和fastcgi_max_temp_file_size都禁止了,还是没有用,所以说截至目前为止,Nginx + PHP FastCG无法实现BigPipe,相对可行的方法是通过Apache + Mod PHP实现BigPipe,而Nginx则放在代理服务器的角色上,并使用proxy_buffering关闭代理缓存。
参考:Facebook网站的Ajax化、缓存和流水线(PDF)。