随笔分类 - 网站架构
摘要:一:基于HTTP协议的Web API1:RESTful API http://www.ruanyifeng.com/blog/2011/09/restful二:
阅读全文
摘要:http://www.cnblogs.com/aigongsi/archive/2012/09/21/2696773.htmlhttp://www.cnblogs.com/aigongsi/archive/2012/09/22/2698055.html
阅读全文
摘要:随着BIG DATA大数据概念逐渐升温,如何搭建一个能够采集海量数据的架构体系摆在大家眼前。如何能够做到所见即所得的无阻拦式采集、如何快速把不规则页面结构化并存储、如何满足越来越多的数据采集还要在有限时间内采集。这篇文章结合我们自身项目经验谈一下。我们来看一下作为人是怎么获取网页数据的呢?1、打开浏...
阅读全文
摘要:关于大型网站技术演进的思考(一)--存储的瓶颈(1)http://www.cnblogs.com/sharpxiajun/p/4237704.html#!comments问题延伸:1:分主从数据库后,主库同步到从库的方法?(从库晚于主库的解决办法?)2:把网站的应用部署到至少两台机器上,如何做到代码...
阅读全文
摘要:简单说,分布式是以缩短单个任务的执行时间来提升效率的,而集群则是通过提高单位时间内执行的任务数来提升效率。 例如: 如果一个任务由10个子任务组成,每个子任务单独执行需1小时,则在一台服务器上执行改任务需10小时。 采用分布式方案,提供10台服务器,每台服务器只负责处理一个子任务,不考虑子任务...
阅读全文
摘要:维基百科的网站架构 http://iamcaihuafeng.blog.sohu.com/111526687.html查看影响web服务器IO负载的因素王宏-大众点评网Web开发之路.pdf http://www.open-open.com/doc/view/b0cd47210aa3495095ed...
阅读全文
摘要:涉及知识点:1,主从复制,读写分离 对主库修改数据,查询使用从库。一主多从,来降低数据库读取压力。2,分库分表 查看详情根据实体业务来分库,分表。如,根据数据的活跃性,根据用户uid等。3,mysql 不同存储引擎区别 查看详情InnoDB 用于数据完整性/写性能要求比较高的应用. MyISAM 适合查询应用。一个简单的图例:分库分表:http://blog.sina.com.cn/s/blog_6e322ce70100zs9a.htmlhttp://bbs.csdn.net/topics/340181289http://bbs.csdn.net/topics/390560149?page=1
阅读全文
摘要:目前网站架构一般分成网页缓存层、负载均衡层、 WEB层和数据库层,我其实一般还会多加一层,即文件服务器层,这样我们在后面的讨论过程中,我们可以依次用这五层对网站架构来进行讨论;这里为了更具有 说服力,我将用三个并发较大的生产环境来说明下,一个是我现在维护的电子商务网站(并发最大峰值2900,日PV500万左右)、我目前维护的电子广告网 站(并发最大峰值1500,日PV150万左右)、以前维护的大型CDN门户广告网站(并发最大峰值5000,日PV5000万左右)。网页缓存层首先说下这个网页缓存层,比如CDN租赁(效果比公司自己部署Squid/Varnish要好,他们专业,价格低廉,比如快网/CC
阅读全文
摘要:大型网站架构演变和知识体系 http://www.blogjava.net/BlueDavy/archive/2008/09/03/226749.html
阅读全文
摘要:一.软件介绍(apache lighttpd nginx)1. lighttpdLighttpd是一个具有非常低的内存开销,cpu占用率低,效能好,以及丰富的模块等特点。lighttpd是众多OpenSource轻量级的web server中较为优秀的一个。支持FastCGI, CGI, Auth, 输出压缩(output compress), URL重写, Alias等重要功能。Lighttpd使用fastcgi方式运行php,它会使用很少的PHP进程响应很大的并发量。Fastcgi的优点在于:· 从稳定性上看, fastcgi是以独立的进程池运行来cgi,单独一个进程死掉,系统可
阅读全文
摘要:前几天为了开发方便,和一个同事将XX.qq.com的测试站点拆成两个站点,我那个叫XX_hanks.qq.com,进行功能开发,在调试 cookie功能的时候,发现IE下cookie没有记住,用httpwatcher check了下,发现response里有set-cookie,但是IE发起请求的时候却没有把这个域名下的cookie内容放到请求里,以为是我的 IE8安全性问题,折腾了半天,尝试了IE6等也是同样问题,目录下保存有qq.com域名的cookie,没有XX_hanks.qq.com的 cookie,但是请求xx_hanks.qq.com时,连qq.com的cookie也不传了,大窘
阅读全文
摘要:千万级的注册用户,千万级的帖子,nTB级的附件,还有巨大的日访问量,大型网站采用什么系统架构保证性能和稳定性?首先讨论一下大型网站需要注意和考虑的问题。数据库海量数据处理:负载量不大的情况下select、delete和update是响应很迅速的,最多加几个索引就可以搞定,但千万级的注册用户和一个设计不好的多对多关系将带来非常严重的性能问题。另外在高UPDATE的情况下,更新一个聚焦索引的时间基本上是不可忍受的。索引和更新是一对天生的冤家。高并发死锁:平时我们感觉不到,但数据库死锁在高并发的情况下的出现的概率是非常高的。文件存储的问题:大型网站有海量图片数据、视频数据、文件数据等等,他们如何存储
阅读全文
摘要:最常用是F5 与citrix netscaler负载均衡分全局负载均衡和本地负载均衡。地负载均衡是指对本地的服务器群做负载均衡,全局负载均衡是指对分别放置在不同的地理位置、有不同网络结构的服务器群间作负载均衡。循环DNS就是每次解析域名时指向IP loop list 里的下一个IP.负载均衡路由器通过某种策略把请求发送到响应最快的server上, 同时可以满足故障转移/故障恢复. 但是负载均衡路由器本身需要维护,通常需要有两个, 来防止单点故障.例如Alteon 180 和 F5 Network 的 Big-IP负载均衡可以针对不同的网路层次链路聚合技术(第二层负载均衡)是将多条物理链路当作一
阅读全文
摘要:一、cms系统和php框架架构的不同cms系统在入口配置文件中,往往会加入想css path,js path, img path 这些常量,来确定这些文件的路径,而框架因为未定,所以一般不设置
阅读全文