代码改变世界

Discuz!NT 系统架构分析

2008-06-25 12:35  韩龙  阅读(13519)  评论(33编辑  收藏  举报

                                               

       前一段时间负责负责论坛的迁移工作,对其架构进行了简单的整理。前几天看到有人说
discuz的介绍很少,因此整理了一下,发布出来。
       也是第一次发表文章,大侠们手下留情。
 
 

 

Discuz整体架构如下图所示:

 

横向表示 同一层次中涉及的各个模块(项目)

纵向表示 不同层次之间模块的关系,某些关系是如何在各层次中传递(穿越)

         Discuz架构上采用了比较流行的三层架构,即表现层,业务逻辑层,数据访问层来进行设计,并结合自己的情况进行了特殊处理。

表现层:

         表现层即为上图中蓝色虚线表示,主要包括:WebServicesUIControl。各项目主要功能为:

UI 定义各种页面基类,提供Ajax访问访问接口。

Control存放Discuz用到的自定义服务器端控件。

Services提供外部访问接口。

 

         Discuz引入了一种模板引擎的机制,来实现表现层的多样化。

主要设计思想为:针对设计人员,提供纯静态页面,并提供了一套约定的语法和标签(具体位置在:templates)。模板制作完成后,要进行模板导入,此时discuz会将静态模板进行解析将其转换成 aspx页面,然后放到aspx/1..n下。如果你打开这下面的文件,会发现前端只是一个字符串拼接的过程。要进行的逻辑判断,都放到了后台代码中。后台代码只有一份,所有的 aspx模板引用同一个后台处理类。由此实现web表现的多样化

 

当用户进行页面浏览时,首先确定显示哪个模板,然后采用地址重写技术,将其转移到实际的处理文件。在web.config配置为


 

可见Discuz对所有的请求进行了控制,其代码如下 (以Index.aspx为例):

 

 




首先程序会先查找
Cookie,找到TemplateId,然后重定向到相应的模板文件。

综上所述:模板+重定向实现了表现层的多样化。

 

业务逻辑层:

         业务逻辑,顾名思义就是处理与业务相关的代码。Discuz采用的也是中小型项目的常用的“贫血模式”,即在业务逻辑层只是进行实体的获取,转发和赋值,几乎没有业务操作。

本该封装在此层的业务代码进行了分散,一部分前移至表现层(比如发帖时的加分操作,附件处理),一部分后移到了存储过程(比如发帖后更新我的发帖列表)。

注:关于贫血模式的论述详见 Martin Fowler的相关著作<企业应用架构模式>      

 

         在业务层,使用了Discuz缓存。主要是更改了存储体,将其存储在xml中(为啥这么喜欢用xml呢,印象中它是很慢的),调用方法和通常情况下几乎无差别。

个人感觉其业务逻辑层是项目中设计最失败的地方。拿发帖举例,如果我进行设计,我的方案可能会是这样:

时间关系,有时间再写一篇文章。

 

顺便说一句:如果要进行Discuz的整合,主要调用的就是此层的代码。

主要项目为:

Discuz.Forum

Discuz.Space

 

        

数据访问层:

 

Discuz基于商业考虑和版本限制等因素,迄今为止已有多种数据源:accessmysqlsqlserver等。为了实现三种数据库的接口统一,此处使用了接口和抽象类进行规范。

其类库结构如下(调用方以Post为例)

 

 


各个数据库中的
PostManage都使用DbHelper进行通用数据库的访问。DbHelper本身并没有指定具体的数据库链接类型,参数类型,而是使用.Net自带的抽象类DbProviderFactory来创建。具体数据库的加载要等其静态属性Provider,Factory调用时,读取配置文件,以反射形式进行初始化。

代码如下:

 

 

通过此种形式,可以实现各种数据接口的调用的统一,同时方便数据库类型的拓展。比如要加入Oracle的支持,只需要继承IDbProvider实现OracleProvider,新的PostManage继承IDataProvider重写部分方法即可。

而业务层(Posts)的调用通过IDataProvider接口来进行统一,避免了和数据库类型的耦合,可以在不改变业务层,表现层的代码基础上实现数据库之间的迁移。这正是大型项目所需要的,以接口来实现层与层之间的通讯,将更多的可变因素,扩充点实现配置化。

 

 

其他子模块的介绍

 

1.       配置

对配置的管理,小型项目可以直接使用web.config,中大型项目一般使用自己的配置解决方案。原因是:

1. 中大型项目配置文件过多,直接使用web.config来会造成其体积过大

2. web.config直接使用字符串进行读取不方便,

  试着比较一下:

  ConfigurationManager.AppSetting[“SiteName”];

 SiteInfo.Name

3. 每次都需要进行类型转换

 

 

 Discuz实现了自己的配置类,其类结构如下(Email为例)

 


IConfigInfo
为空接口,没有定义任何方法,主要是方便DefaultConfigFileManager传递,方便以后扩充。对配置文件的解析也没有使用.Net自带的接口,而是重新定义了接口,同时使用了xml反序列化实现配置文件的加载和类型转换。

代码见: DefaultConfigFileManager.DeserializeInfo





比较疑惑的是这个项目中某些类给出了实现,却没有发现调用。可能是兼容或者扩充问题留下的,谁对这方面了解的,也可以跟帖说下。

这些类有:ConfigProviderIConfigFileManager

 

2.       数据库表的设计

数据库设计中有两个引人注意的地方:

1.       主题表分离

 

如果由我们来设计主题表和回帖表,通常的做法是如下。


 

 

这样在获取主题列表时,直接使用分页算法提取Topics;查看某一帖子时,还需要对TopicsPosts进行jion链接。

此种设计的缺陷为:

1.       Topics表存储Content的内容,其体积将会很大,对大体积表进行分页,性能很慢。

2.       显示Posts内容时将进行join操作,损耗性能

Discuz的做法是进行如下设计。




 

Topics里的Content拆分到Posts中去,同时Topics的主题帖也作为回帖放置到Posts里面,这样就解决了上面我们提出的两个问题。这是典型的违反数据库设计范式以换取更好性能的示例。

 

2 Posts表进行水平拆分

         原来以为每一百万帖子,discuz会自动进行拆分,后来发现在discuz后台能够进行设置,手动进行分表,discuz建议每30-50万帖子进行一次拆分。

         进行拆分后,每个表的体积将会减少,保证了查询的效率

 

 

Discuz的整体架构还有很多其他值得细说的地方,例如插件、扩展等,这些需要感兴趣的人自己一一去研究,在此就不多讲了.