小项目之数据库设计经验分享

      背景:

      最近给客户做了一个小工具,主要是为了减轻客户那边的工作压力,一般公司都有很多自己的业务数据需要定期发给自己的员工,比如各种指标数据,绩效评比等, 大多都是按公司的组织结构来,一级一级往下发,领导接收的数据一般会包含自己下一级人员的数据,所以客户这边也不例外,每次到了一定的周期(每周,每月或者每季度),就会由专业人员将一份完整的数据分别按组织结构一级一级往下发,全体领导基本都需要做这件事。
     
      于时,我们需要给领导做一个自动分发数据的工具,将这些数据按一定要求自动的发送到各自人的邮箱中,需求给简单,就是发邮件,从程序功能上讲也就分三部分:
      1:解析数据源并加载到数据库中
      2:提取数据并发送邮件
      3:将发送结果反馈给指定的人
     
      之前我们一致认为数据源是稳定的,数据源格式是excel,里面的sheet名称及数量是固定的,字段也是固定的(字段数量以及名称),所以我们有一种非常简单的做法,就是将excel的每个sheet映射成数据库中的一张表,表字段和excel字段一一对应即可,最后根据不同的业务数据需求,构建不同的邮件模块,最后实现邮件发送。
     
      问题:
      但有一天,我们的客户负责人发生了变更,他提出了一个问题:如果以后发送的数据发生变化,你们的软件能支持吗,比如今年我们的excel发送的是10个指标数据,明年如果想再增加5个或者重新替换原来的指标。
     
      由于我们对此工具的定位非常低,及不用花太大代价在小工具上,尽早用上尽早减轻客户工作量,同时也会降低开发成本,当时我们理解为数据源不会轻易发生变化,所以设计了上面的解决方案,及不支持数据的动态变更。但新的负责人提出了我们的方案不够灵活,可扩展性,可配置性稍弱,为此我们不得不重新设计方案以支持指标数据的动态变化需求,哎,怎么说呢,如果我们给客户想的多想的全,他们也有可能说,就一小工具不用这么复杂吧,总之既然问题提出我们就需要想办法及解决呀。
     
      习惯性思维产生的解决方案:
      动态构建数据表,及首先解析每个sheet有多少列,然后将这些列信息映射为数据库表,这个方案有如下缺点:
      缺点一:sheet的列名需要特殊处理才行,我们需要在前面增加 []标识,以防止字符不符合表字段要求;
      缺点二:理论上数据库表的列最大数没有excel的大,即在某种极端的情况下,无法容纳所有excel列数据;
      缺点三:在数据库查询上不方便,因为字段都是未知的;
      缺点四:在绑定email模板(email模板是用xlst来做的)上也是个问题,同样也是字段都是未知的;
      缺点五:每次导入数据都需要全部删除数据库中的表,然后重建,这会带来一些不可控的因素。
     
      我同事最终设计了一套表结构,能够非常完善的解决我们所遇到的问题,且结构非常简单。
      
      完美解决方案:
      将每个sheet的数据分解为三部分:
      1:列信息表Column,主要记录列名称
      2:行信息表Row,主要记录行号
      3:数值信息Data,以列坐标以及行坐标能够在sheet上唯一确定一个数据,这里记录数据信息。
     

      数据库表结构图如下:

                                           
      方案分析:
      1:将sheet中的所以列信息分别插入到Column表中,多少列就插入多少行记录,这样就能够无限支持列数据的增加,而不会受到表字段数量的限制。
      2:将行信息,对excel左侧对应的行号数据插入到Row中,有多少行就插入多少。
      3:最后是数据的存储,主要是利用二维坐标定位逻辑来确定数据。

      4:尽管看起来一个sheet的数据分成三个表来存储,但每个表存储的内容都相当简单,逻辑清晰,所以不会带来更大的复杂性问题。

 

       如何将数据库中的数据加载到内存中,我这里构建一个对象,此对象代表excel中的一行数据,如果是sheet所有数据可以用List<SheetData>来表示。ColumnInfo中的Key就是列名称,Value就是某一列的某一行的数据。按照我们的表结构,构建下面的对象模型也是比较容易的。

 

 public  class SheetData
    {
       public List<ColumnInfo> Columns { getset; }
    }
    public class ColumnInfo
    {
        public string  Key{get;set;}
        public string  Value{get;set;}
    }

 

       如何绑定Email模板,既然我们有了明确的对象结构,那么应用xsl语法就更加容易了:

      

<table style="font-size:12;">
          <tr>
            <xsl:for-each select="Email/SheetData/Columns/ColumnInfo">
              <td style="background-color:#FFFF00;width:85px;">
                <xsl:value-of select="Key"/>
              </td >
            </xsl:for-each>
          </tr>
          <tr>
            <xsl:for-each select="Email/SheetData/Columns/ColumnInfo">
              <td>
                <xsl:value-of select="Value"/>
              </td >
            </xsl:for-each>
          </tr>
        </table>


      
      上面的方案解决了之前方案的所有问题,由于存储数据的表结构是可知的,所以在数据库查询以及email模板的绑定上都不会有任何问题。

posted on 2012-08-11 14:57  min.jiang  阅读(9334)  评论(15编辑  收藏  举报