“无限极”分类数据表设计的简单再总结

前言：项目中又要用到一个四级分类数据表，之前我曾经在这方面按步就班玩过不少CRUD的操作，感觉工作内容有不少重复，有必要再总结一下，对新手可能会有点帮助，同时以备自己日后再用。

1、数据表设计

开门见山，Category表设计如下：

数据表字段简单说明：

列名	数据类型	默认值	备注
Id	int		自增主键
Name	varchar(256)		分类类别名称
ParentId	int	0	父母分类Id
Depth	int	1	深度，从1递增
Status	int	0	状态：0禁用，1启用
Priority	int	0	优先级，越大，同级显示的时候越靠前

说明：在设计实现这个数据表之前，我搜索参考并比较了一下其他无限层级设计方案，比如这一篇和这一篇，虽然本文最终使用了最常见的层级设计而没有采纳另外的几种方法，但是不可否认它们对开阔设计思路是很有启发的。

2、简单查询

（1）通常，在实际应用中简单查询某一级别可用（Status等于1）的分类非常简单：

SELECT [Id]
      ,[Name]
      ,[ParentId]
      ,[Depth]
      ,[Status]
      ,[Priority]
  FROM [Category](NOLOCK)
  WHERE Status=1 AND Depth=n --n>=1

最后按照优先级（Priority）字段逆序即可。

（2）当需要按照某一个Id查找它及它的所有子级或者父级成员，避开递归，直接写sql查询会比较难以下手，而且Sql Server2005之前的版本还需要用到临时表，处理起来不是那么直观。自从Sql Server2005/2008横空出世，利用With语句可用非常轻松地写出查询，下面贴两个开发中经常用到的查询存储过程（Sql Server2005/2008支持）：

a、按照某一个Id查询它及它的所有子级成员存储过程

CREATE PROCEDURE [dbo].[sp_GetChildCategories] (@Id int)
AS
BEGIN
WITH Record AS(
	SELECT
	Id,
	Name,
	ParentId,
	Depth,
	Status,
	Priority
FROM
    Category(NOLOCK)
    WHERE Id=@Id
    UNION ALL
    	SELECT
	a.Id Id,
	a.Name Name,
	a.ParentId ParentId,
	a.Depth Depth,
	a.Status Status,
	a.Priority Priority
FROM
    Category(NOLOCK) a JOIN Record b
    ON a.ParentId=b.Id
)

SELECT
	Id,
	Name,
	ParentId,
	Depth,
	Status,
	Priority
FROM
	Record
	WHERE Status=1
	ORDER BY Priority DESC
	
END

b、按照某一个Id查询它及它的所有父级成员存储过程

CREATE PROCEDURE [dbo].[sp_GetParentCategories] (@Id int)
AS
BEGIN
WITH Record AS(
	SELECT
	Id,
	Name,
	ParentId,
	Depth,
	Status,
	Priority
FROM
    Category(NOLOCK)
    WHERE Id=@Id
    UNION ALL
    SELECT
	a.Id Id,
	a.Name Name,
	a.ParentId ParentId,
	a.Depth Depth,
	a.Status Status,
	a.Priority Priority
FROM
    Category(NOLOCK) a JOIN Record b
    ON a.Id=b.ParentId
)

SELECT
	Id,
	Name,
	ParentId,
	Depth,
	Status,
	Priority
FROM
	Record
	WHERE Status=1
	ORDER BY Priority DESC
	
END

分析上面两个存储过程，实际上，您也可以提取出下面的两段sql语句直接代替上面的查询存储过程：

c、按照某一个Id查询它及它的所有子级成员sql语句

WITH Record AS(
	SELECT
	Id,
	Name,
	ParentId,
	Depth,
	Status,
	Priority
FROM
    Category(NOLOCK)
    WHERE Id=@Id  --@Id是外部传入的参数
    UNION ALL
    SELECT
	a.Id Id,
	a.Name Name,
	a.ParentId ParentId,
	a.Depth Depth,
	a.Status Status,
	a.Priority Priority
FROM
    Category(NOLOCK) a JOIN Record b
    ON a.ParentId=b.Id
)

SELECT
	Id,
	Name,
	ParentId,
	Depth,
	Status,
	Priority
FROM
	Record
	WHERE Status=1
	ORDER BY Priority DESC

d、按照某一个Id查询它及它的所有父级成员sql语句

WITH Record AS(
	SELECT
	Id,
	Name,
	ParentId,
	Depth,
	Status,
	Priority
FROM
    Category(NOLOCK)
    WHERE Id=@Id  --@Id是外部传入的参数
    UNION ALL
    SELECT
	a.Id Id,
	a.Name Name,
	a.ParentId ParentId,
	a.Depth Depth,
	a.Status Status,
	a.Priority Priority
FROM
    Category(NOLOCK) a JOIN Record b
    ON a.Id=b.ParentId --匹配关系
)

SELECT
	Id,
	Name,
	ParentId,
	Depth,
	Status,
	Priority
FROM
	Record
	WHERE Status=1
	ORDER BY Priority DESC

参数@Id毫无疑问，是你需要在外部程序里传入的参数。选择存储过程或者直接使用sql语句看自己的喜好（个人倾向于写sql语句）。

3、项目实践经验之谈

在实际项目中，对于分类表，通常都会做相应的缓存（这种类型的数据通常说多也不多，说少也不少，但是相对比较稳定），总结一下我在web项目中的使用经验（经验之谈，请务必小心甄别取舍）：

（1）、一次性取出数据库中所有可用分类类别数据；

（2）、数据（Category表数据）转换成对应实体Category；

a、Category实体类

using System;

/// <summary>
/// 分类实体
/// </summary>
[Serializable]
public class Category : BaseCategory//继承自BaseCategory
{
    public int Id { get; set; }

    public string Name { get; set; }

    public int ParentId { get; set; }

    public int Depth { get; set; }

    public int Status { get; set; }

    public int Priority { get; set; }

}

我们看到，Category实体继承自BaseCategory类，这个类我们定义如下：

public abstract class BaseCategory : DotNet.Common.Model.PagerBase //PagerBase 分页基类
{
    /// <summary>
    /// 一级分类id
    /// </summary>
    public int FirstCategoryId { get; set; }
    /// <summary>
    /// 一级分类名
    /// </summary>
    public string FirstCategoryName { get; set; }

    /// <summary>
    /// 二级分类id
    /// </summary>
    public int SecondCategoryId { get; set; }
    /// <summary>
    /// 二级分类名
    /// </summary>
    public string SecondCategoryName { get; set; }

    /// <summary>
    /// 三级分类id
    /// </summary>
    public int ThirdCategoryId { get; set; }
    /// <summary>
    /// 三级分类名
    /// </summary>
    public string ThirdCategoryName { get; set; }

    /// <summary>
    /// 四级分类id
    /// </summary>
    public int ForthCategoryId { get; set; }
    /// <summary>
    /// 四级分类名
    /// </summary>
    public string ForthCategoryName { get; set; }
}

b、接着通过一定的方法或函数，对Category实体类再做一些处理，完善它的层级关系。比如通过递归函数，初始化一次，准备好这些有层级的数据实体：

    /// <summary>
    /// 分类实用帮助类
    /// </summary>
    public class CategoryUtil
    {
        /// <summary>
        /// 分层级的数据实体字典 key： Id  value：分类实体
        /// </summary>
        public static IDictionary<int, Category> DictCategories { get; set; }

        static CategoryUtil()
        {
            Init();
        }

        /// <summary>
        /// 根据品类类别构造一个适合查找的dictionary(1～4级品类ID和对应名称)
        /// </summary>
        private static void Init()
        {
            //DictProductTypes=//查库，一次取出所有可用分类数据 to do
            foreach (KeyValuePair<int, Category> kv in DictCategories)
            {
                Category model = kv.Value;
                switch (model.Depth)
                {
                    default:
                        break;
                    case 1:
                        model.FirstCategoryId = model.Id;
                        model.FirstCategoryName = model.Name;
                        break;
                    case 2:
                        model.SecondCategoryId = model.Id;
                        model.SecondCategoryName = model.Name;
                        break;
                    case 3:
                        model.ThirdCategoryId = model.Id;
                        model.ThirdCategoryName = model.Name;
                        break;
                    case 4:
                        model.ForthCategoryId = model.Id;
                        model.ForthCategoryName = model.Name;
                        break;

                }
                InitCascadeCategory(model, model.ParentId, model.Depth);
            }
        }

        /// <summary>
        /// 初始化层级
        /// </summary>
        /// <param name="query"></param>
        /// <param name="parentId"></param>
        /// <param name="depth"></param>
        private static void InitCascadeCategory(Category query, int parentId, int depth)
        {
            if (depth < 2)
            {
                return;
            }
            foreach (KeyValuePair<int, Category> kv in DictCategories)
            {
                Category model = kv.Value;
                if (parentId == model.Id && model.Depth == depth - 1)
                {
                    switch (depth)
                    {
                        default:
                            break;
                        case 2:
                            query.FirstCategoryId = model.Id;
                            query.FirstCategoryName = model.Name;
                            break;
                        case 3:
                            query.SecondCategoryId = model.Id;
                            query.SecondCategoryName = model.Name;
                            break;
                        case 4:
                            query.ThirdCategoryId = model.Id;
                            query.ThirdCategoryName = model.Name;
                            break;
                    }
                    InitCascadeCategory(query, model.ParentId, --depth);//递归
                    break;
                }
            }
        }
    
    }

然后进行第（3）步，进行缓存。

需要特别说明的是，BaseCategory类我们只多设计了8个属性，四个层级（目前为止开发中超过四个层级的我还没有遇到过），当然你可能会问，如果超过4个层级怎么办？曾经看到过有一种通用设计的思路，就是通过一个集合对象（或嵌套的集合对象）进行层级类别的存取，比如泛型Dictionary，LinkedList等等，我还没有尝试实现过，但是设计实现思路确实可以借鉴。

（3）、按照某种策略缓存数据，如每天或者每个月更新一次数据，等等。

（4）、直接查询操作缓存中的分类数据。

4、思考

（1）、数据表中Depth字段是不是必要的，是否多余？

（2）、查询时如何避免递归？

（3）、层级过多（比如超过20层级），有没有更好的设计和解决方法？

… … … …

越想越感到问题多多，期待您的建议和意见。

===============================分割线分割线==============================

update：根据心海巨澜在本文下面的留言，个人感觉是一个非常不错的解决方案，同时想到了一个和它关联紧密的附加问题。举例来说，一个产品表Product，假设产品信息基本字段包括自增长主键Id，产品名称Name，价格Price，生产日期CreateDate，还有就是产品所对应的分类信息，这个分类信息到底应该如何设计才能快速查询出某一分类下的产品（该分类及其子级分类所对应的所有产品），而且利于后台进行修改维护不至于轻易产生“脏”数据？我个人的经验是直接在数据表Product上面设置几个字段，如FirstCategoryId…ForthCategoryId等等，它们具体什么意思看名称就可以猜到了吧？！简单来说，就是适当冗余，查询非常直接，而且利于创建索引，不知您是怎么看待这个问题的。

数据表脚本下载：Category表

posted on 2010-10-26 21:12 JeffWong 阅读(29390) 评论(24) 收藏举报