上一页 1 ··· 10 11 12 13 14 15 16 17 18 ··· 28 下一页
摘要: ETL是数据抽取(Extract)、清洗(Cleaning)、转换(Transform)、装载(Load)的过程。是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。 ETL是将业务系统的数据经过抽取、清洗转换之后加载到数 阅读全文
posted @ 2012-02-12 18:06 指尖流淌 阅读(9407) 评论(2) 推荐(2) 编辑
摘要: 创建性模式singleton模式解决的是实体对象个数的问题。除了singleton之外,其他创建性模式都是new耦合所带来的耦合关系。Factoyr Method,Abstrct Factory, Builder都需要一个额外的工厂类来负责实例化“易变对象”,而Prototype则是通过原型(一个特殊的工厂类)来克隆“易变对象”。如果遇到“易变类”,期初的涉及通常从Factory Method开始,当遇到更多的复杂的变化时,在考虑重构其他三种工厂模式(Abstract Factory,Builder,Prototype)。Prototype模式:Singleton模式:Builder模式:Fa 阅读全文
posted @ 2012-02-10 23:16 指尖流淌 阅读(726) 评论(0) 推荐(1) 编辑
摘要: 从发展计算机技术以来,对信息管理技术的不断提出了新的需求,推动数据库技术飞速发展,另一方面,随着数据处理能力的逐步提高、数据分析工具和技术的不断成熟,人们发现对数据库中的数据进行再加工,形成一个综合的、面向分析的环境,能更好的支持决策分析,发挥数据的更大价值。从而逐渐形成了数据仓库(Data warehouse, DW)的的思想,由此数据仓库技术营运而生。 数据仓库就是面向主题的(subject oriented)、集成的(Integrated)、稳定的(nonvolatile)、随时间变化的(Time variant)数据的集合,用以支持经营管理中的决策指定的过程 数据仓库的四个特征和建立. 阅读全文
posted @ 2012-02-06 23:02 指尖流淌 阅读(1166) 评论(0) 推荐(0) 编辑
摘要: 在SQL Server中,非聚集索引其实可以看做是一个含有聚集索引的表,但相比实际的表而言,非聚集索引中所存储的表的列数窄很多,因为非聚集索引仅仅包含原表中非聚集索引的列和指向实际物理表的指针。 并且,对于非聚集索引表来说,其中所存放的的列是按照聚集索引来存放的,所以查找速度要快了很多。但是对于性能的榨取来说,SQL Server总是竭尽所能,假如仅仅是通过索引就可以在B树的叶子节点上获取所需数据,而不再通过叶子节点上的指针去查找实际的物理表,那性能的提升将会更胜一筹。非聚集索引的覆盖 正如前面简洁所说。非聚集索引其实可以看作一个聚集索引表,当这个非聚集索引中包含了查询所需要的所有信息时,则. 阅读全文
posted @ 2012-02-05 20:59 指尖流淌 阅读(742) 评论(0) 推荐(0) 编辑
摘要: 在SQL Server中,索引是一种增强式的存在,这意味着,即使没有索引,SQL Server仍然可以实现应有的功能。但索引可以在大多数情况下大大提升查询性能高。在OLAP中尤其明显,要完全理解索引的概念,需要了解大量原理性的知识,包括B树,堆,数据库页,区,填充因子,碎片,文件组等等一系列相关知识。 索引时对数据库中表中一列和多列的值进行排序的一种结构,使用索引可以快速访问数据表中特定的信息。 精简来说,索引时一种结构,在SQL Server中,索引和表(这里值得是加了聚集索引的表)的存储结构是一样的,都是B树,B树是一种用于查找平衡多叉树,理解B树的概念如下图: 理解为什么使用B树作为索. 阅读全文
posted @ 2012-02-03 17:03 指尖流淌 阅读(8412) 评论(6) 推荐(1) 编辑
摘要: 最近遇到一个情况,需要在内网系统中出一个统计报表。需要根据不同条件使用多个group by语句,需要将所有聚合的数据进行union操作来完成不同维度的统计查看。 知道发现了在SQL Server 2008之后引入了grouping sets这个对于group by的增强后,上面的需求实现起来就简单的多,下面我们用AdventureWork中的表作为demo来解释一下grouping sets. 假设我现在需要两个维度查询我的销售额度,查询T-SQL如下:而使用SQL Server 2008之后新增的grouping sets语句,仅仅需要这样写:值得注意的是,虽然上面使用grouping s. 阅读全文
posted @ 2012-02-02 13:54 指尖流淌 阅读(989) 评论(0) 推荐(0) 编辑
摘要: 对于Select查询语句来说,通常情况下,为了是T-SQL代码更加简洁和刻度,在一个查询中应用另外的结果集都是通过视图而不是查询进行分解的,但是,视图作为系统对象存储在数据库中,那对于结果集仅仅需要在存储过程或是用户自定义函数中使用一次的时候,使用视图就显得有限奢侈了。 公用表达式(Common Table Expression)是SQL Server2005版本之后引入的一个特性,.CTE可以看做是一个临时的结果集,可以再接下来的select,insert,update,delete,merge语句中被多次使用,使用公用表达式可以让语句更加清晰简练。 初次之外,根据微软对CTE好处的描述,. 阅读全文
posted @ 2012-02-02 13:31 指尖流淌 阅读(758) 评论(0) 推荐(0) 编辑
摘要: 视图可以看做定义在SQL Server上的虚拟表,视图正如其名字的含义一样,是另一种查看数据的入口,常规视图本身并不存储实际的数据,而仅仅存储一个select语句和所涉及的表的关系。 通过视图,客户端不再需要知道底层table的表结构及其之间的关系,视图提供了一个统一访问的数据的接口。视图的优点 1、视图隐藏了底层的表的结构,简化了数据访问的操作 2、因为隐藏了底层的表结构,所以大大加强了安全性,用户只能看到视图提供的数据 3、使用了视图,方便了权限管理,让用户对视图的权限而不是度底层表的权限进一步加强了安全性4、提供了一个用户访问的接口,当底层表改变后,改变视图语句来进行适应,使已经建立在. 阅读全文
posted @ 2012-02-01 18:26 指尖流淌 阅读(2166) 评论(0) 推荐(1) 编辑
摘要: 在关系数据库中,我们对于查询的思考是面向集合的,而游标打破了这一规则,游标使得我们思考方式变为逐行进行。 正常面向集合的思维方式是:而对于游标来说:这也是为什么游标是邪恶的,它会使开发人员变懒,懒得去想面向集合的查询方式实现某些功能。同样的,在性能上,游标会吃更多的内存,减少可用的并发,占用宽带,锁定资源,当然还有更多的代码量....从游标对数据库的读取方式来说,不难看出游标为什么占有更多资源了,打个比方:当你从ATM取钱的时候,是一次去1000效率更高呢,还是取10次100?游标的好处:1、现存系统有一些游标,我们查询必须通过游标来实现2、作为一个备用方式,当我们穷尽了while循环,子查. 阅读全文
posted @ 2012-02-01 15:19 指尖流淌 阅读(1351) 评论(0) 推荐(0) 编辑
摘要: 关系数据库的起源起源于数学中的集合概念,所以集合和集合之间,也同样继承了数学集合之间的运算,而对于在关系数据库中,常常用于两个数据库中并没有直接的关系数据库的”关系“,比如外键,但两个数据集会有间接的关系,比如两届比赛,参加比赛人员集合之间会有间接的关系。 在T-SQL中,关系运算实际上可以分为四类,首先看我们举例子用的表:这里的例子表分别为两个不同会以参加的人员记录,分别为Meeting1和Meeting2如下:关系运算的具体可以分为以下四类:1.A∩B,既是所求数据集既在A中,又在B中 在实例表中,实际的例子为即参加第一个会以,有参加第二个会以人的集合,如下图:2.A∪B,既所求数据在数. 阅读全文
posted @ 2012-01-31 17:47 指尖流淌 阅读(780) 评论(0) 推荐(1) 编辑
上一页 1 ··· 10 11 12 13 14 15 16 17 18 ··· 28 下一页