Hadoop develop

博学笃志,切问近思,此八字,是收放心的工夫。 神闲气静,智深勇沉,此八字,是干大事的本领。

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::
上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 19 下一页

2015年3月31日

摘要: 四步过程维度建模由Kimball提出,可以做为业务梳理、数据梳理后进行多维数据模型设计的指导流程,但是不能作为数据仓库系统建设的指导流程。本文就相关流程及核心问题进行解读。 阅读全文
posted @ 2015-03-31 16:30 张子良 阅读(8098) 评论(0) 推荐(0) 编辑

摘要: 数据仓库生命周期模型 阅读全文
posted @ 2015-03-31 11:21 张子良 阅读(3195) 评论(0) 推荐(0) 编辑

2015年1月20日

摘要: 唯一索引、非唯索引、主键索引、聚集索引。 阅读全文
posted @ 2015-01-20 21:46 张子良 阅读(1216) 评论(0) 推荐(0) 编辑

摘要: 一、引言 最近在梳理大数据模式下的数据仓库数据模型,花了点时间,系统的回顾一下传统数据仓库数据模型设计的理论,作为笔记分享给大家,很多资料来自互联网和读过的数据仓库理论和实践相关的熟悉,无剽窃之心,共勉吧。二、3NF(1)1NF-无重复的列 数据库表的每一列都是不可分割的基本数据项,同一列中不能... 阅读全文
posted @ 2015-01-20 11:01 张子良 阅读(5529) 评论(3) 推荐(1) 编辑

摘要: 事实星座模式是数据仓库最长使用的数据模式,尤其是企业级数据仓库(EDW)。这也是数据仓库区别于数据集市的一个典型的特征,从根本上而言,数据仓库数据模型的模式更多是为了避免冗余和数据复用,套用现成的模式,是设计数据仓库最合理的选择。当然大数据技术体系下,数据仓库数据模型的设计,还是一个盲点,探索中。 阅读全文
posted @ 2015-01-20 09:34 张子良 阅读(28672) 评论(4) 推荐(2) 编辑

2015年1月12日

摘要: 银行业:IBM有BDWM(Banking Data Warehouse Model);Teradata有FS-LDM(Financial Services Logical Data Model)。   电信业:IBM有TDWM(Telecom Data Warehouse Model);Teradata有TS-LDM(Telecom Services Logical Data Model)。   Teradata FS-LDM7.0是一个成熟产品,在一个集成的模型内支持保险、银行及证券,包含十大主题:当事人、产品、协议、事件、资产、财务、机构、地域、营销、渠道。 阅读全文
posted @ 2015-01-12 10:35 张子良 阅读(3804) 评论(1) 推荐(3) 编辑

2014年11月4日

摘要: 信用评级的定义是评级公司制定评级方法和评级标准的基础。不同的信用评级产品评价什么、主要采用什么样的量化指标来量度、这些量化指标的定义是什么,是评 级机构必须首先明确的问题,也正是评级定义内容。本文首先梳理了评级工作中常用的专业术语,并对中债资信对各种信用评级产品评价什么做出了具体的定义。 阅读全文
posted @ 2014-11-04 10:23 张子良 阅读(547) 评论(0) 推荐(0) 编辑

2014年9月28日

摘要: 每每提到数据挖掘,总有些人上来就是ETL、是算法、是数学模型,作为搞工程实施的我而言,很是头疼。其实作为数据挖掘的而言,算法只是其实现手段、是工具和实现手段而已,我们不是在创造算法(国外职业搞研究的除外),我们是在使用算法而已,换句话说我们是算法的工程化实践者。数据挖掘非今日之物,大数据挖掘也不是一个孤立的概念,其实质还是采用传统的数据挖掘的方法,只是其实现工具发生了变化而已,本质的东西还在。引入发布近20年前的CRISP-DM数据挖掘标准规范模型,供大家共享,希望能有人喜欢。 阅读全文
posted @ 2014-09-28 11:08 张子良 阅读(1946) 评论(0) 推荐(1) 编辑

2014年9月21日

摘要: 一、前言 最近一年了吧,总是忙于特定项目的业务分析和顶层设计,很少花时间和精力放到具体的技术细节,感觉除了架构理念和分析能力的提升,在具体技术层次却并没有多大的进步。因为一些原因,总被人问及一些技术细节,很多细节都模糊了,花点时间,温习一下吧。技术部分将作为下一个阶段的工作重点。 二、操作说明查看Z... 阅读全文
posted @ 2014-09-21 11:01 张子良 阅读(2390) 评论(0) 推荐(0) 编辑

2014年9月9日

摘要: 与数据挖掘有关或者有帮助的R包和函数的集合。1、聚类常用的包: fpc,cluster,pvclust,mclust基于划分的方法: kmeans, pam, pamk, clara基于层次的方法: hclust, pvclust, agnes, diana基于模型的方法: mclust基于密度的方... 阅读全文
posted @ 2014-09-09 22:58 张子良 阅读(515) 评论(0) 推荐(0) 编辑

上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 19 下一页