2020年3月6日

MYSQL库内所有表名及表结构获取

摘要: MSSQL表名:SELECT-- 当前自增长字段最大值 --ident_current('TableName'),TableName= D.name ,Impdate=GETDATE() ,lasetDate=null,isrun=0,maxkey=0FROM sysobjects DWHERE D 阅读全文

posted @ 2020-03-06 09:10 zaggu 阅读(982) 评论(0) 推荐(0) 编辑

数据归一化转化

摘要: 一、特征二值化二、特征归一化(一)、总和标准化(二)、标准差标准化(三)、极大值标准化(四)、极差标准化(区间放缩法,0-1标准化)三、连续特征变换四、定性特征哑编码:One-hot编码数据变换数据变换即对数据进行规范化处理,以便于后续的信息挖掘。常见的数据变换包括:特征二值化、特征归一化、连续特征 阅读全文

posted @ 2020-03-06 09:06 zaggu 阅读(721) 评论(0) 推荐(0) 编辑

搭建数据仓库指引

摘要: 技术架构:HADOOP架构数据采集:KETTLE,DATAX数据存储:HDFS、HIVE、MYSQL、POSTGRESQL(GREENPLUM)数据计算:SPARK数据通道:KAFKA任务调度: YARN多维数据:KYLIN数据同步:DATAX,KETTLE分布式协调:ZOOKEEEPER监控:代码 阅读全文

posted @ 2020-03-06 09:00 zaggu 阅读(580) 评论(0) 推荐(0) 编辑

导航

返回顶部