摘要: 公共维度汇总层 (DIM) CREATE TABLE IF NOT EXISTS cdm_dim_marketchannel ( subjectId VARCHAR(255) COMMENT '渠道ID', label VARCHAR(255) COMMENT '渠道', brand VARCHAR 阅读全文
posted @ 2022-07-06 11:14 数学男 阅读(34) 评论(0) 推荐(0) 编辑
摘要: 1.报表制作完成后,预览时自动显示查询内容,在控件处设置: 2.求一列数据的最小值(除去0),并对最小值字体加粗标绿,需要对对应单元格设置条件属性,并插入公式:C6 = min(greparray(C6[!0;!0]{B6 = $B6}, item != null && item != 0)) 3. 阅读全文
posted @ 2019-07-18 13:13 数学男 阅读(601) 评论(0) 推荐(0) 编辑
摘要: 用处:将大容量的EXCEL工作簿分解成若干个小的工作簿 阅读全文
posted @ 2017-08-02 15:38 数学男 阅读(1110) 评论(0) 推荐(0) 编辑
摘要: 最近忙着找工作,拉勾网、智联各种简历网站海投,奈何接到的面试电话不是很多,去面试了两家也不尽人意。索性在家做了一个北京市数据分析岗位的分析报告。保佑我找到一份心仪的工作,阿门。 一、到某网站去爬数据,使用软件:八爪鱼(真的好用,一般人我不告诉他)。采集到的数据集如下: 二、对文本进行预处理,使用软件 阅读全文
posted @ 2017-02-16 22:21 数学男 阅读(552) 评论(0) 推荐(0) 编辑
摘要: 查找和选择:定位条件(定位空值、错误值) 选择性粘贴 阅读全文
posted @ 2017-02-14 10:52 数学男 阅读(430) 评论(0) 推荐(0) 编辑
摘要: MEANS过程 MEAN过程默认输出的统计量有:观测总数、均值、标准差、最大值和最小值。如果要计算其他统计量或其中的某一些统计量,则可在PROC语句中指定统计量的关键字。 BY语句规定了分组变量,要求在BY分组内计算描述性统计量 。 UNIVARIATE过程 UNIVARIATE过程也可以提供描述统 阅读全文
posted @ 2017-02-11 22:17 数学男 阅读(2486) 评论(0) 推荐(0) 编辑
摘要: 最近在做答辩,每天做一点,记录在博客里,权当是知识的回顾。 题目要求: 根据以往的电话营销的数据,对用户进行分析,提取有价值的信息,并预测是否响应电话营销。 包含两份数据集 1.bank-additional-full.csv,包含所有数据集,并按日期进行排序,从2008年5月到2010年11月。 阅读全文
posted @ 2017-01-28 21:49 数学男 阅读(2177) 评论(1) 推荐(0) 编辑
摘要: 定义目标变量:三年还是三个月购买车险?(需要与客户沟通)哪些因素可能导致Y得发生,例如历史购买行为、年龄、收入? 数据收集及整理 保证所有变量在将来模型应用中都有。 整理所有数据,形成宽表。 原始变量生成一些新的变量。 理解目标变量与解释变量之间的关系(对分类型变量及字符型变量的处理) 待补充 模型 阅读全文
posted @ 2017-01-05 16:58 数学男 阅读(469) 评论(0) 推荐(0) 编辑
摘要: 决策树是什么 决策树是什么 决策树是基于树结构来进行决策,这恰是人类在面临决策问题时一种很自然的处理机制。例如,我们要对“这是好瓜吗?”这样的问题进行决策时,通常会进行一系列的判断或“子决策”:我们先看“它是什么颜色?”,如果是“青绿色”,则我们再看“它的根蒂是什么形态?”,如果是“蜷缩”,我们再判 阅读全文
posted @ 2016-12-26 22:09 数学男 阅读(56776) 评论(20) 推荐(0) 编辑
摘要: 一.支持向量机的学习方法 二.线性可分支持向量机 学习的目标是在特征空间中找到一个分离超平面,能将实例分到不同的分类。分离超平面的对应的方程,它由法向量和截距b决定,分离超平面将特征空间划分为两部分,一部分为正类,一部分为负类。法向量指向的一侧为正类,另一侧为负类。 函数间隔 函数间隔 一般来说,一 阅读全文
posted @ 2016-12-19 22:09 数学男 阅读(552) 评论(0) 推荐(0) 编辑