上一页 1 ··· 10 11 12 13 14 15 16 17 18 ··· 28 下一页
摘要: 数据重塑通常使用reshape2包,reshape2包用于实现对宽数据及长数据之间的相互转换,由于reshape2包不在R的默认安装包列表中,在第一次使用之前,需要安装和引用: install.packages("reshape2") library(reshape2) 重塑数据,首先把宽数据融合( 阅读全文
posted @ 2018-07-18 11:15 悦光阴 阅读(13065) 评论(0) 推荐(0) 编辑
摘要: PowerBI的查询编辑器使用Power Query M公式语言来定义查询模型,它是一种富有表现力的数据糅合(Mashup)语言,一个M查询可以计算(Evalute)一个表达式,得到一个值。 对于开发者来说,M公式常用于Power Query编辑器中,用于添加计算列,并对数据进行处理。开发者只需要知 阅读全文
posted @ 2018-07-10 13:29 悦光阴 阅读(8370) 评论(0) 推荐(0) 编辑
摘要: PowerBI 将要解锁增量刷新(Incremental refresh)功能,这是一个令人期待的更新,使得PowerBI可以加载大数据集,并能减少数据的刷新时间和资源消耗,该功能目前处于预览状态,只对 Power BI Premium 版本开放预览。 增量刷新只是加快了数据集刷新的速度,对于具有潜 阅读全文
posted @ 2018-07-04 12:53 悦光阴 阅读(10608) 评论(2) 推荐(1) 编辑
摘要: 钻取是指沿着层次结构(维度的层次)查看数据,钻取可以变换分析数据的粒度。钻取分为下钻(Drill-down)和上钻(Drill-up),上钻是沿着数据的维度结构向上聚合数据,在更大的粒度上查看数据的统计信息,而下钻是沿着数据的维度向下,在更小的粒度上查看更详细的数据。举个例子,当前的粒度是月份,按照 阅读全文
posted @ 2018-06-30 12:11 悦光阴 阅读(16977) 评论(0) 推荐(1) 编辑
摘要: 通常情况下,ETL方案需要同时访问两个或多个数据源,并把结果合并为单个数据流,输出到目标表中。为了向目标表中提供统一的数据结构,需要把多个数据源连接在一起。数据连接的另外一种用法,就是根据现有的数据,向目标表中添加数据,或者更新现有的数据。这种方案是把源数据与现有的数据进行比较,以便找到需要更新的数 阅读全文
posted @ 2018-06-05 17:13 悦光阴 阅读(2212) 评论(0) 推荐(3) 编辑
摘要: SSIS内置的调试工具是非常完备的,对于数据流的调试,主要是设置断点和查看变量值,这是在Package的设计阶段可以使用的工具,在Package部署到服务器之后,用户还可以使用事件处理程序以实现Package出错的自我修复,使用日志记录等来监控Package的运行状态,以记录Package出现故障时 阅读全文
posted @ 2018-05-23 17:11 悦光阴 阅读(3202) 评论(2) 推荐(3) 编辑
摘要: 本文介绍的日志不是事务日志,而是SQL Server 日志和代理的错误日志,按照主体把错误日志分为SQL Server、SQL Server Agent、Database Mail,以及 Windows NT。SQL Server使用日志记录数据库引擎启动和运行过程中产生的信息,这些信息不一定是“错 阅读全文
posted @ 2018-05-22 11:42 悦光阴 阅读(11170) 评论(2) 推荐(2) 编辑
摘要: SSIS的检查点(Checkpoint)实际上是一个用于保存Task组件的状态的文件,它记录控制流中Task组件的执行状态和变量的值。用户通过合理地配置Checkpoint,在Package运行出错之后,重新执行Package,可以跳过上一次已经成功执行的步骤,而直接从失败的地方重新执行,这就意味着 阅读全文
posted @ 2018-05-18 17:47 悦光阴 阅读(1846) 评论(2) 推荐(2) 编辑
摘要: 逻辑类型是最常用的数据类型之一,一般编程语言,例如,C#、Java和R等都支持布尔类型,用于表示逻辑真(true)和假(false),然而,SQL Server没有纯的布尔类型,但是,在编程时,可以使用bit 类型来代替逻辑类型,bit类型只有两个有效值:0 和 1。在设计数据表架构时,使用0代表逻 阅读全文
posted @ 2018-05-17 07:49 悦光阴 阅读(1053) 评论(4) 推荐(3) 编辑
摘要: 数据库是数据的仓库,用于存储数据,而存储数据需要媒介,现在的存储媒介,最常用的是硬盘,土豪一点的服务器使用固态硬盘(SSD),特殊用途的服务器使用内存。数据库最常用的存储文件是数据文件和日志文件,数据文件用于存储数据,由一个主数据文件(.mdf)和若干个辅助数据文件(.ndf)构成;日志文件用于存储 阅读全文
posted @ 2018-05-16 10:39 悦光阴 阅读(7131) 评论(6) 推荐(5) 编辑
摘要: 因子(factor)是R语言中比较特殊的一个数据类型, 它是一个用于存储类别的类型,举个例子,从性别上,可以把人分为:男人和女人,从年龄上划分,又可以把人分为:未成年人(<18岁),成年人(>=18)。R把表示分类的数据称为因子,因子的行为有时像字符串,有时像整数。因子是一个向量,通常情况下,每个元 阅读全文
posted @ 2018-05-14 13:15 悦光阴 阅读(30482) 评论(2) 推荐(2) 编辑
摘要: R语言的基础包中提供了三种基本类型用于处理日期和时间,Date用于处理日期,它不包括时间和时区信息;POSIXct/POSIXlt用于处理日期和时间,其中包括了日期、时间和时区信息。R内部在存储日期和时间时,使用不同的方式: Date类:存储了从1970年1月1日以来开始计算的天数,更早的日期表示为 阅读全文
posted @ 2018-05-09 07:43 悦光阴 阅读(43242) 评论(1) 推荐(6) 编辑
摘要: 运算符是R语言中最基础的存在,熟悉运算符的使用,是熟练使用R处理数据的基础,操作符,顾名思义,是对数据进行运算的符号,R有自己的一套操作符,实现变量的赋值,引用,运算等功能。 一,赋值符号 为变量赋值,推荐使用 var <- expression, 把var设置为expression的值,该赋值符号 阅读全文
posted @ 2018-05-08 07:58 悦光阴 阅读(4185) 评论(0) 推荐(3) 编辑
摘要: 在绘图时,有时候会遇到这样一种情景,客户想把多个代表不同KPI的图形分布到同一个画布(Page)上,而且每一个图形都是单独绘制的。对于这种需求,可以使用gridExtra包来实现,gridExtra包能把图形逐个地添加到画布中,并按照业务的需求,把图形摆放到合适的位置上去。在布局完成之后,把图形绘制 阅读全文
posted @ 2018-05-07 07:05 悦光阴 阅读(15414) 评论(1) 推荐(3) 编辑
摘要: 文本表是显示数据的重要图形,一个文本表按照区域划分为:列标题,行标题,数据区,美学特征有:前景样式、背景样式、字体、网格线等。由于报表上需要呈现文本表,我想到用R,R的绘图功能很强大,我本来以为绘制文本表应该是一件非常简单的事。可是,在搜索Google之后,我发现使用GridExtra绘制一个文本表 阅读全文
posted @ 2018-05-05 15:50 悦光阴 阅读(10402) 评论(1) 推荐(2) 编辑
摘要: R是一种专门用于数据分析和统计的脚本语言,广泛应用在每一个需要统计和数据分析的领域。PowerBI支持R脚本,两者强强结合,使PowerBI的功能更加强大。PowerBI Desktop默认没有安装R,在使用R脚本之前,必须向PowerBI Desktop中安装R引擎。用户可以使用R脚本加载数据、对 阅读全文
posted @ 2018-05-03 15:41 悦光阴 阅读(4569) 评论(2) 推荐(2) 编辑
摘要: 在PowerBI的查询编辑器(Query Editor)中,用户可以使用M语言修改Query,或修改Query字段的类型,或向Query中添加数据列(Column),对Query进行修改会导致PowerBI相应地更新数据模型(Data Model),这跟使用DAX表达式修改Data Model有本质 阅读全文
posted @ 2018-04-24 11:21 悦光阴 阅读(8478) 评论(0) 推荐(5) 编辑
摘要: PowerBI版本在持续的更新,这使得报表设计能够实现更多新的功能,您可以访问 PowerBI Blog查看PowerBI的最新更新信息,本文总结了PowerBI新版本的重要更新和设计技巧。 我的PowerBI开发系列的文章目录:PowerBI开发 一,同步切片 开发人员在设计报表时,根据分析的需要 阅读全文
posted @ 2018-04-23 13:59 悦光阴 阅读(4057) 评论(0) 推荐(4) 编辑
摘要: 概率论是人们在长期实践中发现的理论,是客观存在的。自然界和社会上发生的现象是多种多样的,有一类现象,在一定条件下必然发生,称作确定性现象,而概率论研究的现象是不确定性现象,嗯嗯,醒醒,概率论研究的对象是随机现象。那什么是随机现象呢?在个别试验中呈现出不确定性,而在大量重复实验中呈现出固有规律性的现象 阅读全文
posted @ 2018-04-11 17:30 悦光阴 阅读(1958) 评论(0) 推荐(2) 编辑
摘要: 在数据分析中,整理数据的本质可以归纳为:对数据进行分割(Split),然后应用(Apply)某些处理函数,最后将结果重新组合(Combine)成所需的格式返回,简单描述为:Split - Apply - Combine,各个步骤的作用是: Split:把要处理的数据分割成小片断,常用的函数是spli 阅读全文
posted @ 2018-04-10 17:19 悦光阴 阅读(6108) 评论(0) 推荐(2) 编辑
上一页 1 ··· 10 11 12 13 14 15 16 17 18 ··· 28 下一页