随笔分类 -  BI

摘要:解决的问题 在WIN10环境下,安装并正常运行Superset 建议使用Python虚拟环境,减少库依赖冲突 不需要安装VC啦! 注意 本教程安装的版本是1.5 Superset在2022年7月发布了2.0的大版本更新 如python的版本要求变为3.9+,同时增加了更多的库依赖等 以下教程未为对2 阅读全文
posted @ 2023-03-18 11:54 DB乐之者 阅读(769) 评论(0) 推荐(0) 编辑
摘要:一、指标意义 描述现状:能将数据表现,还原成实际场景。 分析原因:能把导致现状的根本原因找出来。 预测未来:能根据现有的信息,对未来做出一个判断。 改善未来:能明确的定位出一些人,驱动他们去做一些事,让现状一步步走向理想状况。 二、判断是否存在问题的方法:指标监控的“一量三比” 在此,好好介绍2种常 阅读全文
posted @ 2023-01-29 20:30 DB乐之者 阅读(440) 评论(0) 推荐(0) 编辑
摘要:安装过程 新建虚拟环境:conda create -n superset python=3.7 激活虚拟环境:conda activate superset -安装superset:pip install apache-superset -i [https://pypi.douban.com/sim 阅读全文
posted @ 2023-01-12 18:06 DB乐之者 阅读(327) 评论(0) 推荐(0) 编辑
摘要:一、数据仓库的相关概念 1.什么是数据仓库 数据仓库一种面向分析的环境,是一种把相关的各种数据转换成有商业价值的信息的技术。 数据仓库理论的创始人W.H.Inmon在其《Building the Data Warehouse》一书中,给出了数据仓库的四个基本特征:面向主题,数据是集成的,数据是不可更 阅读全文
posted @ 2020-03-03 13:02 DB乐之者 阅读(3476) 评论(0) 推荐(0) 编辑
摘要:优化Cube 层次结构 理论上,对于N维,你最终会得到2 ^ N维组合。但是对于某些维度组,不需要创建这么多组合。例如,如果您有三个维度:洲,国家,城市(在层次结构中,“更大”维度首先出现)。在深入分析时,您只需要以下三种组合组合: 按大陆分组 按大陆,国家分组 按大陆,国家,城市分组 在这种情况下 阅读全文
posted @ 2019-01-11 15:33 DB乐之者 阅读(1887) 评论(0) 推荐(2) 编辑
摘要:本篇文章就概念、工作机制、数据备份、优势与不足4个方面详细介绍了Apache Kylin。 Apache Kylin 简介 1. Apache kylin 是一个开源的海量数据分布式预处理引擎。它通过 ANSI-SQL 接口,提供基于 hadoop 的超大数据集(TB-PB 级)的多维分析(OLAP 阅读全文
posted @ 2018-12-17 11:47 DB乐之者 阅读(2921) 评论(0) 推荐(1) 编辑
摘要:前言 本文将会讲述 BI/DW/DA 领域的一些常见概念,如:事实表、维度表、建模、多维分析、cube 等,但不涉及具体实例分析。 1、维(Dimension) 维是用于从不同角度描述事物特征的,一般维都会有多层(Level:级别),每个Level都会包含一些共有的或特有的属性(Attribute) 阅读全文
posted @ 2018-07-30 12:01 DB乐之者 阅读(765) 评论(0) 推荐(1) 编辑
摘要:背景 目前对于时序大数据的存储和处理往往采用关系型数据库的方式进行处理,但由于关系型数据库天生的劣势导致其无法进行高效的存储和数据的查询。时序大数据解决方案通过使用特殊的存储方式,使得时序大数据可以高效存储和快速处理海量时序大数据,是解决海量数据处理的一项重要技术。该技术采用特殊数据存储方式,极大提 阅读全文
posted @ 2018-01-16 15:54 DB乐之者 阅读(23786) 评论(2) 推荐(4) 编辑
摘要:介绍 如果你已经开发完一个不错的SSIS包并且能够在你的本地完美的运行,每个任务都亮起绿色的通过标志。这时为了能够让这个包处理能够在指定时间运行,你需要将其发布到一个服务器上,并做好相关配置。作为开发人员可能我们不能直接在生产环境去做这个事情,这需要我们有一个开发或者测试环境来完成整个部署测试,因为 阅读全文
posted @ 2016-11-21 16:14 DB乐之者 阅读(7071) 评论(2) 推荐(4) 编辑
摘要:这段时间遇到一个问题就是ReportService 中采用了远程连接的报表偶尔会断开连接,导致报表导出异常,查阅了很多资料,几天来就是断断续续的终于解决了这个问题,下面把一些解决的点一一展示出来,便于大家将来遇到同样问题无从下手。 首先是报错,接下来我马上去看日志,很多人不知道文件的位置,一般默认就 阅读全文
posted @ 2016-08-03 10:46 DB乐之者 阅读(2059) 评论(2) 推荐(5) 编辑
摘要:数据仓库的索引是个棘手的问题。如果索引太多,数据插入很快但是查询响应就会很慢。如果太多索引,数据导入就很慢并且数据存储空间更大,但是查询响应更快。数据库中索引的作用就是加快查询速度,不论是传统数据库还是数据仓库。尤其是对于大数据量的表以及设计表连接的复杂查询。之前接触数据仓库比较少,这里只是介绍一点 阅读全文
posted @ 2016-07-29 16:24 DB乐之者 阅读(1973) 评论(4) 推荐(5) 编辑
摘要:简介 Power BI Desktop -是一款由微软发布的自助式商业智能工具,功能强大、易于使用。其中还可以通过微软云连多个数据源并且使用数据源来创建可视化表盘。 但是几乎所有的BI都需要展示如何随时间改变KPI。因此我将会介绍一个帮助我们使用事件元素来分析数据的关键功能。在PowerBI Des 阅读全文
posted @ 2016-07-21 17:51 DB乐之者 阅读(12591) 评论(5) 推荐(8) 编辑
摘要:问题 我们经常遇到一种情况,在SSMS中运行很慢的一个查询,当把查询转化成从源到目的数据库的SSIS数据流以后,需要花费几倍的时间!源和数据源都没有任何软硬件瓶颈,并且没有大量的格式转换。之前看了很多关于这种情况的优化方案,例如扩大缓存大小等。虽然也能快一点,但是仍然远远比直接在SSMS中查询的速度 阅读全文
posted @ 2016-07-12 17:36 DB乐之者 阅读(3312) 评论(9) 推荐(7) 编辑
摘要:简介 Microsoft Power BI 是由微软推出的商业智能的专业分析工具,给用户提供简单且丰富的数据可视化及分析功能。个人非常喜欢,有免费版和Pro的付费版,今天主要是介绍下通过gateway连接源数据的方式。还有以下常见的BUG。 版本介绍: 主要分这三种service、Desktop和移 阅读全文
posted @ 2016-07-01 16:07 DB乐之者 阅读(3465) 评论(0) 推荐(1) 编辑

点击右上角即可分享
微信分享提示