摘要:
相关概念: 协程:一个线程并发的处理任务 串行:一个线程执行一个任务,执行完毕之后,执行下一个任务 并行:多个CPU执行多个任务,4个CPU执行4个任务 并发:一个CPU执行多个任务,看起来像是同时执行 并发真正的核心/本质:切换并且保持状态 多线程的并发:3个线程处理10个任务,如果线程1处理的这 阅读全文
摘要:
1. 背景 理论上来说:单个进程的多线程可以利用多核. 但是,开发Cpython解释器的程序员,给进入解释器的线程加了锁. 2. 加锁的原因: 当时都是单核时代,而且cpu价格非常贵. 如果不加全局解释器锁, 开发Cpython解释器的程序员就会在源码内部各种主动加锁,解锁,非常麻烦,各种死锁现象等 阅读全文
摘要:
什么是线程 标准描述开启一个进程:开启一个进程:进程会在内存中开辟一个进程空间,将主进程的资料数据全部复制一份,线程会执行里面的代码. ***进程是资源单位, 线程是执行单位;是操作系统调度的最小单元,是进程中的实际运作单位. 线程vs进程 开启进程的开销非常大,比开启线程的开销大很多. 开启线程的 阅读全文
摘要:
概念 串行:所有的任务一个一个的完成. 并发:一个cpu完成多个任务.看起来像是同时完成. 并行:多个cpu执行多个任务,真正的同时完成. 阻塞:cpu遇到IO就是阻塞. 非阻塞:没有IO,就叫非阻塞. 程序:一堆静态文件 进程:一个正在执行的程序任务,一个程序能否开启多个进程 进程的创建 一个子进 阅读全文
摘要:
在一个图表中,可以将多项指标数据放进去同时显示,如果不想同时显示在一起,可以根据需要动态显示数据吗?在 PowerBI 中当然是可以的。 下面就看看如何利用度量值进行动态分析。 假如要分析的指标有销售额和利润,已经分别创建了度量值, 销售额 = sum('订单'[销售额])利润 = SUM('订单' 阅读全文
摘要:
按周进行数据分析,在零售业、电商等类型的公司中很常见,但是不少人觉得按周进行分析无从下手,一个主要的原因是找不到对应的函数,因为时间智能函数只对应年、季、月、天这几个粒度,没有关于周的时间智能函数。 没有相应的函数当然也能搞定,本文就介绍几种常见的周分析的思路,掌握后就可以灵活地进行各种时间分析。 阅读全文
摘要:
目前PowerBI的表格已经支持多列排序,但是矩阵依然还不支持按多个字段排序,虽然这个需求很普遍,这里利用DAX提供一个变通的实现方式。 模拟数据如下,有两个数据指标: 对类别首先按[指标一]进行排序,如果[指标一]数据相同,则按[指标二]排序。 因为PowerBI目前只能按一列排序,自然会想到构造 阅读全文
摘要:
假如分别有100个不重复的姓和名,把每个姓和名进行组合匹配,就可以得到一万个不重复的姓名组合,这种完全匹配的方式就是生成一个姓名的笛卡尔积。 下面就来看看生成笛卡尔积的几种方式,为了展现的方便,以5个姓和5个名为例,更多的数据也是一样操作的。 在Excel中生成笛卡尔积 在Excel中可以利用IND 阅读全文
摘要:
时间序列预测就是利用过去一段时间内的数据来预测未来一段时间内该数据的走势,比如根据过去5年的销售数据进行来年的收入增长预测,根据上个季度的股票走势推测未来一周的股价变化等等。 对于大部分人来说,这是个相对比较复杂的预测建模问题,但在工具如此丰富的今天,当然可以不用自己动手建模,很多工具都可以实现这一 阅读全文
摘要:
之前的文章(采悟:连接表的几个DAX函数,一次全掌握)介绍了产品A的客户与产品B的客户的各种交叉关系,其中最常用的应该是找出A和B的共同客户,以便进行产品关联分析。 之前的思路是计算出两个产品的共同客户数,那么能不能选择三个产品呢,当然是可以的,利用上篇文章的思路,把三种产品的客户找出来,然后求三个 阅读全文
摘要:
各种复杂现象的背后,其实都是受关键的少数因素和普通的大多数因素所影响,把主要精力放在关键的少数因素上,就能达到事半功倍的效果。 这就是大家常说的二八原则,也称为帕累托原则,最早是由意大利经济学家 V.Pareto 提出的,他在研究个人收入的分布状态时,发现少数人的收入占全部人收入的大部分,而多数人的 阅读全文
摘要:
周末放松一下,给大家分享一个小技巧,仅利用DAX制作一个简易的时钟。 时钟效果如下: 这个时钟的制作只需一个度量值,你信吗? 事实上确实如此,制作步骤介绍如下: 1,新建参数,生成一个数字序列作为小时数据。 然后会生成一个1到12的单列表,和一个切片器。 2,利用UNICHAR函数建立度量值。 度量 阅读全文
摘要:
性能分析器是Power BI前几个月推出的功能,主要用于检测视觉对象和DAX的性能如何,该功能的使用比较简单,首先勾选这个功能, 然后点击开始记录并刷新视觉对象,就可以看出每个元素耗费的时间,如下图, 上面的功能很直观,并不需要特别的介绍,关于性能分析器的另外一个功能才是本文要说的。 这个功能可以 阅读全文
摘要:
本文来自星友Beau的分享,在进行数据指标的展现时,对关键的少数单独展示,而对剩余的大多数折叠为其他项,是一个很常用的做法。Beau同学通过一个日常的办公场景,详细介绍了PowerBI实现的步骤,值得大家借鉴。 KPI指标动态展示之TOPN及其他 作者:Beau 一、背景故事 2020年第一天上班 阅读全文
摘要:
1 简介 最大熵原理是概率模型学习的一个准则。最大熵原理认为,学习概率模型时,在所有可能的概率模型(分布)中,熵最大的模型是最好的模型。通常用约束条件来确定概率模型的集合,所以,最大熵原理也可以表述为在满足约束条件的模型集合中选取熵最大的模型。 2 模型 2.1 特征函数 2.2 特征函数期望 2. 阅读全文
摘要:
1 简介 逻辑斯谛回归(logistic regression)是统计学习中的经典分类方法。 最大嫡是概率模型学习的一个准则,将其推广到分类问题得到最大嫡模型(maximum entropy model )。 逻辑斯谛回归模型与最大嫡模型都属于对数线性模型。 2 模型 2.1 逻辑斯谛分布 2.2 阅读全文
摘要:
1 简介 1.1 介绍 1.2 生成步骤 CART树算法由以下两步组成:(1)决策树生成:基于训练数据集生成决策树,生成的决策树要尽量大;(2)决策树剪枝:用验证数据集对己生成的树进行剪枝并选择最优子树,这时用损失函数址小作为剪枝的标准。 2 算法 2.1 回归树 对回归树用平方误差最小化准则,生成 阅读全文
摘要:
1 简介 决策树模型是树形结构,在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。其主要优点是模型具有可读性,分类速度快。学习时,利用训练数据,根据损失函数最小化的原则建立决策树模型。预测时,对新的数据,利用决策 阅读全文