05 2020 档案
摘要:console https://www.jianshu.com/p/67bcb481d1c5 Element https://www.kkpan.com/article/1845.html
阅读全文
摘要:jquery获取当前节点的前一个节点步骤如下: 1、打开html开发工具,新建一来个html代码页面。 2、在html页面创建三个p标签,然后给这三个p标签设置不同的2113内容。 3、引入jquery库。在title标签后5261面引用下载好的jquery.js文件。 4、 在jquery引用库标
阅读全文
摘要:jQuery javaScript和jQuery的关系? jQuery库,里面存在大量的JavaScript函数 获取jQuery 公式:$(selector).action() <!DOCTYPE html> <html lang = "en"> <head> <meta charset = "U
阅读全文
摘要:表单是什么?form DOM树 文本框 text 下拉框 select 单选框 radio 多选框 checkbox 隐藏域 hidden 密码框 password … 表单的目的提交信息 获得要提交的信息 <body> <form action = "post"> <p> <span>用户名:</
阅读全文
摘要:DOM:文档对象模型 核心 浏览器网页就是一个Dom树形结构! 更新:更新Dom节点 遍历Dom节点:得到Dom节点 删除:删除一个Dom节点 添加:添加一个新的节点 要操作一个Dom节点,就必须要先获得这个Dom节点 获得Dom节点 这是原生代码,之后我们尽量都使用jQuery(); 更新节点 操
阅读全文
摘要:浏览器介绍 javascript和浏览器关系?BOM:浏览器对象模型 IE6~11 Chrome Safari FireFox Opera 三方 QQ浏览器 360浏览器 window window代表浏览器窗口 screen 代表屏幕尺寸 location(重要) location代表当前页面的U
阅读全文
摘要:https://wanghuaishi.wordpress.com/2017/02/21/%E5%9B%BE%E8%A7%A3%E6%9C%80%E5%A4%A7%E7%86%B5%E5%8E%9F%E7%90%86%EF%BC%88the-maximum-entropy-principle%EF%
阅读全文
摘要:核方法 核方法 是一类把低维空间的非线性可分问题,转化为高维空间的线性可分问题的方法。核方法不仅仅用于SVM,还可以用于其他数据为非线性可分的算法。核方法的理论基础是Cover's theorem,指的是对于非线性可分的训练集,可以大概率通过将其非线性映射到一个高维空间来转化成线性可分的训练集。 S
阅读全文
摘要:首先给你两个向量 。在一般的机器学习方法,比如 SVM 里面,这里一个向量是一个实体。比如一个向量代表一个人。每个向量有两个维度,身高和体重。比如可以有 现在要求两个人的相似度,最简单的方法是计算它们的内积 。这很简单,只要按照维度相乘求和就可以了。 但是有的时候(比如 SVM 的数据线性不可分的时
阅读全文
摘要:正规矩阵 矩阵的迹以及行列式 伴随矩阵 矩阵的逆 对角矩阵 矩阵求导
阅读全文
摘要:1.对称矩阵 2.Hermite矩阵 3.正交矩阵 4.酉矩阵
阅读全文
摘要:文章结构如下: 1: 原始问题 2: 对偶问题 3: 原始问题和对偶问题的关系 4: 参考文献 在约束最优化问题中,常常利用拉格朗日对偶性(Lagrange duality)将原始问题转为对偶问题,通过解决对偶问题而得到原始问题的解。 对偶问题有非常良好的性质,以下列举几个: 对偶问题的对偶是原问题
阅读全文
摘要:1 types.MethodType的作用—添加实例方法 import types class cla(object): def __init__(self, name, age): self.name = name self.age = age def prii(self): print("pri
阅读全文
摘要:问题 你想以数据管道(类似Unix管道)的方式迭代处理数据。 比如,你有个大量的数据需要处理,但是不能将它们一次性放入内存中。 解决方案 生成器函数是一个实现管道机制的好办法。 为了演示,假定你要处理一个非常大的日志文件目录: foo/ access-log-012007.gz access-log
阅读全文
摘要:作者:青牛链接:https://www.zhihu.com/question/35942305/answer/296719142来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 学习大数据首先我们要学习Java语言和Linux操作系统,这两个是学习大数据的基础,学习的顺
阅读全文
摘要:https://www.cnblogs.com/datahunter/p/3808252.html?utm_source=tuicool&utm_medium=referral 在看机器学习的论文时,经常会看到有作者提到“curse of dimensionality”,中文译为“维数灾难”,这到底
阅读全文
摘要:os.walk 这个函数在遍历目录树的过程中产出文件名,因此递归搜索文件系统像for 循环那样简单。 用于过滤的生成器函数 模块 函数 说明 itertools compress(it,selector_it) 并行处理两个可迭代的对象;如果 selector_it中的元素是真值,产出 it 中对应
阅读全文
摘要:生成器表达式可以理解为列表推导的惰性版本:不会迫切地构建列表,而是返回一个生成器,按需惰性生成元素。也就是说,如果列表推导是制造列表的工厂,那么生成器表达式就是制造生成器的工厂。 示例 14-8 先在列表推导中使用 gen_AB 生成器函数,然后在生成器表达式中使用 >>> def gen_AB()
阅读全文
摘要:简介 设计 Iterator 接口时考虑到了惰性:next(my_iterator) 一次生成一个元素。懒惰的反义词是急迫,其实,惰性求值(lazy evaluation)和及早求值(eager evaluation)是编程语言理论方面的技术术语。 re.finditer 函数是 re.findal
阅读全文
摘要:前言 实现相同功能,但却符合 Python 习惯的方式是,用生成器函数代替SentenceIterator 类。示例 14-5 sentence_gen.py:使用生成器函数实现 Sentence 类 import re import reprlib RE_WORD = re.compile('\w
阅读全文
摘要:标准迭代器 示例 14-4 sentence_iter.py:使用迭代器模式实现 Sentence 类 import re import reprlib RE_WORD = re.compile('\w+') class Sentence: def __init__(self, text): sel
阅读全文
摘要:可迭代的对象 如果对象实现了能返回迭代器的 __iter__ 方法,那么对象就是可迭代的。 序列都可以迭代;实现了 __getitem__ 方法,而且其参数是从零开始的索引,这种对象也可以迭代。 >>> s = 'ABC' >>> it = iter(s) # ➊ >>> while True: .
阅读全文
摘要:简介 在 Python 中,所有集合都可以迭代。在 Python 语言内部,迭代器用于支持: 1.for 循环2.构建和扩展集合类型3.逐行遍历文本文件4.列表推导、字典推导和集合推导5.元组拆包6.调用函数时,使用 * 拆包实参 语言内部使用 iter(...) 内置函数处理可迭代对象的方式 序列
阅读全文
摘要:类装饰器装饰类方法 不带参数 from functools import wraps import types class CatchException: def __init__(self,origin_func): wraps(origin_func)(self) def __get__(sel
阅读全文
摘要:函数装饰器装饰类 单例模式 from functools import wraps def singleton(cls): instances = {} @wraps(cls) def get_instance(*args, **kw): if cls not in instances: insta
阅读全文
摘要:内置的装饰器和普通的装饰器原理是一样的,只不过返回的不是函数,而是类对象,所以更难理解一些。 @property 在了解这个装饰器前,你需要知道在不使用装饰器怎么写一个属性。 def getx(self): return self._x def setx(self, value): self._x
阅读全文
摘要:回到装饰器上的概念上来,装饰器要求接受一个callable对象,并返回一个callable对象(不太严谨,详见后文)。 那么用类来实现也是也可以的。我们可以让类的构造函数__init__()接受一个函数,然后重载__call__()并返回一个函数,也可以达到装饰器函数的效果。 基本类装饰器 clas
阅读全文
摘要:叠放装饰器 示例 7-19 演示了叠放装饰器的方式:@lru_cache 应用到 @clock 装饰fibonacci 得到的结果上。在示例 7-21 中,模块中最后一个函数应用了两个 @htmlize.register 装饰器。 把 @d1 和 @d2 两个装饰器按顺序应用到 f 函数上,作用相当
阅读全文
摘要:示例 7-15 定义了一个装饰器,它会在每次调用被装饰的函数时计时,然后把经过的时间、传入的参数和调用的结果打印出来。示例 7-15 一个简单的装饰器,输出函数的运行时间 import time def clock(func): def clocked(*args): # ➊ t0 = time.p
阅读全文
摘要:变量作用域规则 在示例 7-4 中,我们定义并测试了一个函数,它读取两个变量的值:一个是局部变量 a,是函数的参数;另一个是变量 b,这个函数没有定义它。 >>> def f1(a): ... print(a) ... print(b) ... >>> f1(3) 3 Traceback (most
阅读全文
摘要:排序 (Ranking) 包点图 (Dot Plot) 包点图表传达了项目的排名顺序,并且由于它沿水平轴对齐,因此您可以更容易地看到点彼此之间的距离。 https://datawhalechina.github.io/pms50/#/chapter17/chapter17 导入所需要的库 impor
阅读全文
摘要:排序 (Ranking) 棒棒糖图 (Lollipop Chart) 棒棒糖图表以一种视觉上令人愉悦的方式提供与有序条形图类似的目的。 https://datawhalechina.github.io/pms50/#/chapter16/chapter16 导入所需要的库 import numpy
阅读全文
摘要:简介 装饰器是可调用的对象,其参数是另一个函数(被装饰的函数)。 装饰器可能会处理被装饰的函数,然后把它返回,或者将其替换成另一个函数或可调用对象。 形式 假如有个名为 decorate 的装饰器: @decorate def target(): print('running target()')
阅读全文
摘要:selenium操控浏览器下拉到页面最底端: https://www.cnblogs.com/TTyb/p/7662430.html #!/usr/bin/env python # -*- coding: utf-8 -*- from selenium import webdriver import
阅读全文
摘要:https://zhuanlan.zhihu.com/p/128652582 经常碰到的一类问题是,如何根据起止日期来计算某个时间点的数量,比如: 已知合同的生效日期和到期日期,特定日期的有效合同有多少? 已知店铺的开业日期和注销日期,截至目前正在运营的店铺有多少? 已知员工的入职日期和离职日期,
阅读全文
摘要:https://zhuanlan.zhihu.com/p/133484654 以财务报表分析为例,介绍通用的分析方法论,整体架构如下图所示: (点击查看大图) 我会围绕这五种不同的方法论,逐步阐述他们在 PowerBI 中的应用,之前已经介绍过前两个分析方法,本文谈一下第三种:趋势分析法的应用。 趋
阅读全文
摘要:https://zhuanlan.zhihu.com/p/113113765 PowerBI数据分析02:结构百分比分析法 作者:海艳 结构百分比分析法,又称纵向分析,是指同一期间财务报表中不同项目间的比较与分析,将财务报表中的某一重要项目(如资产负债表中的资产总额或权益总额)的数据作为100%,然
阅读全文
摘要:https://zhuanlan.zhihu.com/p/103264851 首先,以财务报表分析为例,介绍通用的分析方法论,整体架构如下图所示: (点击查看大图) 接下来我会围绕这五种不同的方法论,进一步的阐述他们在 PowerBI 中的应用,本文先谈一下水平分析法的应用。 01 | 水平分析法
阅读全文
摘要:https://zhuanlan.zhihu.com/p/73358029 为了提升销量,在不断吸引新客户的同时,还要防止老客户离你而去,但每一个顾客不可能永远是你的客户,不可避免的都会经历新客户、活跃客户、流失客户的过程,这个过程也称为客户生命周期。 对客户生命周期管理至关重要,之前曾介绍过如何使
阅读全文
摘要:https://zhuanlan.zhihu.com/p/65119988 每个企业的经营活动都是围绕着客户而开展的,在服务好老客户的同时,不断开拓新客户是每个企业的经营目标之一。 开拓新客户必然要付出一定的费用支出,费用支出除以新客户数,就是新客成本,新客成本的高低也决定了企业的盈利水平。 客户拓
阅读全文
摘要:https://zhuanlan.zhihu.com/p/64510355 逛超市的时候,面对货架上琳琅满目的商品,你会觉得这些商品的摆放,或者不同品类的货架分布是随机排列的吗,当然不是。 应该都听说过啤酒与尿布的故事,这两个表面上毫不相关的商品,在超市中摆放在一起时二者的销量都大幅度提升。这里不论
阅读全文
摘要:https://zhuanlan.zhihu.com/p/102567707 前一段介绍过一个客户购买频次统计的案例: Power BI 数据分析应用:客户购买频次分布。 我并没有在文章中显示总计行,但有细心的星友学习时发现,如果把总计行显示出来,会出现没有数据或者即使有数据,也是错误的情况,就像
阅读全文
摘要:https://zhuanlan.zhihu.com/p/100070260 商业数据分析通常都可以简化为对数据进行筛选、分组、汇总的过程,本文通过一个实例来看看PowerBI是如何快速完成整个过程的。 假设数据为一个订单明细表,含有下单日期、客户名称、产品名称等数据,业务需求为: 根据订单表,计算
阅读全文
摘要:https://zhuanlan.zhihu.com/p/57763423 通过简单的点击交互,就能进行动态分析发现见解,才是我们需要的,恰好这也是 PowerBI 所擅长的。 就帕累托分析来说,能从不同的角度快速发现关键因素、以及可以动态设定关键因素的阈值,就是我们需要的。本文通过一个示例来看看如
阅读全文
摘要:偏差 (Deviation) 有序条形图 (Ordered Bar Chart) 有序条形图有效地传达了项目的排名顺序。 但是,在图表上方添加度量标准的值,用户可以从图表本身获取精确信息。 https://datawhalechina.github.io/pms50/#/chapter15/chap
阅读全文
摘要:Scraper刮取器 对ExecutionEngine执行引擎篇出现的Scraper进行展开。Scraper的主要作用是对spider中间件进行管理,通过中间件完成请求、响应、数据分析等工作。 Scraper对象 scrapy/core/scraper.py#Scraper: class Scrap
阅读全文
摘要:Scheduler调度器 对ExecutionEngine执行引擎篇出现的Scheduler进行展开。Scheduler用于控制Request对象的存储和获取,并提供了过滤重复Request的功能。 Scheduler对象 scheduler对象是通过类的from_cralwer方法生成的。scra
阅读全文
摘要:ExecutionEngine执行引擎 上一篇分析了CrawlerProcess和Crawler对象的建立过程,在最终调用CrawlerProcess.start()之前,会首先建立ExecutionEngine执行引擎,执行其open_spider和start方法。 ExecutionEngine
阅读全文
摘要:CrawlerProcess主进程 它控制了twisted的reactor,也就是整个事件循环。它负责配置reactor并启动事件循环,最后在所有爬取结束后停止reactor。另外还控制了一些信号操作,使用户可以手动终止爬取任务。 此类在scrapy/crawler.py中定义,此模块有三个类:Cr
阅读全文
摘要:前言 虽然爬虫的入门级编写并不难,但要让爬虫真正稳定可靠的运行起来,真不是一件容易的事。首先,要用到scrapy,就必须要读懂scrapy这个爬虫框架,如果连这个框架的执行逻辑都搞不懂,那么爬虫也很难写好。 1.命令行启动 这里先不谈使用了各种框架的复杂情况,比如scrapyd服务、redis分布式
阅读全文
摘要:偏差 (Deviation) 面积图 (Area Chart) 通过对轴和线之间的区域进行着色,面积图不仅强调峰和谷,而且还强调高点和低点的持续时间。 高点持续时间越长,线下面积越大。 https://datawhalechina.github.io/pms50/#/chapter14/chapte
阅读全文
摘要:偏差 (Deviation) 带标记的发散型棒棒糖图 (Diverging Lollipop Chart with Markers) 带标记的棒棒糖图通过强调您想要引起注意的任何重要数据点并在图表中适当地给出推理,提供了一种对差异进行可视化的灵活方式。 https://datawhalechina.
阅读全文
摘要:http://dwz.date/UDf 走近Linux系统 开机登录 开机会启动许多程序。它们在Windows叫做"服务"(service),在Linux就叫做"守护进程"(daemon)。 开机成功后,它会显示一个文本登录界面,这个界面就是我们经常看到的登录界面,在这个登录界面中会提示用户输入用户
阅读全文
摘要:偏差 (Deviation) https://datawhalechina.github.io/pms50/#/chapter11/chapter11 发散型文本 (Diverging Texts) 如果您想根据单个指标查看项目的变化情况,并可视化此差异的顺序和数量,那么散型条形图 (Divergi
阅读全文
摘要:https://datawhalechina.github.io/pms50/#/chapter10/chapter10 如果您想根据单个指标查看项目的变化情况,并可视化此差异的顺序和数量,那么散型条形图 (Diverging Bars) 是一个很好的工具。 它有助于快速区分数据中组的性能,并且非常
阅读全文
摘要:矩阵图 https://datawhalechina.github.io/pms50/#/chapter9/chapter9 导入所需要的库 import numpy as np # 导入numpy库 import pandas as pd # 导入pandas库 import matplotlib
阅读全文
摘要:相关图 https://datawhalechina.github.io/pms50/#/chapter8/chapter8 导入所需要的库 import numpy as np # 导入numpy库 import pandas as pd # 导入pandas库 import matplotlib
阅读全文
摘要:https://datawhalechina.github.io/pms50/#/chapter7/chapter7 边缘箱形图 (Marginal Boxplot) 边缘箱图与边缘直方图具有相似的用途。 然而,箱线图有助于精确定位 X 和 Y 的中位数、第25和第75百分位数。 导入所需要的库 i
阅读全文
摘要:https://datawhalechina.github.io/pms50/#/chapter6/chapter6 边缘直方图 (Marginal Histogram) 边缘直方图具有沿 X 和 Y 轴变量的直方图。 这用于可视化 X 和 Y 之间的关系以及单独的 X 和 Y 的单变量分布。 这种
阅读全文
摘要:https://datawhalechina.github.io/pms50/#/chapter5/chapter5 计数图 (Counts Plot) 避免点重叠问题的另一个选择是增加点的大小,这取决于该点中有多少点。 因此,点的大小越大,其周围的点的集中度越高。 导入所需要的库 import n
阅读全文
摘要:https://datawhalechina.github.io/pms50/#/chapter3/chapter3 如果你想了解两个变量如何相互改变,那么最佳拟合线就是常用的方法。 下图显示了数据中各组之间最佳拟合线的差异。 要禁用分组并仅为整个数据集绘制一条最佳拟合线,请从下面的 sns.lmp
阅读全文
摘要:https://www.cnblogs.com/wongbingming/p/9124142.html 在实战中,将会用到以下知识点: 多线程的基本使用 Queue消息队列的使用 Redis的基本使用 asyncio的使用 . 动态添加协程# 在实战之前,我们要先了解下在asyncio中如何将协程态
阅读全文
摘要:. 本文目录# 协程中的并发 协程中的嵌套 协程中的状态 gather与wait . 协程中的并发# 协程的并发,和线程一样。举个例子来说,就好像 一个人同时吃三个馒头,咬了第一个馒头一口,就得等这口咽下去,才能去啃第其他两个馒头。就这样交替换着吃。 asyncio实现并发,就需要多个协程来完成任务
阅读全文
摘要:https://www.cnblogs.com/wongbingming/p/9095243.html . 本文目录# 如何定义/创建协程 asyncio的几个概念 学习协程是如何工作的 await与yield对比 绑定回调函数 . 如何定义/创建协程# 只要在一个函数前面加上 async 关键字,
阅读全文
摘要:1 了解异常 当检测到⼀个错误时,解释器就⽆法继续执⾏了,反⽽出现了⼀些错误的提示,这就是所谓的"异常"。 例如:以 r ⽅式打开⼀个不存在的⽂件。 open('test.txt', 'r') 2. 异常错误分类 语法错误 if 2 > 1 print(222) dic = {'name'; 'al
阅读全文
摘要:目录 Python面向对象06 /元类type、反射、函数与类的区别、特殊的双下方法 1. 元类type 2. 反射 3. 函数与类的区别 4. 特殊的双下方法 1. 元类type type:获取对象从属的类 Python中一切皆对象,类在某种意义上也是一个对象 Python中自己定义的类,以及大部
阅读全文
摘要:https://www.cnblogs.com/liubing8/p/11325421.html 目录 Python面向对象05 /私有成员、类方法、静态方法、属性、isinstance/issubclass 1. 私有成员 2. 类方法 3. 静态方法 4. 属性 5. 内置函数 isinstan
阅读全文
摘要:https://www.cnblogs.com/liubing8/p/11321099.html 目录 Python面向对象04 /封装、多态、鸭子类型、类的约束、super 1. 封装 2. 多态 3. 鸭子类型 4. 类的约束 5. super的深度剖析 1. 封装 把一堆东西(代码,数据)放到
阅读全文
摘要:目录 Python面向对象03 /继承 1. 初识继承 2. 单继承 3. 多继承 4. 总结 1. 初识继承 概念:专业角度:如果B类继承A类,B类就称为子类,派生类,A类就称为父类,超类,基类 种类:单继承,多继承 面向对象的三大特征:继承,封装,多态 继承的优点: 减少重复的代码 增加类之间的
阅读全文
摘要:https://www.cnblogs.com/liubing8/p/11308127.html 1. 类的空间问题 添加对象属性 # 在类的__init__可以添加,在类的方法也可以添加,在类的外部也可以添加 class Human: mind = '有思想的' def __init__(self
阅读全文
摘要:https://www.cnblogs.com/liubing8/p/11301344.html 1. 面向对象初识 1.面向过程编程vs函数式编程 减少了重复代码 增强了可读性 2.函数式编程vs面向对象编程 面向对象的第一个优点: 对相似功能的函数,同一业务下的函数进行归类,分类 面向对象的第二
阅读全文
摘要:https://zhuanlan.zhihu.com/p/128652582 经常碰到的一类问题是,如何根据起止日期来计算某个时间点的数量,比如: 已知合同的生效日期和到期日期,特定日期的有效合同有多少? 已知店铺的开业日期和注销日期,截至目前正在运营的店铺有多少? 已知员工的入职日期和离职日期,
阅读全文
摘要:https://zhuanlan.zhihu.com/p/133484654 本文为星球嘉宾"海艳"的PowerBI数据分析工作实践系列分享之三,她深入浅出的介绍了PowerBI在数据分析中的应用,欢迎学习借鉴。 她的前两篇分享: PowerBI数据分析实践第一弹 | 水平分析法 PowerBI数
阅读全文
摘要:https://zhuanlan.zhihu.com/p/113113765 本文为星球嘉宾"海艳"的PowerBI数据分析工作实践系列分享之二,她深入浅出的介绍了PowerBI在数据分析中的应用,利用PowerBI发现问题分析问题,欢迎学习借鉴。 她的上一篇分享: PowerBI数据分析实践01
阅读全文
摘要:https://zhuanlan.zhihu.com/p/103264851 本文为星球嘉宾"海艳"的PowerBI数据分析工作实践系列分享之一,她深入浅出的介绍了PowerBI在数据分析中的应用,从各项指标的计算,到可视化展现,利用PowerBI发现问题分析问题,欢迎学习借鉴。 PowerBI数
阅读全文
摘要:https://zhuanlan.zhihu.com/p/73358029 为了提升销量,在不断吸引新客户的同时,还要防止老客户离你而去,但每一个顾客不可能永远是你的客户,不可避免的都会经历新客户、活跃客户、流失客户的过程,这个过程也称为客户生命周期。 对客户生命周期管理至关重要,之前曾介绍过如何使
阅读全文
摘要:https://zhuanlan.zhihu.com/p/65119988 每个企业的经营活动都是围绕着客户而开展的,在服务好老客户的同时,不断开拓新客户是每个企业的经营目标之一。 开拓新客户必然要付出一定的费用支出,费用支出除以新客户数,就是新客成本,新客成本的高低也决定了企业的盈利水平。 客户拓
阅读全文
摘要:https://zhuanlan.zhihu.com/p/64510355 逛超市的时候,面对货架上琳琅满目的商品,你会觉得这些商品的摆放,或者不同品类的货架分布是随机排列的吗,当然不是。 应该都听说过啤酒与尿布的故事,这两个表面上毫不相关的商品,在超市中摆放在一起时二者的销量都大幅度提升。这里不论
阅读全文
摘要:https://zhuanlan.zhihu.com/p/102567707 前一段介绍过一个客户购买频次统计的案例: Power BI 数据分析应用:客户购买频次分布。 我并没有在文章中显示总计行,但有细心的星友学习时发现,如果把总计行显示出来,会出现没有数据或者即使有数据,也是错误的情况,就像
阅读全文
摘要:https://zhuanlan.zhihu.com/p/100070260 商业数据分析通常都可以简化为对数据进行筛选、分组、汇总的过程,本文通过一个实例来看看PowerBI是如何快速完成整个过程的。 假设数据为一个订单明细表,含有下单日期、客户名称、产品名称等数据,业务需求为: 根据订单表,计算
阅读全文
摘要:https://zhuanlan.zhihu.com/p/57763423 上篇文章介绍了帕累托图的用处以及如何制作一个简单的帕累托图,在 PowerBI 中可以很方便的生成,但若仅止于此,并不足以体现 PowerBI 的强大。现实中的分析很多数据维度交织在一起,若要一个一个的生成帕累托图进行分析,
阅读全文
摘要:Redis 有序集合(sorted set) Redis 有序集合和集合一样也是string类型元素的集合,且不允许重复的成员。 不同的是每个元素都会关联一个double类型的分数。redis正是通过分数来为集合中的成员进行从小到大的排序。 有序集合的成员是唯一的,但分数(score)却可以重复。
阅读全文
摘要:Redis 集合(Set) Redis 的 Set 是 String 类型的无序集合。集合成员是唯一的,这就意味着集合中不能出现重复的数据。 Redis 中集合是通过哈希表实现的,所以添加,删除,查找的复杂度都是 O(1)。 集合中最大的成员数为 232 - 1 (4294967295, 每个集合可
阅读全文
摘要:Redis 列表(List) Redis列表是简单的字符串列表,按照插入顺序排序。你可以添加一个元素到列表的头部(左边)或者尾部(右边) 一个列表最多可以包含 232 - 1 个元素 (4294967295, 每个列表超过40亿个元素)。 实例 redis 127.0.0.1:6379> LPUSH
阅读全文
摘要:Redis 哈希(Hash) Redis hash 是一个 string 类型的 field 和 value 的映射表,hash 特别适合用于存储对象。 Redis 中每个 hash 可以存储 232 - 1 键值对(40多亿)。 实例 127.0.0.1:6379> HMSET runoobkey
阅读全文
摘要:Redis 字符串数据类型的相关命令用于管理 redis 字符串值,基本语法如下: 语法 redis 127.0.0.1:6379> COMMAND KEY_NAME 实例 redis 127.0.0.1:6379> SET runoobkey redis OK redis 127.0.0.1:63
阅读全文
摘要:Redis 键命令用于管理 redis 的键。 语法 Redis 键命令的基本语法如下: redis 127.0.0.1:6379> COMMAND KEY_NAME 实例 redis 127.0.0.1:6379> SET runoobkey redis OK redis 127.0.0.1:63
阅读全文
摘要:import redis from redis import StrictRedis redis=StrictRedis(host='localhost',port=6379,db=0,password='') redis.set('name','lili') print(redis.get('na
阅读全文
摘要:Redis 命令用于在 redis 服务上执行操作。 要在 redis 服务上执行命令需要一个 redis 客户端。Redis 客户端在我们之前下载的的 redis 的安装包中。 语法 Redis 客户端的基本语法为: $ redis-cli 实例 以下实例讲解了如何启动 redis 客户端: 启动
阅读全文
摘要:Redis 数据类型 Redis支持五种数据类型:string(字符串),hash(哈希),list(列表),set(集合)及zset(sorted set:有序集合)。 String(字符串) string 是 redis 最基本的类型,你可以理解成与 Memcached 一模一样的类型,一个 k
阅读全文
摘要:https://zhuanlan.zhihu.com/p/78537828 最近碰到星友的一个问题,他是在Excel的PowerQuery中已经把数据处理好了,但是处理后的数据又想用PowerBI来分析,那么还需要在PowerBI中用Powerquery重新再处理一遍吗? 或者说有什么方法把Exce
阅读全文
摘要:https://zhuanlan.zhihu.com/p/111674088 来自知乎一个朋友的问题,如何在Excel中批量插入文件的超链接,以便在Excel中对文档进行有序的目录管理? 这个问题的方法很多,这里给出一个简便且高效的方法,利用Power Query。 假设需要管理的文档存放于三个文
阅读全文
摘要:https://zhuanlan.zhihu.com/p/66540160 常规分列 我们最常见的就是有固定分隔符的规范数据,这种直接就按照分隔符拆分就可以了, 如果没有分割符怎么办?依然是上面的数据,如果连逗号都没有呢,在Powerquery中还可以按从数字到非数字的转换来分列, 拆分列的常规功能
阅读全文
摘要:https://zhuanlan.zhihu.com/p/130460772 今天分享一个PowerQuery的小技巧,导入到PowerBI中的数据,如果想要更改数据的列名,可以在PQ编辑器中直接双击列名,如果需要修改的列名比较多,还可以批量修改,利用这个M函数:Table.RenameColum
阅读全文
摘要:本文来源于一个星友的问题,他有上百个Excel表格,格式并不完全一样,列的位置顺序也不同,但每个表都有几个共同列,这种情况下,能不能通过Power Query把这些表格共同的列批量合并呢? 当然是可以的! 我模拟了三个表,源数据的情况大致是这样的, 这三个表之间的特征如下: 有共同列 列的位置顺序是
阅读全文
摘要:https://zhuanlan.zhihu.com/p/64419762 每当拿到原始数据,不如意十有八九,快速准确的清洗数据也是必备技能,数据清洗正好是 PowerQuery 的强项,本文就来介绍两个常用的 M 函数:Text.Remove 和 Text.Select。 看到以 Text 开头的
阅读全文
摘要:https://zhuanlan.zhihu.com/p/69187094 数据分析的源数据应该是规范的,而规范的其中一个标准就是数据源应该是一维表,它会让之后的数据分析工作变得简单高效。 在之前的文章中,我也经常强调一维表的易用性,也时常有人问我,什么是一维表,为什么要转为一维表呢,这篇文章就来帮
阅读全文
摘要:https://zhuanlan.zhihu.com/p/64415763 使用Power Query进行复杂一些的数据处理,离不开M函数,目前已经有超过700个函数了,基本上各式各样的数据处理需求都可以使用M函数实现,如果你觉得这些还不够,或者使用起来不是很方便,也可以在PQ中自定义函数。 自定义
阅读全文
摘要:https://zhuanlan.zhihu.com/p/81846862 PowerQuery中,对两列或者多列的计算一般通过添加自定义列来实现,以下表为例, 如果需要1月和2月数据的合计,可以添加自定义列, 其实还有一种更方便的方式,不用动手输入任何字符,点点鼠标就可以完成,这个功能就在这里:
阅读全文
摘要:https://zhuanlan.zhihu.com/p/81535007 星友们在知识星球(PowerBI星球)提出的问题中,关于空值的运算经常被提及。平时接触到的源数据常常有空值,比如Excel数据中的空白单元格,powerquery中会显示为null,大多数时候,我们并不能简单粗暴的删除其中的
阅读全文
摘要:1 泛化误差 学习方法的泛化能力(generalization ability)是指由该方法学习到的模型对未知数据的预测能力,是学习方法本质重要的性质。 泛化误差反映了学习方法的泛化能力,如果一种方法学习的模型比另一种方法学习的模型具有更小的泛化误差,那么这种方法就更有效。事实上,泛化误差就是所学习
阅读全文
摘要:正则化与交叉验证用于模型选择 1 正则化 正则化是结构风险最小化策略的实现,是在经验风险上加一个正则化项(regularizer)或罚项(penalty iterm )。正则化项一般是模型复杂度的单调递增函数,模型越复杂,正则化值就越大。比如,正则化项可以是模型参数向量的范数。 正则化一般形式: 正
阅读全文
摘要:1 训练误差 2 测试误差 测试误差小的方法具有更好的预测能力,是更有效的方法。通常将学习方法对未知数据的预测能力称为泛化能力 3 过拟合 过拟合是指学习时选择的模型所包含的参数过多,以至出现这一模型对己知数据预测得很好,但对未知数据预测得很差的现象。 4 模型选择 如果在假设空间中存在“真”模型,
阅读全文
摘要:https://datawhalechina.github.io/pms50/#/chapter2/chapter2 关联 (Correlation) 关联图表用于可视化2个或更多变量之间的关系。 也就是说,一个变量如何相对于另一个变化。 带边界的气泡图 有时,您希望在边界内显示一组点以强调其重要性
阅读全文
摘要:https://zhuanlan.zhihu.com/p/88528732 在各种经营分析报告中,我们常常会看到YTD,YOY这样的统计指标,这样的数据计算并不难,尤其是在PowerBI中,因为有时间智能函数的帮助,大大简化了这些计算,从而快速满足定期的报告需求。 下面就给你列出这些常用统计数据的度
阅读全文
摘要:https://zhuanlan.zhihu.com/p/96823622 开始半累加的计算之前,我们先看看什么是累加、半累加以及不可累加数据。 在含有大量行的数据表中,各种数据处理语言,包括DAX,为了性能考虑,不太可能总是检索表的每一行,更常见的情形是,一次性检索成千上万行,处理如此多行数据的
阅读全文
摘要:https://zhuanlan.zhihu.com/p/85996745 上一篇文讲了累计聚合,这篇文章继续讲一下滚动聚合,比如常用的MAT计算,Moving Annual Total,滚动年度总计,即向前滚动12月的合计数。 滚动年度求和,也经常用于财务上的滚动预算,看完这篇文章,你以后会很轻松
阅读全文
摘要:https://zhuanlan.zhihu.com/p/64999937 经常碰到本年至今、本月至今的数据计算,其实还有一类计算是,从历史最早日期至今的累计计算,比如从开业到现在总共卖出了多少件商品,累计实现了多少销售额等。 本年累计称为YTD,历史至今的累计是不是可以称为HTD呢:) ;这样的时
阅读全文
摘要:https://zhuanlan.zhihu.com/p/98975646 如何将表格或者矩阵中值的条件格式也应用于总计行? 目前PowerBI并不支持这种功能,无法在总计行或者小计行上应用条件格式,不过我们可以摸索个变通的方式来实现。 以制作红绿灯效果这篇文章的数据为例: PowerBI小技巧:简
阅读全文
摘要:https://zhuanlan.zhihu.com/p/67441847 累计求和问题,之前已经介绍过(有了这几个公式,你也可以快速搞定累计求和),主要是基于比较简单的情形,针对所有的数据进行累计求和。 现实中的需求并不总是这么简单,稍微复杂一点的是按类别求累计,以帕累托分析为例,模拟数据如下,
阅读全文
摘要:https://zhuanlan.zhihu.com/p/68384001 本文聊聊在PowerBI中如何进行各种类型的排名问题。 PowerBI中计算排名主要使用RANKX函数,关于该函数的具体语法,不再细说,可以查看该函数的官方文档,也可以参照这个函数卡片: ↑ 知识星球每日函数卡片 下面通过几
阅读全文
摘要:https://zhuanlan.zhihu.com/p/67015995 编写DAX代码进行业务分析时,经常会用到表与表之间的连接计算,比如在之前的产品关联分析一文中(如何用Power BI分析产品关联度?),需要找出同时购买两种商品的客户,就是计算A商品的客户列表与B商品的客户列表的交集。 这篇
阅读全文
摘要:http://qjzd.net:3000/topic/5e48cc33dcf06d6a181ffb81 查询真实IP 通过IPAddress.com首页,输入raw.githubusercontent.com查询到真实IP地址 修改hosts Ubuntu,CentOS及macOS直接在终端输入 s
阅读全文
摘要:关联 (Correlation) 关联图表用于可视化2个或更多变量之间的关系。 也就是说,一个变量如何相对于另一个变化。 散点图(Scatter plot) 散点图是用于研究两个变量之间关系的经典的和基本的图表。 如果数据中有多个组,则可能需要以不同颜色可视化每个组。 在 matplotlib 中,
阅读全文
摘要:链接 https://github.com/datawhalechina/pms50 python可视化50图解读(pms50),在线阅读地址:https://datawhalechina.github.io/pms50/ python可视化50图解读(Pms50-Notes) python可视化5
阅读全文
摘要:https://zhuanlan.zhihu.com/p/107672198 本文来自星友袁佳林的实践分享,他参加了PowerBI星球中的DAX圣经第二版100天学习打卡活动,已持续分享近100天,对DAX的理解自然更深了一些,本文就是他利用DAX解决问题的一种思路。 Think in DAX 之
阅读全文
摘要:https://zhuanlan.zhihu.com/p/66424209 SUMMARIZE函数非常强大,掌握以后表面上看也非常好用,所以我专门写篇文章介绍一下这个函数,至于是否一定要使用该函数,请看完再决定。 SUMMARIZE,单纯从英文语义上看,是汇总、总结的意思,而它的功能,确实也就是汇总
阅读全文
摘要:https://zhuanlan.zhihu.com/p/64422599 为什么要进行格式化? DAX 是一种函数式语言,正如我们已经学习的或者看到的,DAX 代码中总有一些函数带有几个参数,而参数还可以是其他函数所构成,参数的数量以及嵌套的层数决定了 DAX 代码的复杂度。 使用 PowerBI
阅读全文
摘要:https://zhuanlan.zhihu.com/p/68183990 我在知识星球收到的问题中,关于表格和矩阵(以下统称表格)总计行错误算是常见的问题之一了,不少初学者甚为不解,在Excel透视表中很常见的总计,为什么到了更强大的 PowerBI 中,反而会出现这么低级的错误呢? 并且碰到这个
阅读全文
摘要:https://zhuanlan.zhihu.com/p/64422393 经常有朋友提出一个问题,然后我给出一个DAX之后,TA又不是很理解,反复多次沟通才能把一个表达式讲清楚。或者TA自己写了一个度量值,可是对输出结果无法理解:我想要的是A,为什么出来的是B? 为了帮助大家快速理解一个相对复杂的
阅读全文
摘要:https://zhuanlan.zhihu.com/p/121773967 数据分析就是筛选、分组、聚合的过程,关于筛选,可以按一个维度来筛选,也可以按多个维度筛选,还有种常见的方式是,利用几个特定的维度值构成的表,作为条件表来筛选原始表。 也就是说,根据一个表,来筛选另外一个表,在PowerB
阅读全文
摘要:https://zhuanlan.zhihu.com/p/64421378 Excel中知名度最高的函数当属VLOOKUP,它的确很有用,可以在两个表之间进行匹配数据,使工作效率大大提升,虽然它也有很多局限性。这里不讨论VLOOKUP,而是学习一个和VLOOKUP功能很相似的DAX函数:RELATE
阅读全文
摘要:https://zhuanlan.zhihu.com/p/64420449 在进行数据分析时,需要对某个数据进行格式调整的情形经常会遇到,在DAX中有一个专门进行格式调整的函数:FORMAT。 其实对于 FORMAT 函数并不陌生,在之前介绍如何制作日期表时,其中一种方式就是利用 DAX 生成日期表
阅读全文
摘要:https://zhuanlan.zhihu.com/p/55841964 时间可以说是数据分析中最常用的独立变量,工作中也常常会遇到对时间数据的对比分析。假设要计算上年同期的销量,在PowerBI中可以用CALCULATE来写个度量值[上年同期], = CALCULATE([数量],SAMEPER
阅读全文
摘要:https://zhuanlan.zhihu.com/p/79522456 对于PowerBI使用者而言,经常碰到的一个问题是,想把度量值放到坐标轴上,却发现无法实现。尤其是初学者,更是习惯性的想这么做。 PowerBI星球嘉宾天行,摸索出了一个解决该问题的思路,请慢慢品读吧。 解决度量值不能作为坐
阅读全文
摘要:from flask import Flask, flash, redirect, render_template, request app = Flask(__name__) app.secret_key = 'some_secret' @app.route('/') def index1():
阅读全文
摘要:#!/usr/bin/env python # -*- coding:utf-8 -*- from flask import Flask, Request, render_template app = Flask(__name__, template_folder='templates') app.
阅读全文
摘要:message是一个基于Session实现的用于保存数据的集合,其特点是:使用一次就删除。 from flask import Flask, flash, redirect, render_template, request, get_flashed_messages app = Flask(__n
阅读全文
摘要:1 蓝图资源 蓝图有自己的目录,它的所有资源都在其目录下。蓝图的资源目录是由创建Blueprint对象时传入的模块名”__name__”所在的位置决定的。同时,我们可以指定蓝图自己的模板目录和静态目录。比如我们创建蓝图时传入: admin_bp = Blueprint('admin', __name
阅读全文
摘要:除请求对象之外,还有一个 session 对象。它允许你在不同请求间存储特定用户的信息。它是在 Cookies 的基础上实现的,并且对 Cookies 进行密钥签名要使用会话,你需要设置一个密钥。 设置:session['username'] = 'xxx' 删除:session.pop('user
阅读全文
摘要:from flask import Flask from flask import request from flask import render_template from flask import redirect from flask import make_response app = F
阅读全文
摘要:1、模板的使用 1.1 语法 1.1.1 流程控制 逻辑语法 Jinja2模板语言中的 for {% for foo in g %} {% endfor %} Jinja2模板语言中的 if {% if g %} {% elif g %} {% else %} {% endif %} 1.1.2 变
阅读全文
摘要:1. 常见路由 @app.route('/user/<username>') @app.route('/post/<int:post_id>') @app.route('/post/<float:post_id>') @app.route('/post/<path:path>') @app.rout
阅读全文
摘要:配置参数 flask中的配置文件是一个flask.config.Config对象(继承字典),默认配置为: { 'DEBUG': get_debug_flag(default=False), 是否开启Debug模式 'TESTING': False, 是否开启测试模式 'PROPAGATE_EXCE
阅读全文
摘要:Flask是一个基于Python开发并且依赖jinja2模板和Werkzeug WSGI服务的一个微型框架,对于Werkzeug本质是Socket服务端,其用于接收http请求并对请求进行预处理,然后触发Flask框架,开发人员基于Flask框架提供的功能对请求进行相应的处理,并返回给用户,如果要返
阅读全文