上一页 1 2 3 4 5 6 ··· 28 下一页
摘要: 原文:【机器学习笔记】:一文让你彻底理解准确率,精准率,召回率,真正率,假正率,ROC/AUC 作者:xiaoyu 微信公众号:Python数据科学 知乎:python数据分析师 ROC/AUC作为机器学习的评估指标非常重要,也是面试中经常出现的问题(80%都会问到)。其实,理解它并不是非常难,但是 阅读全文
posted @ 2022-06-02 10:14 悦光阴 阅读(577) 评论(0) 推荐(0) 编辑
摘要: 函数ADDCOLUMNS和SELECTCOLUMNS的功能相似,都是迭代函数,在行下文中计算表达式,并返回一个表。 从数据沿袭的角度来看: ADDCOLUMNS函数:新添加的列不具有数据沿袭的能力。 SELECTCOLUMNS函数:SELECTCOLUMNS 保留直接对列引用的数据沿袭,对列执行的任 阅读全文
posted @ 2022-05-25 11:15 悦光阴 阅读(1307) 评论(0) 推荐(0) 编辑
摘要: 自动存在是 DAX 中内置的一项技术,其唯一的目标是避免无用计算,换句话说,它是 DAX 的过滤机制使用的一种优化技术,目的是减少计算值的工作量。 例如,假设有人构建了一份按大陆和国家/地区划分的报告。 在一个数据库中,一个人可能有两大洲和五个国家: 在这些数据上,可以运行一个简单的查询,如下所示: 阅读全文
posted @ 2022-05-23 17:49 悦光阴 阅读(273) 评论(0) 推荐(0) 编辑
摘要: 数据沿袭实际上存在DAX中的每个角落,它的设计如此好,以至于很多开发人员在不知情的情况使用。 DAX使用数据沿袭来维护关于列值来源的信息。数据沿袭实际上是一个标签(Tag),分配给表中的每一列,此Tag用于标识数据模型中的原始列,即列的值源自于该列。通过数据沿袭,DAX可以利用现有的关系来过滤数据模 阅读全文
posted @ 2022-05-22 19:01 悦光阴 阅读(449) 评论(0) 推荐(0) 编辑
摘要: 在筛选上下文中,一列可能是由于应用了过滤器而被直接筛选,也可能是由于关系的传递,其他列被筛选而导致该列被间接筛选。因此,可以把数据模型中的筛选分为直接过滤和交叉过滤。 一,判断直接过滤和交叉过滤 直接过滤:当过滤器直接作用到表中的一列上时,该列是被直接过滤的。直接过滤是由外部的切片器和查询上下文中的 阅读全文
posted @ 2022-05-19 13:28 悦光阴 阅读(514) 评论(0) 推荐(1) 编辑
摘要: 表值函数 VALUES, DISTINCT 都用于返回一列的唯一值,唯一的区别是:VALUES()会额外添加一个BLANK。当使用VALUES函数从一个关联表中获取唯一值时,如果某一个值在关系中缺失,那么VALUES()函数会返回BLANK()。 当关系代表的约束无效时,数据模型会再关系的“一”端的 阅读全文
posted @ 2022-05-18 21:40 悦光阴 阅读(1976) 评论(0) 推荐(0) 编辑
摘要: 按照以下的步骤来启用远程桌面连接,可以允许同时连接多人。 Step1:登录Windows 服务器“”,打开“Start”(按下Windows键),输入“Edit group policy” 或 “gpedit.msc”来加载“Local Group Policy Editor” Step2:导航到C 阅读全文
posted @ 2022-05-12 20:50 悦光阴 阅读(1060) 评论(0) 推荐(0) 编辑
摘要: 在表格数据模型中,用户可以创建关系,并可以沿着关系的方向自动进行交叉过滤。但是在计算列中,必须通过RELATED 和 RELATEDTABLE函数来检索相关联的表。当使用CALCULATE函数时,可以直接使用现有的活跃关系来进行过滤,并不需要显示调用RELATED 和 RELATEDTABLE函数来 阅读全文
posted @ 2022-05-03 21:34 悦光阴 阅读(598) 评论(0) 推荐(0) 编辑
摘要: Power BI报表的用户,肯定会被Q&A的功能惊艳到,在查看报表时,仅仅通过输入文本就可以探索数据,并且结果是可视化的,更令人惊艳的时,结果几乎是实时显示出来的。这使得Q&A Visual就像一个搜索引擎,输入你想查询的问题,Q&A返回一个可视化的结果。 在用户开始输入问题之前,Q&A会显示一些建 阅读全文
posted @ 2022-04-11 22:03 悦光阴 阅读(908) 评论(0) 推荐(2) 编辑
摘要: numpy使用save(), savez()和load()函数来保存和加载numpy的二进制文件。 一,保存文件 save()和savez()的区别是前者是非压缩的,而后者是压缩存储。 1,save()函数 def save(file, arr, allow_pickle=True, fix_imp 阅读全文
posted @ 2022-01-05 14:47 悦光阴 阅读(963) 评论(0) 推荐(0) 编辑
摘要: 数组的统计函数用于对数组做统计运算。 一,统计方法 NumPy内置数据分析常用的统计量: mean():计算元素的均值 median():计算中位数 var():计算元素的方差 std() :计算元素标准差 max():计算元素的最大值 min():计算元素的最小值 ptp():计算元素的取值范围, 阅读全文
posted @ 2022-01-05 14:21 悦光阴 阅读(928) 评论(0) 推荐(0) 编辑
摘要: 1,查找最大值或最小值所在的索引 按照特定的轴查找最大值或最小值的索引 numpy.argmax(a, axis=None, out=None, *, keepdims=<no value>) numpy.argmin(a, axis=None, out=None, *, keepdims=<no 阅读全文
posted @ 2022-01-05 14:18 悦光阴 阅读(778) 评论(0) 推荐(0) 编辑
摘要: 拼接不会改变数组的维度,而堆叠会增加新的轴。 一,拼接 如果要把两份数据组合到一起,需要拼接操作。 numpy.concatenate((a1, a2, ...), axis=0, out=None) 参数axis默认值是0,标识按照行来拼接,如果设置为None,那么所有的数组将展开为一维,并拼接在 阅读全文
posted @ 2022-01-05 14:15 悦光阴 阅读(2997) 评论(0) 推荐(0) 编辑
摘要: 通用函数(universal function)通常叫作ufunc,它对数组中的各个元素逐一进行操作。这表明,通用函数分别处理输入数组的每个元素,生成的结果组成一个新的输出数组。输出数组的大小跟输入数组相同。 一元通用函数: abs:计算绝对值 sqrt:计算平方根 square:计算平方 exp: 阅读全文
posted @ 2022-01-05 13:50 悦光阴 阅读(403) 评论(0) 推荐(0) 编辑
摘要: 一个数组的形状是由每个轴的元素数量决定的,可以通过reshape()和resize()函数来操纵数组的形状。transpose()函数用于数组的转置,ravel()函数用于把数组展开为一维数组,而flatten()用于获得数组展开之后的一个副本;swapaxes()函数用于交换数组的两个轴,sque 阅读全文
posted @ 2022-01-04 17:26 悦光阴 阅读(2001) 评论(0) 推荐(0) 编辑
摘要: NumPy是Python中用于科学计算的基础软件包,专门用于处理矩阵,数据类型是数值型的,用于对数值数据进行快速的计算。因此,numpy支持的数据类型非常精细,但是numpy不支持精确小数。 在导入numpy模块时,通常把numpy模块重命名为np: import numpy as np 一,num 阅读全文
posted @ 2021-12-31 17:51 悦光阴 阅读(689) 评论(0) 推荐(0) 编辑
摘要: 本文总结了在工作中用过的脚本 1,列出folder中的所有文件 %python display(dbutils.fs.ls("dbfs:/mnt/folder/")) 2,改变表的列 由于Azure Databricks不支持修改列,所以可以通过把数据表重命名,然后创建一个同名的表来实现列的改变 % 阅读全文
posted @ 2021-12-31 16:52 悦光阴 阅读(405) 评论(0) 推荐(0) 编辑
摘要: bool(也叫逻辑值)有True和False,用于表示真或假。True和False是预先定义的关键字,在内部,True和False是bool的实例,实际上仅仅是内置的整数类型int的子类。True和False的行为跟整数1和0是相同的。 有些值是unknown的,用None来表示。 一,布尔类型 b 阅读全文
posted @ 2021-12-27 23:19 悦光阴 阅读(1079) 评论(0) 推荐(0) 编辑
摘要: Python的对象分为变量和常量,常量的值是字面意思,其值是不可变的;变量的值是可变的,例如,123,"上海"是常量,而a=1,a=2,其中a是变量名。内置的核心数据类型有:数字、字符串、列表(list)、字典(dictionary)、元组(tuple)、文件、集合(set)、None和布尔(boo 阅读全文
posted @ 2021-12-26 22:34 悦光阴 阅读(908) 评论(0) 推荐(0) 编辑
摘要: 在Python语言中,浮点数是有精度的,通常有精度缺失,这是由于浮点数是使用2进制进行计算的,如下所示: >>> print(0.3 - 0.2) >>> print(0.3 - 0.2 == 0.1) 0.09999999999999998 False 让我们考虑十进制的 1 / 3 是 0.33 阅读全文
posted @ 2021-12-17 17:58 悦光阴 阅读(3525) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 28 下一页