上一页 1 ··· 348 349 350 351 352 353 354 355 356 ··· 376 下一页
摘要: https://zhuanlan.zhihu.com/p/66540160 常规分列 我们最常见的就是有固定分隔符的规范数据,这种直接就按照分隔符拆分就可以了, 如果没有分割符怎么办?依然是上面的数据,如果连逗号都没有呢,在Powerquery中还可以按从数字到非数字的转换来分列, 拆分列的常规功能 阅读全文
posted @ 2020-05-07 15:00 秋华 阅读(1594) 评论(0) 推荐(0) 编辑
摘要: https://zhuanlan.zhihu.com/p/130460772 ​今天分享一个PowerQuery的小技巧,导入到PowerBI中的数据,如果想要更改数据的列名,可以在PQ编辑器中直接双击列名,如果需要修改的列名比较多,还可以批量修改,利用这个M函数:Table.RenameColum 阅读全文
posted @ 2020-05-07 14:58 秋华 阅读(3123) 评论(0) 推荐(0) 编辑
摘要: 本文来源于一个星友的问题,他有上百个Excel表格,格式并不完全一样,列的位置顺序也不同,但每个表都有几个共同列,这种情况下,能不能通过Power Query把这些表格共同的列批量合并呢? 当然是可以的! 我模拟了三个表,源数据的情况大致是这样的, 这三个表之间的特征如下: 有共同列 列的位置顺序是 阅读全文
posted @ 2020-05-07 14:56 秋华 阅读(2604) 评论(0) 推荐(0) 编辑
摘要: https://zhuanlan.zhihu.com/p/64419762 每当拿到原始数据,不如意十有八九,快速准确的清洗数据也是必备技能,数据清洗正好是 PowerQuery 的强项,本文就来介绍两个常用的 M 函数:Text.Remove 和 Text.Select。 看到以 Text 开头的 阅读全文
posted @ 2020-05-07 14:55 秋华 阅读(7197) 评论(0) 推荐(0) 编辑
摘要: https://zhuanlan.zhihu.com/p/69187094 数据分析的源数据应该是规范的,而规范的其中一个标准就是数据源应该是一维表,它会让之后的数据分析工作变得简单高效。 在之前的文章中,我也经常强调一维表的易用性,也时常有人问我,什么是一维表,为什么要转为一维表呢,这篇文章就来帮 阅读全文
posted @ 2020-05-07 14:52 秋华 阅读(4369) 评论(0) 推荐(1) 编辑
摘要: https://zhuanlan.zhihu.com/p/64415763 使用Power Query进行复杂一些的数据处理,离不开M函数,目前已经有超过700个函数了,基本上各式各样的数据处理需求都可以使用M函数实现,如果你觉得这些还不够,或者使用起来不是很方便,也可以在PQ中自定义函数。 自定义 阅读全文
posted @ 2020-05-07 14:50 秋华 阅读(5878) 评论(0) 推荐(0) 编辑
摘要: https://zhuanlan.zhihu.com/p/81846862 PowerQuery中,对两列或者多列的计算一般通过添加自定义列来实现,以下表为例, 如果需要1月和2月数据的合计,可以添加自定义列, 其实还有一种更方便的方式,不用动手输入任何字符,点点鼠标就可以完成,这个功能就在这里: 阅读全文
posted @ 2020-05-07 14:49 秋华 阅读(3212) 评论(0) 推荐(0) 编辑
摘要: https://zhuanlan.zhihu.com/p/81535007 星友们在知识星球(PowerBI星球)提出的问题中,关于空值的运算经常被提及。平时接触到的源数据常常有空值,比如Excel数据中的空白单元格,powerquery中会显示为null,大多数时候,我们并不能简单粗暴的删除其中的 阅读全文
posted @ 2020-05-07 14:48 秋华 阅读(8650) 评论(0) 推荐(0) 编辑
摘要: 1 泛化误差 学习方法的泛化能力(generalization ability)是指由该方法学习到的模型对未知数据的预测能力,是学习方法本质重要的性质。 泛化误差反映了学习方法的泛化能力,如果一种方法学习的模型比另一种方法学习的模型具有更小的泛化误差,那么这种方法就更有效。事实上,泛化误差就是所学习 阅读全文
posted @ 2020-05-03 19:39 秋华 阅读(579) 评论(0) 推荐(0) 编辑
摘要: 正则化与交叉验证用于模型选择 1 正则化 正则化是结构风险最小化策略的实现,是在经验风险上加一个正则化项(regularizer)或罚项(penalty iterm )。正则化项一般是模型复杂度的单调递增函数,模型越复杂,正则化值就越大。比如,正则化项可以是模型参数向量的范数。 正则化一般形式: 正 阅读全文
posted @ 2020-05-03 18:55 秋华 阅读(283) 评论(0) 推荐(0) 编辑
上一页 1 ··· 348 349 350 351 352 353 354 355 356 ··· 376 下一页