摘要: filter filter()函数接收一个函数 f 和一个iterable的对象,这个函数 f 的作用是对每个元素进行判断,返回 True或 False,filter()根据判断结果自动过滤掉不符合条件(False)的元素,返回由符合条件元素组成的新可迭代filter对象。 结果:[1, 7, 9, 阅读全文
posted @ 2019-01-04 17:00 wqbin 阅读(246) 评论(0) 推荐(0) 编辑
摘要: 1.数学计算函数 2.集合类操作函数 3.逻辑函数 4.反射函数 compile(source, filename, mode[, flags[, dont_inherit]]) 5.io操作函数 阅读全文
posted @ 2019-01-04 16:13 wqbin 阅读(170) 评论(0) 推荐(0) 编辑
摘要: 前言: 常用: a)Counter: 计数器,用于统计元素的数量 b)OrderDict:有序字典 c)defaultdict:值带有默认类型的字典 d)namedtuple:可命名元组,通过名字来访问元组元素 e)deque :双向队列,队列头尾都可以放,也都可以取(与单向队列对比,单向队列只能一 阅读全文
posted @ 2019-01-04 16:07 wqbin 阅读(688) 评论(0) 推荐(0) 编辑
摘要: 作为一个非理工科的经管学生,在数学基础有限的情况的,理解难免不足。文章多有copy。 参考博客: https://blog.csdn.net/zouxy09/article/details/24971995 1.前言 为什么探讨L0,L1,L2范数,机器学习中出现的非常频繁的问题:过拟合与规则化。 阅读全文
posted @ 2019-01-04 10:31 wqbin 阅读(400) 评论(0) 推荐(0) 编辑
摘要: 1.数仓建模的目标 访问性能:能够快速查询所需的数据,减少数据I/O数据成本:减少不必要的数据冗余,实现计算结果数据复用,降低大数据系统中的存储成本和计算成本使用效率:改善用户应用体验,提高使用数据的效率数据质量:改善数据统计口径的不一致性,减少数据计算错误的可能性,提供高质量的、一致的数据访问平台 阅读全文
posted @ 2019-01-04 09:28 wqbin 阅读(1493) 评论(0) 推荐(0) 编辑
摘要: 1.前言 Spark是基于内存的计算,而Hadoop是基于磁盘的计算;Spark是一种内存计算技术。 但是事实上,不光Spark是内存计算,Hadoop其实也是内存计算。 Spark和Hadoop的根本差异是多个任务之间的数据通信问题:Spark多个任务之间数据通信是基于内存,而Hadoop是基于磁 阅读全文
posted @ 2019-01-04 09:19 wqbin 阅读(7352) 评论(6) 推荐(2) 编辑
摘要: 需求:同事让我写一个python代码实现对某一文件下所有sql文件中的sql语句进行扫描,观察每个sql判断每个table是作为中间表,结果表还是依赖表。 思路当然是用正则去匹配; 我们先复习一下什么是三个表究竟是啥? 阅读全文
posted @ 2019-01-03 22:07 wqbin 阅读(1453) 评论(0) 推荐(0) 编辑
摘要: 1.一维数组中寻找与某个数最近的数 随机数组: [0.87249114 0.64595395 0.10142435 0.46202885 0.15948433 0.53886897 0.17802543 0.0885369 0.9859855 0.92086206 0.94694556 0.9814 阅读全文
posted @ 2019-01-03 10:32 wqbin 阅读(439) 评论(0) 推荐(0) 编辑
摘要: 1.import numpy as npZ=np.random.randint(0,10,(5,5)) print("排序前:\n",Z) print("Z[:,2]:\n",Z[:,2],type(Z[:,2])) print("Z[:,2].argsort:\n",Z[:,2].argsort( 阅读全文
posted @ 2019-01-03 09:42 wqbin 阅读(307) 评论(0) 推荐(0) 编辑
摘要: numpy.random.uniform介绍: 1. 函数原型: numpy.random.uniform(low,high,size) ==》也即其他函数是对该函数的进一步封装 功能:从一个均匀分布[low,high)中随机采样,注意定义域是左闭右开,即包含low,不包含high. 参数介绍: l 阅读全文
posted @ 2019-01-03 09:31 wqbin 阅读(778) 评论(0) 推荐(0) 编辑