摘要:
pandas是 基于NumPy数组构建的,特别是基于数组的函数和不使用for循环的数据处理 相关联的几个库, 分析库 scikit-learn 和 statsmodels 数值计算工具,NumPy 可视化图库,matplotlib pandas是专门为处理表格和混杂数据设计的.专注于清理数据. 基础 阅读全文
摘要:
我按照书籍上下,随便生成了个随机漫步图.确实是我没有想到. 抛出五百次0,1 然后上下作画,写成了折线图 import random import matplotlib.pyplot as plt postion = 0 walk = [postion] steps = 1000 for i in 阅读全文
摘要:
说实话,我就不知这个是干什么的. 菜鸟教程写的无需实例化, 自己可以调用自己. 在同一个类面我使用到了 因为一个类了, 我可能会方法间互相调用. 类中间使用.不加这个,就会报错.无法识别这个 origin_items.说到这里,我还得得给代码加个高亮.法克 j @staticmethod class 阅读全文
摘要:
lambda 函数 其实对应的是一个简单的表达式: lambda [arg1] : expression a = lambda x,y: (x+y)/2 等价于 def a(x,y): (x+y)/2 这种. 阅读全文
摘要:
c 阅读全文
摘要:
这个函数相当于拆开行变成列。 可以理解为行转列。 select id,order_label from table_bx lateral view explode(split(work_order_label, ',')) order_label as order_label 源表: Array<i 阅读全文
摘要:
日后用的着的时候再说,存下来。方便日后查看 NumPy数组使你可以将许多种数据处理任务表述为简洁的数组表达式(否则需要编写循环)。用数组表达式代替循环的做法,通常被称为矢量化。 原来一直不明白什么叫矢量化。 明天应该能看完Numpy . 啥时候看看100天成为python 大师那个项目. 阅读全文
摘要:
定义: ndarray,一个具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组。用于对整组数据进行快速运算的标准数学函数(无需编写循环)。用于读写磁盘数据的工具以及用于操作内存映射文件的工具。线性代数、随机数生成以及傅里叶变换功能。用于集成由C、C++、Fortran等语言编写的代码的A C 阅读全文
摘要:
pass 阅读全文
摘要:
碰到个小问题, 因为需要更改excel 的行为。 处理最多的还是excel的事, 不过看起来是excel。实际上对pandas 的库的熟悉。读取,更改,应用等等,方法。 十分有用。 先说需求,本来的表格形式为: 需要变成: 网上找了篇链接,移动非空单元格的。 https://stackoom.com 阅读全文