示例页面
摘要: 在对数据处理的过程中,经常会用到对不同阈值的数据贴上不同的标签,或者将连续数据转换成分类数据,pandas中的cut函数可以较好解决数据划分不同标签问题。 pandas.cut函数语法: pandas.cut(x, bins, right=True, labels=None, retbins=Fal 阅读全文
posted @ 2022-04-02 22:12 没有风格的Wang 阅读(2204) 评论(0) 推荐(0) 编辑
摘要: 魔法命令 魔法命令是python中的一种快捷方式,通常是 % 加上指定函数,就可快速执行该命令。 魔法命令 含义 示例 %time 对代码行测速 %time sum(range(100000)) %timeit 类似%time,但是%timeit可以统计多次运行后的测速结果 %timeit sum( 阅读全文
posted @ 2022-03-22 15:34 没有风格的Wang 阅读(81) 评论(0) 推荐(0) 编辑
摘要: pyecharts echarts import pyecharts.options as opts from pyecharts.charts import Funnel """ Gallery 使用 pyecharts 1.1.0 参考地址: https://echarts.apache.org 阅读全文
posted @ 2021-11-21 12:22 没有风格的Wang 阅读(257) 评论(0) 推荐(0) 编辑
摘要: import matplotlib.dates as mdate import matplotlib.pyplot as plt import tushare as ts import pandas as pd import datetime %matplotlib inline plt.rcPar 阅读全文
posted @ 2021-11-20 17:46 没有风格的Wang 阅读(1163) 评论(0) 推荐(0) 编辑
摘要: shape:查看数组的维度 shape(12,)代表一维12列数组 reshape((m,n)) :修改数组的维度 flatten() :将多维数组展平为一维数组 arange([start,] stop[, step,], dtype=None) :返回等差序列 np.zeros(shape, d 阅读全文
posted @ 2021-11-18 15:18 没有风格的Wang 阅读(74) 评论(0) 推荐(0) 编辑
摘要: 主要使用matplotlib包里的pyplot函数进行绘图 写在前面 通过python进行绘图经常会遇到图中的中文无法正常显示,坐标轴的负数无法正常显示问题,以下是解决方案: 先查看当下系统有哪些字体 import matplotlib mpl_fonts=sorted([f.name for f 阅读全文
posted @ 2021-10-13 12:01 没有风格的Wang 阅读(545) 评论(0) 推荐(0) 编辑
摘要: 原始数据集如下: group by语法 对数据集进行聚合操作,主要是通过group by子句实现,如下(按照name,对每个人的id进行汇总): 但是当希望在一段sql语法中,实现较复杂的聚合操作,则可以通过presto中的GROUPING SETS,CUBE和ROLLUP语法实现。 复杂的分组操作 阅读全文
posted @ 2021-04-19 14:23 没有风格的Wang 阅读(2593) 评论(0) 推荐(0) 编辑
摘要: 1、开窗函数是什么? 开窗函数用于为行定义一个窗口(这里的窗口是指运算将要操作的行的集合),它对一组值进行操作,不需要使用GROUP BY子句对数据进行分组,能够在同一行中同时返回基础行的列和聚合列。 2、开窗函数有什么用? 开窗函数的功能本质是聚合,但是相比聚合,开窗函数可以提供的信息更多。 3、 阅读全文
posted @ 2021-04-16 17:18 没有风格的Wang 阅读(1572) 评论(0) 推荐(1) 编辑
摘要: 打开 anaconda prompt 输入conda list 即可查看已经安装好的库 如果要安装没有的库,输入 anaconda search -t conda tensorflow 可先搜索,以便获知可以安装的版本有哪些 使用 anaconda show 文件名 就会告诉如何安装对应的库 CMD 阅读全文
posted @ 2021-03-02 10:56 没有风格的Wang 阅读(1433) 评论(0) 推荐(0) 编辑
摘要: python 缺失值用np.nan表示,默认情况下,在计算中是会自动忽略。 创建数据集 import pandas as pd import numpy as np index = pd.date_range('2021-02-01',periods=5) # np.random.randn(5,4 阅读全文
posted @ 2021-02-20 10:51 没有风格的Wang 阅读(1269) 评论(0) 推荐(0) 编辑