随笔分类 -  Python pandas

摘要:交叉表(cross-tabulation,简称crosstab)是⼀种⽤于计算分组频率的特殊透视表。 语法详解: pd.crosstab(index, # 分组依据 columns, # 列 values=None, # 聚合计算的值 rownames=None, # 列名称 colnames=No 阅读全文
posted @ 2020-07-01 22:47 赏尔 阅读(11205) 评论(0) 推荐(0) 编辑
摘要:透视表是一种可以对数据动态排布并且分类汇总的表格格式。对于熟练使用 excel 的伙伴来说,一定很是亲切! pd.pivot_table() 语法: pivot_table(data, # DataFrame values=None, # 值 index=None, # 分类汇总依据 columns 阅读全文
posted @ 2020-06-29 22:35 赏尔 阅读(23175) 评论(0) 推荐(1) 编辑
摘要:0、创建数据 import random import numpy as np import pandas as pd from string import ascii_uppercase as U_CASES random.seed(19990702) name = sorted([''.join 阅读全文
posted @ 2020-06-19 22:21 赏尔 阅读(3673) 评论(0) 推荐(0) 编辑
摘要:1、extract() # 对每个元素调用 re.match(), 返回匹配的字符串组 示例: 提取其中的汉字 df_p['支付单位'].str.extract('(\w+)\(', expand=False).head() 2、contains() # 对每个元素调用 re.search(), 返 阅读全文
posted @ 2020-06-18 21:30 赏尔 阅读(779) 评论(0) 推荐(0) 编辑
摘要:一、读入数据 import os import pandas as pd path = r'E:\pyspace\数据集' data_file = os.path.join(path, 'income_dist.csv') df = pd.read_csv(open(data_file)) # 因为 阅读全文
posted @ 2020-03-02 22:38 赏尔 阅读(4888) 评论(0) 推荐(0) 编辑
摘要:1、示例 1 代码 import numpy as np import pandas as pd import matplotlib.pyplot as plt # 生成数据 v1 = np.random.normal(0, 1, 100) v2 = np.random.randint(0, 23, 阅读全文
posted @ 2020-01-24 22:26 赏尔 阅读(7970) 评论(0) 推荐(0) 编辑
摘要:示例: path = r'E:\pyspace\数据集' data_file = os.path.join(path, "income_dist.csv") pd.read_csv(data_file) 。。。。。。 原因: 文件名称中包含中文字符。 解决办法有二: 1、更改文件名称,替换其中的中文 阅读全文
posted @ 2019-07-31 22:07 赏尔 阅读(296) 评论(0) 推荐(0) 编辑
摘要:需求: 初始表: Python 代码: import itertools import pandas as pd wb_in = 'E:\\excel_vba\\test.xlsx' df = pd.read_excel(wb_in, sheet_name='Sheet1', header=0) d 阅读全文
posted @ 2019-07-13 22:11 赏尔 阅读(372) 评论(0) 推荐(0) 编辑
摘要:需求: 方法1、 循环插入表、写入值 import os import pandas as pd import openpyxl wb_in = 'E:\\excel_vba\\test.xlsx' df = pd.read_excel(wb_in) wb = openpyxl.load_workb 阅读全文
posted @ 2019-07-12 21:19 赏尔 阅读(1768) 评论(0) 推荐(0) 编辑
摘要:需求: vab 程序 https://www.cnblogs.com/shanger/p/12993804.html vba 的 sub 过程交互性不很好,泛化性也不是很好。 Python 使用 pandas 和 openpyxl 简单明了,泛化性更好。 1、加载包 import pandas as 阅读全文
posted @ 2019-07-11 21:37 赏尔 阅读(2311) 评论(0) 推荐(0) 编辑
摘要:1、 示例1 代码 import matplotlib.pyplot as plt import numpy as np import pandas as pd # 生成数据 rng = np.random.RandomState(27) v = rng.rand(60, 3) df = pd.Da 阅读全文
posted @ 2019-06-20 22:50 赏尔 阅读(1190) 评论(0) 推荐(0) 编辑
摘要:先来几句麦金尼著作里的话: For many datasets, you may wish to perform some transformation based on the values in an array, Series, or column in a DataFrame. The ma 阅读全文
posted @ 2019-06-19 22:24 赏尔 阅读(2303) 评论(0) 推荐(0) 编辑
摘要:在 R 中,用 str() 函数获取数据框的结构,用 summary() 函数获得各特征的概括统计量。 在 python pandas 中用 info() 方法获取数据框的结构, 用 describe() 方法获取个特征的概括统计量。 R 示例: python 示例: 按语: pandas 中,Da 阅读全文
posted @ 2019-06-06 22:52 赏尔 阅读(218) 评论(0) 推荐(0) 编辑
摘要:创建一个示例数据框: import pandas as pd df = pd.DataFrame([['乔峰', '男', 95, '降龙十八掌', '主角'], ['虚竹', '男', 93, '天上六阳掌', '主角'], ['段誉', '男', 92, '六脉神剑', '主角'], ['王语嫣 阅读全文
posted @ 2019-06-05 23:10 赏尔 阅读(12506) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示