随笔分类 -  python_pandas

pandas学习
摘要:指定某行 df = pd.DataFrame(pd.read_excel(excelFile3,header = 3)) 跳过几行 df = pd.DataFrame(pd.read_excel(excelFile3,skiprows=3)) 阅读全文
posted @ 2022-06-14 17:19 豆浆D 阅读(455) 评论(0) 推荐(0) 编辑
摘要:代码 from pathlib import Path import pandas as pd import datetime # 精简报告内容 today = datetime.date.today() df = pd.read_excel('/Users/soymilk/Documents/re 阅读全文
posted @ 2022-05-25 15:21 豆浆D 阅读(586) 评论(0) 推荐(0) 编辑
摘要:方法一 引入包 import pandas as pd from openpyxl.utils import get_column_letter from pandas import ExcelWriter import numpy as np 自适应函数 def to_excel_auto_col 阅读全文
posted @ 2022-05-25 15:19 豆浆D 阅读(4472) 评论(0) 推荐(0) 编辑
摘要:今天在处理表格的时候碰到要按一定的条件修改pandas某列的值,感觉突然不会了,特此来整理一下加强记忆。 表格简单来说大概长上面这个样子,因为要处理考试成绩的内容,所以需要把中文全部修改成0或者其他 直接上代码,做个记录 import pandas as pd csv = pd.read_excel 阅读全文
posted @ 2022-05-13 15:38 豆浆D 阅读(1288) 评论(0) 推荐(0) 编辑
摘要:一张图解释 df = pd.read_excel('test.xlsx', index_col='NAME') # df.loc('卖家登录')['IS_EXE'] 就不是唯一 阅读全文
posted @ 2022-02-17 15:19 豆浆D 阅读(186) 评论(0) 推荐(0) 编辑
摘要:Pandas Replace NaN with blank/empty string 我有一个Pandas Dataframe,如下所示: 1 2 3 0 a NaN read 1 b l unread 2 c NaN read 我想用空字符串删除NaN值,以便它看起来像这样: 1 2 3 0 a 阅读全文
posted @ 2022-01-27 20:36 豆浆D 阅读(2468) 评论(0) 推荐(1) 编辑
摘要:代码 '''读取目录下所有模板文件,_temp.xlsx结尾''' exe_excel_names = glob.glob("static/data/*_temp.xlsx") # 获取所有sheet名字 excel_path = Path('static/data/test_tpl.xlsx') 阅读全文
posted @ 2022-01-26 16:56 豆浆D 阅读(1240) 评论(0) 推荐(0) 编辑
摘要:1、使用 set_index() 在 Pandas DataFrame 中指定列作为索引2、使用 read_excel 或 read_csv 中的 index_col 参数在 Pandas DataFrame 中将列作为索引 通常,在 Pandas Dataframe 中,我们默认以 0 到对象长度 阅读全文
posted @ 2022-01-12 17:20 豆浆D 阅读(19816) 评论(0) 推荐(0) 编辑
摘要:方法 DataFrame.drop_duplicates(subset=None, keep='first', inplace=False) 参数 subset : column label or sequence of labels, optional 用来指定特定的列,默认所有列 keep : 阅读全文
posted @ 2020-11-10 14:15 豆浆D 阅读(4563) 评论(0) 推荐(0) 编辑
摘要:python pandas自定义函数 pandas是数据分析的利器,它内置许多的函数,我之前的一篇博客对pandas的一些常用函数都做了介绍,但是很多时候光是他本身自带的函数可能还不够用,所以这里介绍一下pandas数据类型DataFrame的一个方法,可以让我们的自定义函数运用在上面。下面看一段代 阅读全文
posted @ 2020-11-03 19:01 豆浆D 阅读(446) 评论(0) 推荐(0) 编辑
摘要:一、纵向合并 merge pandas的merge方法提供了一种类似于SQL的内存链接操作,官网文档提到它的性能会比其他开源语言的数据操作(例如R)要高效。 merge的参数 on:列名,join用来对齐的那一列的名字,用到这个参数的时候一定要保证左表和右表用来对齐的那一列都有相同的列名。 left 阅读全文
posted @ 2020-10-27 15:51 豆浆D 阅读(6050) 评论(0) 推荐(0) 编辑
摘要:普通柱状图 ''' 普通柱状图 ''' import pandas as pd import matplotlib.pyplot as plt file = '/tmp/Students2.xlsx' student = pd.read_excel(file) student_filter = st 阅读全文
posted @ 2020-10-23 10:59 豆浆D 阅读(268) 评论(0) 推荐(0) 编辑
摘要:list转化为series data = [1,2,3,4,5,6] array = np.array(data)array_str = array.astype('str') #数据类型转换为字符串 print(array) series转化为list ori_cent_date = pd.rea 阅读全文
posted @ 2020-10-22 17:43 豆浆D 阅读(140) 评论(0) 推荐(0) 编辑
摘要:基本语法 range(start, stop[, step]) 参数说明: start: 计数从 start 开始。默认是从 0 开始。例如range(5)等价于range(0, 5); stop: 计数到 stop 结束,但不包括 stop。例如:range(0, 5) 是[0, 1, 2, 3, 阅读全文
posted @ 2020-10-22 17:11 豆浆D 阅读(484) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示