03 2022 档案

摘要:shutil # 1)删除文件夹 shutil.retree(path) # 同时删除其中的文件 # 2)移动文件(夹) shutil.move('要移动的文件或者文件夹', '移动到那个位置') # 3) 复制文件 shutil.copy('文件路径', '复制到那个位置') # 4)复制A文件夹 阅读全文
posted @ 2022-03-08 20:47 aall_blue 阅读(44) 评论(0) 推荐(0) 编辑
摘要:""" 将列式数据变成二维交叉形式,便于分析,叫做重塑或者透视 1)经过统计得到多维度指标数据 2)使用unstack实现数据二维透视 3)使用pivot简化透视 4)stack,unstack,pivot的语法 """ import pandas as pd import numpy as np 阅读全文
posted @ 2022-03-08 16:52 aall_blue 阅读(62) 评论(0) 推荐(0) 编辑
摘要:数据转换函数map,apply,applymap # 1)map用于Series值的转换 将股票代码英文转换成中文名字 Series.map(dict) or Series.map(function) 都可以 # 公司股票代码到中文的映射,这里都是小写 dict_company_names = { 阅读全文
posted @ 2022-03-08 16:48 aall_blue 阅读(133) 评论(0) 推荐(0) 编辑
摘要:# 1)Series的分层索引MultiIndex ser = df.groupby(['公司', '日期'])['收盘'].mean() 多维索引中,空白的意思是:使用上面的值 ser.unstack() unstack把二级索引变成列 # 日期 10-1-2019 10-2-2019 10-3- 阅读全文
posted @ 2022-03-08 16:44 aall_blue 阅读(70) 评论(0) 推荐(0) 编辑
摘要:import pandas as pd import numpy as np df = pd.DataFrame({ 'A':['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'], 'B':['one', 'one', 'two', 'th 阅读全文
posted @ 2022-03-08 16:42 aall_blue 阅读(76) 评论(0) 推荐(0) 编辑
摘要:# 需求:将Excel中的任务均等分配给多个人?在Excel中新增一列分配任务的每个人的人名。 # 1)将一个大的Excel等扽拆成多个Excel,使用df.iloc方法,将一个大的dataframe,拆分成多个小的dataframe # 将使用dataframe.to_excel保存每个小Exce 阅读全文
posted @ 2022-03-08 16:34 aall_blue 阅读(158) 评论(0) 推荐(0) 编辑
摘要:Merge合并语法 # 第一个表: df_ratings = pd.read_csv( 'data/ratings.csv', sep=',', engine='python', names='UserID,MovieID,Rating,Timestamp'.split(',') ) # 第二个表: 阅读全文
posted @ 2022-03-08 16:30 aall_blue 阅读(496) 评论(0) 推荐(0) 编辑
摘要:# 1)使用index查询数据 drop==False,列索引还保持在column: df.set_index('userId', inplace=True, drop=False) # DataFrame设置索引,drop=False不删除这一列数据 # 2)使用index的查询方式 查询user 阅读全文
posted @ 2022-03-08 16:20 aall_blue 阅读(45) 评论(0) 推荐(0) 编辑
摘要:排序 # 1)Series排序 df['aqi'].sort_values() # 升序 df['aqi'].sort_values(ascending=False) # 降序 # 2)DataFrame的排序 # 2.1)单列排序: df.sort_values(by='aqi') # 升序 df 阅读全文
posted @ 2022-03-08 16:13 aall_blue 阅读(254) 评论(0) 推荐(0) 编辑
摘要:import requests url_data = request.get(url, timeout=5) url_data.content # 返回二进制,经过property装饰器装饰的方法 阅读全文
posted @ 2022-03-08 16:00 aall_blue 阅读(20) 评论(0) 推荐(0) 编辑
摘要:from concurrent.futures import ThreadPoolExecutor with ThreadPoolExecutor(max_workers=50) as e: # 第一个down_img为函数,后面url_hour,file_dir,img_name为参数 e.sub 阅读全文
posted @ 2022-03-08 15:23 aall_blue 阅读(24) 评论(0) 推荐(0) 编辑
摘要:# 1)读取数据: df = pd.read_excel('file_path', skiprows=2) 跳过2个空行的数据不读取 # 2)检测空值: df.isnull() # 所有检测,对应的df.notnull() 为True说明有值 df['分数'].isnull() # 单列检测 # 3 阅读全文
posted @ 2022-03-06 14:44 aall_blue 阅读(71) 评论(0) 推荐(0) 编辑
摘要:新增修改数据 # 1)新增Series s1 = pd.Series(list(range(4)), name='F') # 2)新增DataFrame的数据 df = df.append({'A':i}, ignore_index=True) # 3)使用concat新增DataFrame数据 p 阅读全文
posted @ 2022-03-06 14:39 aall_blue 阅读(72) 评论(0) 推荐(0) 编辑
摘要:Series import pandas as pd # 1)直接读取列表数据 s1 = pd.Series([1, 'a', 3.3, 66]) s1.index # 查看索引 s1.values # 获取值 # 2)指定索引读取 s2 = pd.Series([1, 'a', 5.2, 44], 阅读全文
posted @ 2022-03-06 14:22 aall_blue 阅读(153) 评论(0) 推荐(0) 编辑
摘要:1)读取输出文件 import pandas as pd # 1)读取csv df = pd.read_csv(path) df.head() # 查看前几行数据 df.shape # 查看数据的形状,返回(行数,列数) df.columns # 查看列名列表 df.index # 查看索引列 df 阅读全文
posted @ 2022-03-06 13:52 aall_blue 阅读(148) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示