摘要: 分组统计在实际应用中是非常多的。比如:对不同地区的销售量的统计,不同班级的分数统计,同一月份的统计等。比如查询每个月最高气温。 先通过分组groapby方法查出每个月的聚合数据,而且再利于agg进行max计算。 group_data=df.groupby('month').agg({'bWendy' 阅读全文
posted @ 2020-07-23 19:32 hisweetyGirl 阅读(380) 评论(0) 推荐(0) 编辑
摘要: 以天气为例 用agg传入一个字典,多个对比参数。比如天气的最大值,最小值,均值做比较。 阅读全文
posted @ 2020-07-21 21:23 hisweetyGirl 阅读(724) 评论(0) 推荐(0) 编辑
摘要: df.append(df2,ignore_index=False),按行添加 阅读全文
posted @ 2020-07-21 20:02 hisweetyGirl 阅读(133) 评论(0) 推荐(0) 编辑
摘要: Pandas的Merge相当于sql的join,将不同的表关联在一个表 #读取电影数据,sep为分割符 df_ratings=pd.read_csv(r'...\datas\movielens-1m\ratings.dat',sep='',engine='python',names='UserIDM 阅读全文
posted @ 2020-07-21 19:41 hisweetyGirl 阅读(191) 评论(0) 推荐(0) 编辑
摘要: `#读取目标excel表,忽略前面2行 df=pd.read_excel(r'F:\人工智能_优学\Pandas-learn-code\pandas-learn-code\datas\student_excel\student_excel.xlsx',skiprows=2) #去掉所有为NaN的列, 阅读全文
posted @ 2020-07-20 20:26 hisweetyGirl 阅读(584) 评论(0) 推荐(0) 编辑
摘要: 1.汇总类统计 2.唯一去重和按值计数 3.相关系统和协方差 阅读全文
posted @ 2020-07-20 20:00 hisweetyGirl 阅读(123) 评论(0) 推荐(0) 编辑
摘要: 直接赋值、apply、assign、分条件赋值 仍旧以天气数据为案例 第一步:清洗数据 df.loc[:,'bWendu']=df['bWendu].str.replace('C','').astype('int32') 上图包含了直接赋值方法 第二、apply方法 df['wendu_type'] 阅读全文
posted @ 2020-07-20 19:28 hisweetyGirl 阅读(501) 评论(0) 推荐(0) 编辑
摘要: 按数值、列表、区间、条件、函数五种方法。 Pandas查询数据的几种方法 1.df.loc(),根据行、列的标签值查询(推荐使用) 2.df.iloc(),根据行、列的数值查询(不推荐使用) 3.df.where()方法 4.df.query()方法 重点 Pandas使用df.loc查询数据的方法 阅读全文
posted @ 2020-07-20 19:09 hisweetyGirl 阅读(9501) 评论(0) 推荐(0) 编辑
摘要: 在实际调试selenium自动化程序时,总是需要重新开启浏览器。以下方法解决不断重启浏览器问题。 我们需要手动打开浏览器,进入到所需的页面,执行一些手动任务,如输入表单、输入验证码,登陆成功后,然后再开始运行自动化脚本。 这种情况下如何使用selenium来接管先前已打开的浏览器呢? 这里给出Goo 阅读全文
posted @ 2020-07-18 17:08 hisweetyGirl 阅读(5232) 评论(0) 推荐(0) 编辑
摘要: 由于调度系统的定时任务通过ws://10.200.9.183:2017/(ws:webservce服务0可以从浏览器的console控制台获取到。 向webservice发送'first:koala',即可查询到定时任务。 import asyncio import logging from dat 阅读全文
posted @ 2020-07-16 20:19 hisweetyGirl 阅读(511) 评论(0) 推荐(0) 编辑