上一页 1 2 3 4 5 6 7 ··· 13 下一页
摘要: # pandas数据排序 # series的排序: # Series.sort_values(ascending = True,inplace = False) # 参数说明: # ascending:默认为True升序排序,为False降序排序 # inplace : 是否修改原始的Series 阅读全文
posted @ 2019-11-14 09:55 hehe哒 阅读(17647) 评论(0) 推荐(0) 编辑
摘要: # 0 读取数据 import pandas as pd df = pd.read_csv("beijing_tianqi_2018.csv") # 换掉温度后面的后缀 df.loc[:,"bWendu"] = df["bWendu"].str.replace("℃","").astype("int 阅读全文
posted @ 2019-11-13 22:17 hehe哒 阅读(345) 评论(0) 推荐(0) 编辑
摘要: # Pandas对缺失值的处理(判断是否为空、删除or丢弃、填充空值) # pandas使用这些函数处理缺失值: # isnull 和 notnull :检验是否是空值,可用于series和df # dropna:丢弃、删除缺失值 # axis:删除行还是列,{0 or “index”,1 or “ 阅读全文
posted @ 2019-11-13 21:39 hehe哒 阅读(898) 评论(0) 推荐(0) 编辑
摘要: # 1汇总类统计 # 2唯一去重和按值计数 # 3 相关系数和协方差 import pandas as pd # 0 读取csv数据 df = pd.read_csv("beijing_tianqi_2018.csv") df.head() # 换掉温度后面的后缀 df.loc[:,"bWendu" 阅读全文
posted @ 2019-11-13 17:32 hehe哒 阅读(3098) 评论(0) 推荐(0) 编辑
摘要: # pandas新增数据列(直接赋值、apply、assign、分条件赋值) # pandas在进行数据分析时,经常需要按照一定条件创建新的数据列,然后进行进一步分析 # 1 直接赋值 # 2 df.apply方法 # 3 df.assig方法 # 4 按条件选择分组分别赋值 import pand 阅读全文
posted @ 2019-11-13 14:48 hehe哒 阅读(31073) 评论(0) 推荐(1) 编辑
摘要: import pandas as pd # 0 读取数据 df = pd.read_csv("文件路径")#例子是北京一年的天气情况 df.head()#查看表头 # 设定索引为日期,方便按日期进行查询 df.set_index('ymd',inplace = True) print("df.ind 阅读全文
posted @ 2019-11-13 09:42 hehe哒 阅读(7098) 评论(2) 推荐(1) 编辑
摘要: 1、pandas数据的读取 pandas需要先读取表格类型的数据,然后进行分析 数据说明 说明 pandas读取方法 csv、tsv、txt 用逗号分割、tab分割的纯文本文件 pd.read_csv excel 微软xls或者xlsx文件 pd.read_excel mysql 关系向数据库表 p 阅读全文
posted @ 2019-11-12 22:26 hehe哒 阅读(17331) 评论(0) 推荐(0) 编辑
摘要: 1、数据 pc,hp.com pc,hp.com pc,hp.com pc,hp.com pc,hp.com pc,hp.com pc,hp.com pc,hp.com pc,hp.com pc,hp.com camera,hp.com camera,hp.com camera,hp.com cam 阅读全文
posted @ 2019-11-08 17:22 hehe哒 阅读(1520) 评论(0) 推荐(0) 编辑
摘要: 1、FM (因子分解机) 2、FM的作用: (1)特征组合是许多机器学习建模过程中遇到的问题,如果对特征直接进行建模,很可能会忽略掉特征与特征之间的关联信息,因此,可以通过构建新的交叉特征这一特征组合方式提高模型的效果。 (2)高维的稀疏矩阵是实际工程过程中常见的问题,并直接回导致计算量过大,特征权 阅读全文
posted @ 2019-11-06 16:00 hehe哒 阅读(395) 评论(0) 推荐(0) 编辑
摘要: # 读取数据(最好使用 object 类型读取)读取的时候用object读取,防止有些数据读不了: data = pd.read_excel("朝阳医院2018年销售数据.xlsx", dtype="object") # 修改为 DataFrame 格式 dataDF = pd.DataFrame( 阅读全文
posted @ 2019-11-02 17:44 hehe哒 阅读(536) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 ··· 13 下一页