hehe哒

2019年11月14日

摘要： # pandas数据排序 # series的排序： # Series.sort_values(ascending = True,inplace = False) # 参数说明： # ascending：默认为True升序排序，为False降序排序 # inplace ：是否修改原始的Series 阅读全文

posted @ 2019-11-14 09:55 hehe哒阅读(17814) 评论(0) 推荐(0)

2019年11月13日

pandas的settingwithWaring报警

摘要： # 0 读取数据 import pandas as pd df = pd.read_csv("beijing_tianqi_2018.csv") # 换掉温度后面的后缀 df.loc[:,"bWendu"] = df["bWendu"].str.replace("℃","").astype("int 阅读全文

posted @ 2019-11-13 22:17 hehe哒阅读(361) 评论(0) 推荐(0)

pandas对缺失值的处理

摘要： # Pandas对缺失值的处理(判断是否为空、删除or丢弃、填充空值) # pandas使用这些函数处理缺失值： # isnull 和 notnull ：检验是否是空值，可用于series和df # dropna：丢弃、删除缺失值 # axis：删除行还是列，{0 or “index”，1 or “ 阅读全文

posted @ 2019-11-13 21:39 hehe哒阅读(964) 评论(0) 推荐(0)

pandas的数据统计函数

摘要： # 1汇总类统计 # 2唯一去重和按值计数 # 3 相关系数和协方差 import pandas as pd # 0 读取csv数据 df = pd.read_csv("beijing_tianqi_2018.csv") df.head() # 换掉温度后面的后缀 df.loc[:,"bWendu" 阅读全文

posted @ 2019-11-13 17:32 hehe哒阅读(3159) 评论(0) 推荐(0)

pandas 新增数据列（直接赋值、apply，assign、分条件赋值）

摘要： # pandas新增数据列（直接赋值、apply、assign、分条件赋值） # pandas在进行数据分析时，经常需要按照一定条件创建新的数据列，然后进行进一步分析 # 1 直接赋值 # 2 df.apply方法 # 3 df.assig方法 # 4 按条件选择分组分别赋值 import pand 阅读全文

posted @ 2019-11-13 14:48 hehe哒阅读(32293) 评论(0) 推荐(1)

pandas数据查询（数值、列表、区间、条件、函数）

摘要： import pandas as pd # 0 读取数据 df = pd.read_csv("文件路径")#例子是北京一年的天气情况 df.head()#查看表头 # 设定索引为日期，方便按日期进行查询 df.set_index('ymd',inplace = True) print("df.ind 阅读全文

posted @ 2019-11-13 09:42 hehe哒阅读(7194) 评论(2) 推荐(1)

2019年11月12日

pandas数据读取（DataFrame & Series）

摘要： 1、pandas数据的读取 pandas需要先读取表格类型的数据，然后进行分析数据说明说明 pandas读取方法 csv、tsv、txt 用逗号分割、tab分割的纯文本文件 pd.read_csv excel 微软xls或者xlsx文件 pd.read_excel mysql 关系向数据库表 p 阅读全文

posted @ 2019-11-12 22:26 hehe哒阅读(17466) 评论(0) 推荐(0)

2019年11月8日

simrank python实现

摘要： 1、数据 pc,hp.com pc,hp.com pc,hp.com pc,hp.com pc,hp.com pc,hp.com pc,hp.com pc,hp.com pc,hp.com pc,hp.com camera,hp.com camera,hp.com camera,hp.com cam 阅读全文

posted @ 2019-11-08 17:22 hehe哒阅读(1573) 评论(0) 推荐(0)

2019年11月6日

FM

摘要： 1、FM （因子分解机） 2、FM的作用：（1）特征组合是许多机器学习建模过程中遇到的问题，如果对特征直接进行建模，很可能会忽略掉特征与特征之间的关联信息，因此，可以通过构建新的交叉特征这一特征组合方式提高模型的效果。（2）高维的稀疏矩阵是实际工程过程中常见的问题，并直接回导致计算量过大，特征权阅读全文

posted @ 2019-11-06 16:00 hehe哒阅读(416) 评论(0) 推荐(0)

2019年11月2日

python数据处理

摘要： # 读取数据（最好使用 object 类型读取）读取的时候用object读取，防止有些数据读不了： data = pd.read_excel("朝阳医院2018年销售数据.xlsx", dtype="object") # 修改为 DataFrame 格式 dataDF = pd.DataFrame( 阅读全文

posted @ 2019-11-02 17:44 hehe哒阅读(576) 评论(0) 推荐(0)

公告