2020年7月9日
摘要: import matplotlib.pyplot as plt import numpy as np x = np.linspace(0, 2 * np.pi, 50) y = np.sin(x) plt.plot(x, y) plt.show() #在一张图纸里绘制多个图形,一起跑就OK了,简简单 阅读全文
posted @ 2020-07-09 18:49 小小喽啰 阅读(197) 评论(0) 推荐(0) 编辑
摘要: 一般左右连接使用merge,join,上下连接使用concat,append 1.merge 如果是多条件 model_data = pd.merge( data_due_outliers_stand,data_due_merge_cate_stand,on=['apply_no','ref_id' 阅读全文
posted @ 2020-07-09 17:31 小小喽啰 阅读(422) 评论(0) 推荐(0) 编辑
摘要: # -*- coding: utf-8 -*- """ Created on Fri Apr 3 14:36:20 2020 @author: Admin """ #使用python进行数据清洗 import pandas as pd dates=pd.date_range('20130101',p 阅读全文
posted @ 2020-07-09 16:52 小小喽啰 阅读(407) 评论(0) 推荐(0) 编辑
摘要: pairplot:pair是成对的意思,即是说这个用来展现变量两两之间的关系,线性、非线性、相关等等 使用鸢尾花数据画图 #两种导入方式,这次是直接从sklearn.datasets导入 import pandas as pd from sklearn import datasets import 阅读全文
posted @ 2020-07-09 16:35 小小喽啰 阅读(16575) 评论(0) 推荐(3) 编辑
摘要: 应用场景:比如说收到一个文件,文件里面有几百个用户,需要按照一定的格式每一个用户生成一个Excel文件 需要生成这样结果: 每个文件格式如下: 代码如下: # -*- coding: utf-8 -*- """ Created on Tue Apr 28 15:16:14 2020 @author: 阅读全文
posted @ 2020-07-09 16:03 小小喽啰 阅读(1144) 评论(3) 推荐(1) 编辑
摘要: 划分数据集方法: 留出法(train_test_split) 交叉验证法 KFold方法 k折交叉验证 RepeatedKFold p次k折交叉验证 LeaveOneOut 留一法 LeavePOut 留P法 ShuffleSplit 随机分配 自助法 一、留出法 留出法的想法很简单,将原始数据直接 阅读全文
posted @ 2020-07-09 15:48 小小喽啰 阅读(4950) 评论(0) 推荐(1) 编辑
摘要: sklearn.datasets 1.波士顿房价数据 #波士顿房价数据集 from sklearn.datasets import load_boston import pandas as pd boston=load_boston() boston.data boston.target bosto 阅读全文
posted @ 2020-07-09 11:25 小小喽啰 阅读(477) 评论(0) 推荐(0) 编辑