画heatmaps取相关系数大的特征。

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from scipy import stats
train_data='zhengqi_train.txt'
test_data='zhengqi_test.txt'
train=pd.read_csv(train_data,sep='\t',encoding='utf-8')
test=pd.read_csv(test_data,sep='\t',encoding='utf-8')
train.drop(['V5','V9','V11','V17','V22','V28'],axis=1)
co=train.corr()
print(co.nlargest(10,'target'))#输出与target相关系数大于10的特征。满足要求指定行和所有列。
print(co.nlargest(10,'target')['target'])#在上一条基础上取出target列
cols=co.nlargest(10,'target')['target'].index#在列上输出索引。
import numpy as np
sns.heatmap(train[cols].corr())#有了列输出特征。
plt.show()

 

 

posted @   祥瑞哈哈哈  阅读(39)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· 写一个简单的SQL生成工具
· AI 智能体引爆开源社区「GitHub 热点速览」
· C#/.NET/.NET Core技术前沿周刊 | 第 29 期(2025年3.1-3.9)
历史上的今天:
2021-12-08 第三章
点击右上角即可分享
微信分享提示