小灰灰深度学习day5——数据预处理
内容简介:
1.将数据写入.csv文件中 2.将数据从.csv文件中读出 3.利用插值法处理缺失的数据 4.将数据类型转化为torch张量类型
代码如下:
import os os.makedirs(os.path.join('..', 'data'), exist_ok=True) data_file = os.path.join('..', 'data', 'house_tiny.csv') with open(data_file, 'w') as f: f.write('NumRooms, Alley, Price\n') #列名 f.write('NA, Pave, 127500\n') #每列的数据样本 f.write('2, NA, 106000\n') f.write('4, NA, 178100\n') f.write('NA, NA, 140000\n') import pandas as pd data = pd.read_csv(data_file) print(data) #用插值法处理缺失的数据 inputs, outputs = data.iloc[:, 0:2], data.iloc[:, 2] inputs = inputs.fillna(inputs.mean(numeric_only=True)) #缺省值用未缺省值的平均值填充 print(inputs) inputs = pd.get_dummies(inputs, dummy_na = True) print(inputs) #将数据类型inputs和outputs转换为张量格式 import torch x, y = torch.tensor(inputs.values), torch.tensor(outputs.values) print(x) print(y) ''' ''' import torch a = torch.arange(12) b = a.view((3, 4)) b[:] = 2 print(a) print(b) a = torch.arange(12) b = a.reshape((3, 4)) #reshape和view的作用相同。 b[:] = 2 print(a) print(b) '''