深度学习--数据预处理
数据预处理
import os
import pandas as pd
import torch
#创建csv文件
os.makedirs(os.path.join('..','data'),exist_ok=True)
data_file=os.path.join('..','data','house_tiny.csv')
#往文件里写内容
with open(data_file,'w') as f:
f.write('NumRooms,Alley,Price\n')
f.write('NA,PAVE,127500\n')
f.write('2.0,NA,106000\n')
f.write('4.0,NA,178100\n')
f.write('NA,NA,140000\n')
#通过pandas库读取csv文件
data=pd.read_csv(data_file)
print(data)
#数据处理
inputs, outputs = data.iloc[:, 0:2], data.iloc[:, 2]#iloc指的是indexlocation下标位置
#要先处理缺失字符串再处理缺失数字
inputs = pd.get_dummies(inputs, dummy_na=True)#增加的列 Alley_PAVE表示是均值, Alley_nan表示不是数字-->对字符串处理
inputs = inputs.fillna(inputs.mean())#对数字型缺失填充均值
print(inputs)
#转为张量tensor
X = torch.tensor(inputs.to_numpy(dtype=float))
y = torch.tensor(outputs.to_numpy(dtype=float))
print(X)
print(y)
#最后输出的是64位常规的浮点型对于深度学习一般用32位后续会学!
查看代码
import torch
a=torch.arange(12)
b=a.reshape( 3,4)#reshape函数相当于数据库里的view可以通过改b来修改a
print(b)
b[:]=2
print("-------------------------")
print(b)
print("------------------------")
print(a)
2024/7/28
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)