数据操作-将一个临时生产的CSV转换为Tensor(向量)

# 首先创建一个临时CSV数据表

复制代码
import os
os.makedirs(os.path.join('..', 'py_data'), exist_ok=True)
data_file = os.path.join('..', 'py_data', 'house_tiny.csv')
with open(data_file, 'w') as f:
    f.write('NumRooms,Alley,Price\n')
    f.write('NA,Pave,127500\n')
    f.write('2,NA,106000\n')
    f.write('4,NA,178100\n')
    f.write('NA,NA,140000\n')
复制代码

# 一步一步进行确实数据处理,最终转换为向量

复制代码
import os
import torch
import pandas as pd
data_file = os.path.join('..', 'py_data', 'house_tiny.csv')
data = pd.read_csv(data_file)
print('First_result:\n', data)

# 为了处理缺失的“数值”,使用“插值”
inputs, outputs = data.iloc[:, 0:2], data.iloc[:, 2]


inputs = inputs.fillna(inputs.mean())
print('Second_result:\n', inputs)

# 为了处理缺失的“字符串”,我们将"NaN"视为一个类别,使用类别值或离散值
inputs = pd.get_dummies(inputs, dummy_na=True)
print('Third_result:\n', inputs)

# 现在inputs和outputs中的所有条目都是数值类型,它们可以转换为张量格式
x, y = torch.tensor(inputs.values), torch.tensor(outputs.values)
print('Final_result:\n', x, y)
复制代码

 

posted @   Cong0ks  阅读(404)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· 单线程的Redis速度为什么快?
· 展开说说关于C#中ORM框架的用法!
· Pantheons:用 TypeScript 打造主流大模型对话的一站式集成库
历史上的今天:
2019-03-29 Phonics 自然拼读法 s,a,t,i,p,n Teacher:Lamb
2019-03-29 English Voice of <<City of stars>>
点击右上角即可分享
微信分享提示