TensorFlow 数据 前期准备工作

test = pd.read_csv("F:\\kaggle_data\\test.csv")
PRINT一下看看格式test.dtypes
例子:
types = {'fare_amount': 'float32',
         'pickup_longitude': 'float32',
         'pickup_latitude': 'float32',
         'dropoff_longitude': 'float32',
         'dropoff_latitude': 'float32',
         'passenger_count': 'uint8'}

train数据过大,可以直接提前定义好。train = pd.read_csv('../input/train.csv',nrows=100000,dtype=types)


检查有没有缺失值
train.isnull().sum()

 

 

 


posted @ 2018-09-11 15:29  The_kat  阅读(238)  评论(0编辑  收藏  举报