TensorFlow 数据 前期准备工作
test = pd.read_csv("F:\\kaggle_data\\test.csv")
PRINT一下看看格式test.dtypes
例子:
types = {'fare_amount': 'float32', 'pickup_longitude': 'float32', 'pickup_latitude': 'float32', 'dropoff_longitude': 'float32', 'dropoff_latitude': 'float32', 'passenger_count': 'uint8'}
train数据过大,可以直接提前定义好。train = pd.read_csv('../input/train.csv',nrows=100000,dtype=types)
检查有没有缺失值
train.isnull().sum()