摘要: 在kaggle下载了一个train.csv,用于测试公司平台决策树算法,该数据有一个label标签和784个特征列,名字如pixel0,pixel1…….pixel783。具体操作如下(pyspark下):from pyspark.sql import Hi... 阅读全文
posted @ 2018-03-22 10:21 小茶馆 阅读(914) 评论(0) 推荐(0) 编辑