会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
小茶馆
博客园
首页
新随笔
联系
订阅
管理
2018年3月22日
将数据量很大的CSV写入到HIVE
摘要: 在kaggle下载了一个train.csv,用于测试公司平台决策树算法,该数据有一个label标签和784个特征列,名字如pixel0,pixel1…….pixel783。具体操作如下(pyspark下):from pyspark.sql import Hi...
阅读全文
posted @ 2018-03-22 10:21 小茶馆
阅读(914)
评论(0)
推荐(0)
编辑
公告