大数据分析———(1)数据导入

本次数据分析在Hadoop大数据平台的基础上,导入外部数据,使用Spark进行数据清洗,使用Hive进行数据存储,同时使用Tableau进行可视化展示。本次使用数据为《NBA2011-2012季后赛球员数据统计》

因初始数据为 .xlsx 格式,为了兼容性着想,首先需要把文件转换为csv格式,使其在Linux中方便读取。

使用Excel打开文件后,点击左上角文件菜单==》另存为,保存类型选择CSV(逗号分隔)格式

转换格式后的数据如下

通过 Xftp4 把文件从 Windows 上传到 Linux ,至此,数据导入的工作完成

 

posted @ 2023-02-18 21:55  来杯明前奶绿  阅读(56)  评论(0编辑  收藏  举报