09 2020 档案

7. 基于MLlib的机器学习

摘要：基于MLlib的机器学习（操作向量、特征提取、特征标准化、分类、回归、聚类、降维）阅读全文

posted @ 2020-09-23 11:52 Alvin_Ai 阅读(385) 评论(0) 推荐(0) 编辑

6. Spark SQL和Beeline

摘要：Spark SQL和Beeline 阅读全文

posted @ 2020-09-22 23:19 Alvin_Ai 阅读(1991) 评论(0) 推荐(0) 编辑

5. Spark调优

摘要：Spark调优（并行度调优、序列化格式优化、内存管理优化、Spark SQL性能优化）阅读全文

posted @ 2020-09-22 20:53 Alvin_Ai 阅读(196) 评论(0) 推荐(0) 编辑

4. Spark在集群上运行

摘要：Spark在集群上运行的知识点阅读全文

posted @ 2020-09-22 20:17 Alvin_Ai 阅读(400) 评论(0) 推荐(0) 编辑

3. Spark常见数据源

摘要：Spark常见数据源（文件格式与文件系统：文本文件\JSON\CSV\SequenceFile；Spark SQL中的结构化数据源；数据库与键值存储）阅读全文

posted @ 2020-09-22 10:57 Alvin_Ai 阅读(2464) 评论(0) 推荐(0) 编辑

2. RDD(弹性分布式数据集Resilient Distributed dataset)

摘要：RDD：创建RDD和操作RDD(转化操作和行动操作) 阅读全文

posted @ 2020-09-21 20:53 Alvin_Ai 阅读(334) 评论(0) 推荐(0) 编辑

1. Spark的安装及介绍

摘要：Spark的安装及介绍阅读全文

posted @ 2020-09-21 18:09 Alvin_Ai 阅读(1085) 评论(0) 推荐(0) 编辑

关于情感分类(Sentiment Classification)的文献整理

摘要：关于情感分类(Sentiment Classification)的文献整理阅读全文

posted @ 2020-09-05 19:09 Alvin_Ai 阅读(2694) 评论(0) 推荐(0) 编辑

3. Hive相关知识点

摘要：Hive相关知识点阅读全文

posted @ 2020-09-02 19:40 Alvin_Ai 阅读(463) 评论(0) 推荐(0) 编辑

2. Hive常见操作命令整理

摘要：Hive常见操作命令整理阅读全文

posted @ 2020-09-02 16:34 Alvin_Ai 阅读(1844) 评论(0) 推荐(1) 编辑

1. 安装虚拟机，Hadoop和Hive

摘要：安装虚拟机，Hadoop和Hive 阅读全文

posted @ 2020-09-02 09:57 Alvin_Ai 阅读(1738) 评论(0) 推荐(0) 编辑

公告

昵称： Alvin_Ai
园龄： 5年5个月
粉丝： 19
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

Alvin Ai

毕业于曼彻斯特大学数据科学研究生 | 现居深圳 | 兴趣领域：数据挖掘，机器学习及计算机视觉 | 个人公众号：zaicode 宅码

09 2020 档案

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

Alvin Ai

毕业于 曼彻斯特大学 数据科学 研究生 | 现居深圳 | 兴趣领域：数据挖掘，机器学习及计算机视觉 | 个人公众号：zaicode 宅码

09 2020 档案

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

毕业于曼彻斯特大学数据科学研究生 | 现居深圳 | 兴趣领域：数据挖掘，机器学习及计算机视觉 | 个人公众号：zaicode 宅码