03 2022 档案

Java基础-类型转换与常用运算符。

摘要：1.自动类型转换，即类型范围小的变量可以直接赋值给类型范围大的变量类型的转换规律：byte -->short-->int-->long-->float-->double char-->int byte a =12; int b = a; System.out.println(b);//12 2.表阅读全文

posted @ 2022-03-30 01:17 LINwenguan 阅读(65) 评论(0) 推荐(0) 编辑

5.Rdd编程

摘要：准备文件下载小说或长篇新闻稿上传到hdfs上读文件创建RDD 分词排除大小写lower()，map() 标点符号re.split(pattern,str)，flatMap(), 停用词,可网盘下载stopwords.txt,filter()，长度小于2的词filter() 统计词频按词频阅读全文

posted @ 2022-03-29 19:21 LINwenguan 阅读(55) 评论(0) 推荐(0) 编辑

4.第四次作业

摘要：Shell自主创建 RDD 本地文件中创建RDD 从HDFS中加载数据打开hdfs 上传和查看hdfs文件停止hdfs RDD列表创建 RDD转换filter操作 RDD转换map操作 Map（fun）另一个实例 GroupByKey操作 Reducebykey操作 Sortby操作 Sortb 阅读全文

posted @ 2022-03-20 22:05 LINwenguan 阅读(30) 评论(0) 推荐(0) 编辑

第三次作业。

摘要：第一.Spark已打造出结构一体化、功能多样化的大数据生态系统，请用图文阐述Spark生态系统的组成及各组件的功能。 Spark大数据计算平台包含许多子模块，构成了整个Spark的生态系统，其中Spark为核心。伯克利将整个Spark的生态系统称为伯克利数据分析栈（BDAS）以下简要介绍BDAS 阅读全文

posted @ 2022-03-12 20:21 LINwenguan 阅读(71) 评论(0) 推荐(0) 编辑

2.第二次作业

摘要：1.环境准备检查 2.spark位置 3.配置环境 4.配置spark和pyspark 5.运行pyspark 6.词频统计 1 def gettext(): 2 txt = open("piao.txt","r",errors='ignore').read() 3 txt = txt.lower( 阅读全文

posted @ 2022-03-03 19:55 LINwenguan 阅读(38) 评论(0) 推荐(0) 编辑

公告

昵称： LINwenguan
园龄： 3年
粉丝： 0
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

LINwenguan

03 2022 档案

公告

搜索

常用链接

我的标签

随笔档案

阅读排行榜