spark

shell

sc.textFile("file:///D:///spring///S-park///log///1.txt").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).collect # 词统计
sc.textFile("file:///D:///spring///S-park///log///2.txt").map(line => line.split(" ").size).reduce((a, b) => if (a > b) a else b) # 一行中最多的单词数量
sc.textFile("file:///D:///spring///S-park///log///3.txt").filter(line => line.contains("spark")).count() # 有多少行包括字符串"spark"

spark-sql

spark.sql("show databases").show(false)
spark.sql("use default")
spark.sql("show tables").show(false)
spark.sql("select * from test_table").show(false)
spark.sql("select count(1) from test_table").show(false)

spark-submit

spark-submit --class com.cord.StartApplication  --executor-memory 4G --num-executors 8 --master yarn-client spark-example-1.0-SNAPSHOT.jar
posted @   fleam  阅读(110)  评论(0编辑  收藏  举报
编辑推荐:
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
阅读排行:
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源!
· 周边上新:园子的第一款马克杯温暖上架
历史上的今天:
2016-10-28 侧边栏
2015-10-28 php基本语法之逻辑运算符
点击右上角即可分享
微信分享提示