Scala中做简易wordCount
使用foldLeft函数,实现简易的wordCount
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 | import scala.collection.mutable object Demo _ 019 { def main(args : Array[String]) : Unit = { val list = List( "bigdata han hello " , "bigdata han aaa aaa aaa ccc ddd uuu" ) val map 01 = mutable.Map[String, Int]() list.foldLeft(map 01 )(count 2 ) println(map 01 ) } def count 2 (map 2 : mutable.Map[String, Int], str : String) : mutable.Map[String, Int] = { val arr : Array[String] = str.split( " " ) for (elem <- arr) { map 2 + = (elem -> (map 2 .getOrElse(elem, 0 ) + 1 )) } map 2 } |
运行结果为:
当然这种方式,还是显得太罗嗦了,还有更为简洁的方式,而且还可以结果进行正序或逆序排序
简单一句就是:
1 | val result = list.flatMap( _ .split( " " )).map(( _ , 1 )).groupBy( _ . _ 1 ).map(s = > (s. _ 1 ,s. _ 2 .size)) |
显然不容易懂,下面是详细说明
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 | object Demo _ 019 _ 01 { def main(args : Array[String]) : Unit = { val list = List( "bigdata han hello " , "bigdata han aaa aaa aaa ccc ddd uuu" ) // val result2 = list.flatMap((x: String) => x.split(" ")) val result 2 = list.flatMap( _ .split( " " )) println( "result2:" +result 2 ) // val result3 = result2.map((x: String) => (x, 1)) val result 3 = result 2 .map(( _ , 1 )) println( "result3:" +result 3 ) // val result4 = result3.groupBy((x: (String, Int)) => x._1) val result 4 = result 3 .groupBy( _ . _ 1 ) println( "result4:" +result 4 ) // val result5 = result4.map((s: (String, List[(String, Int)])) => (s._1, s._2.size)) val result 5 = result 4 .map(s = > (s. _ 1 ,s. _ 2 .size)) println( "result5:" +result 5 ) // val result6 = result5.toList.sortBy((x: (String, Int)) => x._2).reverse val result 6 = result 5 .toList.sortBy( _ . _ 2 ) println( "result6:" +result 6 ) } } |
输出结果为
上面使用了参数类型推断,关于参数类型推断,介绍如下
如果您觉得阅读本文对您有帮助,请点一下“推荐”按钮,您的“推荐”将是我最大的写作动力!欢迎各位转载,但是未经作者本人同意,转载文章之后必须在文章页面明显位置给出作者和原文连接,否则保留追究法律责任的权利。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· Vue3状态管理终极指南:Pinia保姆级教程