上一页 1 ··· 17 18 19 20 21 22 23 24 25 ··· 70 下一页
摘要: 整个Spark 框架模块包含:Spark Core、 Spark SQL、 Spark Streaming、 Spark GraphX、 Spark MLlib,而后四项的能力都是建立在核心引擎之上 Spark Core:Spark的核心,Spark核心功能均由Spark Core模块提供,是Spa 阅读全文
posted @ 2024-01-10 16:41 阿飞藏泪 阅读(8) 评论(0) 推荐(0) 编辑
摘要: Apache Spark是一个开源的分布式计算框架,拥有四大显著特点: 1. **速度快**:Spark基于内存的运算效率要快100倍以上,基于硬盘的运算效率也要快10倍以上。其先进的DAG调度程序、查询优化程序和物理执行引擎,使得Spark能高效处理数据流。 2. **易用性**:Spark支持J 阅读全文
posted @ 2024-01-10 16:39 阿飞藏泪 阅读(77) 评论(0) 推荐(0) 编辑
摘要: 进程和线程是操作系统中的两个基本概念,它们之间的关系可以从以下几个方面来理解: 定义与特性:进程是一个程序在计算机上的一次执行过程,它拥有自己独立的内存空间和系统资源。而线程则是进程中的一个执行任务,负责当前进程中程序的执行。每个进程都有自己独立的一块内存空间,一个进程可以有多个线程。 关系与区别: 阅读全文
posted @ 2024-01-10 16:34 阿飞藏泪 阅读(32) 评论(0) 推荐(0) 编辑
摘要: Hadoop中的MR中每个map/reduce task都是一个java进程方式运行,好处在于进程之间是互相独立的,每个task独享进程资源,没 有互相干扰,监控方便,但是问题在于task之间不方便共享数据,执行效率比较低。比如多个map task读取不同数据源文件需要将数据源加 载到每个map t 阅读全文
posted @ 2024-01-10 16:21 阿飞藏泪 阅读(13) 评论(0) 推荐(0) 编辑
摘要: 定义:Apache Spark是用于大规模数据(large-scala data)处理的统一(unified)分析引擎。 简而言之,Spark 借鉴了 MapReduce 思想发展而来,保留了其分布式并行计算的优点并改进了其明显的缺陷。让中间数据存储在内存中提 高了运行速度、并提供丰富的操作数据的A 阅读全文
posted @ 2024-01-10 16:21 阿飞藏泪 阅读(1) 评论(0) 推荐(0) 编辑
摘要: 区块链技术是一种分布式账本技术,具有去中心化、不可篡改、安全可靠和可追溯等特点,广泛应用于金融、物流、医疗、知识产权等领域。区块链是一种不可篡改的共享账本,用于记录交易、跟踪资产和建立信任。区块链技术是一种高级数据库机制,允许在企业网络中透明地共享信息。 阅读全文
posted @ 2024-01-10 15:38 阿飞藏泪 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 复习习思 阅读全文
posted @ 2024-01-07 19:09 阿飞藏泪 阅读(5) 评论(0) 推荐(0) 编辑
摘要: 批量处理BulkRequest,其本质就是将多个普通的CRUD请求组合在一起发送。 其中提供了一个add方法,用来添加其他请求: 可以看到,能添加的请求包括: IndexRequest,也就是新增 UpdateRequest,也就是修改 DeleteRequest,也就是删除 其实还是三步走: 1) 阅读全文
posted @ 2024-01-04 21:25 阿飞藏泪 阅读(6) 评论(0) 推荐(0) 编辑
摘要: 删除的DSL为是这样的: DELETE /hotel/_doc/{id} 与查询相比,仅仅是请求方式从DELETE变成GET,可以想象Java代码应该依然是三步走: 1)准备Request对象,因为是删除,这次是DeleteRequest对象。要指定索引库名和id 2)准备参数,无参 3)发送请求。 阅读全文
posted @ 2024-01-04 21:20 阿飞藏泪 阅读(6) 评论(0) 推荐(0) 编辑
摘要: 与之前类似,也是三步走: 1)准备Request对象。这次是修改,所以是UpdateRequest 2)准备参数。也就是JSON文档,里面包含要修改的字段 3)更新文档。这里调用client.update()方法 阅读全文
posted @ 2024-01-04 21:20 阿飞藏泪 阅读(6) 评论(0) 推荐(0) 编辑
上一页 1 ··· 17 18 19 20 21 22 23 24 25 ··· 70 下一页
1 2 3
4