RPC远程过程调用协议
最近学习Hadoop、Hbase、Spark及Storm原理,经常会出现RPC这样的传输术语,为了更好地理解,将知识点详细的整理下吧~
RPC-----它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在,如TCP或UDP,为通信程序之间携带信息数据。
简要工作原理
(1)调用客户端句柄,执行传入参数
(2)调用本地系统内核发送网络信息
(3)消息传送到远程主机
(4)服务器句柄得到消息并取得参数
(5)执行远程过程
(6)执行的过程将结果返回服务器句柄
(7)服务器句柄返回结果,调用远程系统内核
(8)消息传回本地主机
(9)客户句柄由内核接收消息
(10)客户接受句柄返回的数据
RPC的主要功能目标是让构建分布式计算(应用)更容易,在提供强大的远程调用能力时不损失本地调用的额语义简洁性。为了实现目标,RPC框架需提供一种透明调用机制让使用者不必显示的区分本地调用和远程调用。
传输服务
协议编码后,将编码后的RPC请求消息传输到服务方,服务方执行后返回结果消息或确认消息给客户方,RPC的应用场景实质是一种可靠的请求应答消息流,和HTTP类似。因此选择长连接方式的TCP协议会更高效。与HTTP不同的是在协议层面我们定义了每个消息的唯一id,因此可以更容易的服用连接。
对于数据传输量小的应用类型,单链接基本足够。单链接和多连接最大的区别在于,每根连接都有自己私有的发送和接收缓冲区,因此大数据量传输时分散在不同的连接缓冲区会得到更好的吞吐效率。所以,如果你的数据传输量不足以让单链接的缓冲区一直处于饱和状态的话,那么多连接不会产生任何明显的提升,反而会增加连接管理的开销。
执行调用
client stub所做的事情仅仅是编码消息并传输给服务方,而真正调用过程发生在服务方。server stub的两个组件,一个负责控制调用过程,一个负责真正调用。Java中实现代码的动态接口调用目前一般通过反射调用,除了原生的jdk自带的反射,一些第三方库也提供了性能更优的反射调用,因此RpcInvoker就是封装了反射调用的实现细节。