机器学习模型部署摘要

1、如果是实时的、小数据量的预测应用，则采用的SOA调用Rserve或者python-httpserve来进行应用；这种应用方式有个缺点是需要启用服务来进行预测，也就是需要跨环境，从Java跨到R或者Python环境。对于性能，基本上我们用Rserver方式，针对一次1000条或者更少请求的预测，可以控制95%的结果在100ms内返回结果，100ms可以满足工程上的实践要求。更大的数据量，比如10000/次，100000/次的预测，我们目前评估下来满足不了100ms的要求，建议分批进行调用或者采用多线程请求的方式来实现。

2、如果是实时、大数据量的预测应用，则会采用SOA，训练好的模型转换成PMML（关于如何转换，我在下面会详细描述），然后把模型封装成一个类，用Java调用这个类来预测。用这种方式的好处是SOA不依赖于任何环境，任何计算和开销都是在Java内部里面消耗掉了，所以这种工程级别应用速度很快、很稳定。用此种方法也是要提供两个东西，模型文件和预测主类；

3、如果是Offline（离线）预测的，D+1天的预测，则可以不用考虑第1、2中方式，可以简单的使用Rscript x.R或者python x.py的方式来进行预测。使用这种方式需要一个调度工具，如果公司没有统一的调度工具，你用shell的crontab做定时调用就可以了。

by：【1】

部署方式：

http Restful
runtime 调用
pmml, onnx
docker
spark 集成

【1】机器学习算法线上部署方法. https://zhuanlan.zhihu.com/p/24902234

使用docker+fastapi部署机器学习可参考：

基于FastAPI和Docker的机器学习模型部署快速上手

posted @ 2022-03-13 09:23 鱼与鱼阅读(435) 评论(0) 编辑收藏举报

刷新页面返回顶部

大鱼吃小鱼，小鱼吃虾米

机器学习模型部署摘要

公告