连接阿里云MaxCompute数据源报错504 Gateway Time-out

背景

经济下行的大环境下,很多公司都在做出海业务,即把海外人民做为服务对象。我司亦不例外。最近在全职负责的一款数据产品,也需要在菲律宾(马尼拉)也部署一个站点。

站点部署成功,看起来一切顺利。既然是数据产品,少不了需要个数据源菜单,数据源管理列表页。

马尼拉业务的数仓owner是在阿里云申请MaxCompute数据源(后文简称MC),在DataWorks上可以正常使用。但在这个数据产品平台里,新增MC数据源,然后连通测试时,却报错504 Gateway Time-out:
在这里插入图片描述

奇奇怪怪,504 Gateway Time-out一般不是连接服务器超时失败。为啥通过JDBC(具体来说,是阿里提供的ODPS-JDBC)测试MC数据源,即ODPS数据源,却报错504?

<dependency>
    <groupId>com.aliyun.odps</groupId>
    <artifactId>odps-jdbc</artifactId>
    <version>3.2.21</version>
</dependency>

通过断点调试代码:
在这里插入图片描述
实际上,阿里云的MC(即ODPS)数据源的连接串的格式比较特殊:jdbc:odps:http://aaaa.bbbbb.maxcompute.aliyun-inc.com/api?project=ccccc。截取odps后面的字符串,就可以得到一个http地址,可以使用浏览器打开:
在这里插入图片描述
经过沟通,得知MC数仓是部署在新加坡环境。浏览器打开数据源连接信息报错如下:
在这里插入图片描述
经过排查,是公网和内网的区别。所谓的公网就是没有-inc,内网是带-inc
在这里插入图片描述
在这里插入图片描述
走公网的话,涉及到数据敏感性和隐私保护等问题,不建议使用公网方式。

因此需要走内网,走内网是需要配置代理中转一下,或者使用vpc、nat等方式,配置比较麻烦。

至于为啥内网有这个504网关超时问题,是因为我负责的数据平台是部署在菲律宾(马尼拉)region,而MaxCompute数仓是部署在新加坡region,跨region,可理解为跨网段。

事后反思:连接数据源报错504,第一印象是一脸呆(meng)滞(bi),我是想要连接数据库呀,为啥和服务扯上关系。实际上MaxCompute可以理解为一个后端服务,从其JDBC连接串信息能看出个大概。

posted @ 2022-12-01 19:25  johnny233  阅读(39)  评论(0编辑  收藏  举报  来源