拥有几百个模型的机构和企业,怎么进行模型管理
拥有几百个模型的机构和企业,怎么进行模型管理
数百个模型放在面前,金融机构要如何高效管理
疫情推动金融机构加速数字化转型。依托人工智能、大数据等技术,金融机构建立各类模型,特别是以机器学习为代表的数据模型,被广泛运用在风险计量、客户准入、资本计量、拨备计提、客户管理、反洗钱、反欺诈、精准营销等领域。在用户行为模式改变,监管趋严下,模型应用于辅助银行业务决策,满足业务发展需要,有效提升风险管理能力。
模型在推进普惠金融产品标准化、画像精准化、获客批量化、服务便捷化等方面都具有极强的支撑作用,在丰富普惠金融产品,拓宽普惠金融服务渠道,更好为小微企业、农民、老年人等特殊群体做好金融服务具有重大意义。金融机构一方面是利用大数据技术,降低信息不对称程度,实现客户画像的精准化,提升服务能力;另一方面就是依托大数据模型、实现信贷产品全流程线上化操作,大幅提升普惠金融的办理效率,提升批量化获客的能力。
模型统一管理的需求
基于业务发展,金融机构各业务部门基于其自身的营销或风险管理需求独立开展了数据挖掘和模型开发等工作,由此已经制作上线了成百上千甚至更多的模型。从模型开发到管理监控,都需要耗费大量人力与时间,并且存在各种合规和安全风险。如何高效地对模型体系进行统筹管理和整体监控?成为摆在金融机构面前的挑战。
2020年7月,银保监会发布的《商业银行互联网贷款管理暂行办法》,其中特别提到对线上信贷业务全流程的各类风险模型的监管要求,包括身份认证模型、反欺诈模型、反洗钱模型、合规模型、风险评价模型、风险定价模型、授信审批模型、风险预警模型、贷款清收模型等。
模型的最终目的是辅助决策,因此金融机构在工作实践中模型管理是非常必要的,需要结合业务变化和需求对模型进行全流程的管理,制定模型风险管理制度,对模型进行分级分类,新模型的设计开发、定期对模型进行升级更迭等。因此需要通过统一的模型管理平台来实现集中管理、自动化监测,以实现对潜在模型风险的控制和缓释。
Xintell如何进行模型的管理
为了助金融机构建模难、升级更新慢、模型管理复杂的问题,顶象2018年推出了专业模型解决方案——Xintell智能模型平台。
基于关联网络和深度学习技术的Xintell智能模型平台,结合Hadoop生态和自研组件,将复杂的数据处理、挖掘、机器学习过程标准化,提供从数据处理、特征衍生、模型构建到最终模型上线的一站式建模服务,结合拖拉拽式操作大幅降低建模门槛,提升建模工程师、数据科学家的工作效率,让运营人员和业务人员也能直接上手操作实践,帮助企业通过对大数据的模型训练在反欺诈、风控、营销、客户分群等场景提供模型支持,并能够根据时间变化进行动态升级与优化,极大降低建模和模型管理门槛。
全生命周期管理。顶象Xintell覆盖从模型开发到投产再到变更、迭代、退出的完整生命周期,形成统一的模型目录、多维度视角大盘,从全局到个体,通盘掌握模型资产信息,辅助管理决策。通过在线模型服务的仪表盘,可以便捷地查看历史上模型的调用量和平均耗时,及时发现模型的异常。通过将模型输出的结果和真实的标签按一定规范写入指定的表中,还可以监控模型的KS、PSI等指标,用于评估模型性能是否发生衰退。
全流程协同管理。模型建设是一个系统工程,需要数据、算法、开发、业务等不同人员协作完成等,顶象Xintell实现同一个项目空间下,配置不同角色的操作权限。团队成员之间可以互相查看代码,进行code review或相互学习。通过加锁的功能,可以防止自己的代码或已发布的调度任务被他人误修改。此外,不同项目空间的代码相互隔离,从而可以支持多个项目同时开发,支持将HiveSQL脚本和Python脚本发布版本,支持版本回溯,从而实现代码的版本管理。在调度任务中可以调度指定版本的脚本文件。
融合多类数据库与文件。顶象Xintell采用Hive表管理所有的数据,支持与常见的数据库进行对接,包括但不限于Hive、Oracle、MySQL、ES、MongoDB、Kafka、Cassandra等。可发布成数据同步任务,集成到调度任务中实现定时自动运行。Xintell也支持往Hive表中直接导入csv、txt、log等常见类型的数据文件。各个表从不同的数据源汇总到Hive表中后,或进一步经过关联、清洗、加工,形成数据集市,供后续的建模等任务使用。
实现数据与特征的标准化。顶象Xintell沉淀高频常用特征,统一数据源、统一计算、存储和管理,让不同的建模场景可能用到相同的业务数据,辅以相关的特征说明,并提供通用的特征管理功能。目前已有二代征信特征库,未来计划开发更多场景的特征库。
快速调试部署与迭代。顶象Xintell支持一键将模型部署为在线模型,以API的形式对外提供模型调用服务。自带对在线模型服务的监控功能,可将整套操作流程配置为定期自动运行的调度任务。衔接模型研发、测试和生产环境,提供快捷、统一管控的模型测试、上线部署流程和通道。快速对模型进行集成测试、部署运行和迭代更新,缩短建设周期。