新精算师必须了解机器学习
专业在发展
机器学习(ML)是一个不可回避的话题-它也引起了精算行业的轰动。 机器学习可以简单地定义为"编程计算机的科学(和艺术),以便它们可以从数据中学习",这由A.Géron在他的2022年著作中提供。 事实证明,它本身是一种宝贵的工具,大量数据的公司可以使用它来提取见解,以增强其产品和服务。
对于精算师来说,情况也是一样。 由于精算师从事数据和建模技术的悠久历史,他们有时被称为第一位数据科学家。 这两个研究领域之间显然存在很大的重叠-这就是为什么越来越多的精算师发现自己在日常工作中使用机器学习工具的原因。 无论是为了发掘传统上被忽视的数据的潜力(例如,从文本字段或图像中提取见解,而不仅仅是冷的,坚硬的数字数据),还是以更强大的技术利用已经拥有的数据,以及 算法,一件事很清楚-机器学习将继续存在。
只有一个问题
尽管自1990年代以来某些机器学习算法一直在后台安静地工作,但似乎世界很快变得越来越多地关注AI。 业务用例丰富,并且AI和ML用于各种产品和服务(为我们的电话,我们喜欢的网站和我们每天依赖的工业生产过程提供动力)。 但是ML也可用于精算领域:分析死亡率经验以发现新趋势,为保险产品定价,预测财务数据……
然而,培训精算师需要学习的材料仍然是静态的。 世界在不断发展,这种教育上的脱节越来越严重。 精算大纲似乎有变得不合时宜的危险。
解决方案
也就是说,直到2022年。课程大纲已进行了修订—引入了新的新材料,而重要性日益降低的旧材料也已淘汰。 瞧瞧,精算师学院(IFoA)的CS2科目考试中新增的一项功能就是机器学习-以及与CM1科目密切相关的"数据分析"主题。 这些变化是"确保课程设置是相关的,最新的,并反映了在瞬息万变的全球商业环境中精算师所需的技能,知识和属性。" 听起来足够合理,但是新材料是否符合要求?
根据新课程大纲,机器学习现在占CS2考试的10%,涵盖五个学习目标,即:
· ML的分支及其解决的问题类型
· 有关从数据中学习的高级概念
· 关键技术的描述和示例
· 将ML技术应用于简单问题
· 了解其他非精算师的观点(数据科学家,统计学家……)
听起来像是对该主题的全面介绍。 让我们看一下核心阅读中涉及哪些关键主题(CS2考试的可测试材料),并了解如何实现上述目标。
机器学习的定义和范围
相当合理地,我们从一些基本的定义和解释入手,以了解ML适用于哪些问题。 对于经典方法可以实现的情况,开发花哨的ML算法没有多大意义;同样,如果在数据中没有可检测到的真实模式,则ML将无济于事。
在以一些具体示例(例如定向广告,预测选举,预测贷款违约)开始之后,材料变得更加正式了-将机器学习过程描述为逼近将一组可测量变量映射到输出的目标函数。 该材料不怕透露算法和问题的数学性质-对于那些只听说过ML以不精确的术语抛出来(或只被各种相关的流行词反复打倒的人)来说,这可能是一个可喜的变化。 。
关键概念概述
接下来是对该领域关键概念的讨论。 特别是:
· 损失函数
· 评估模型的方法(准确性,准确性,召回率,混淆矩阵等)
· 参数和超参数
· 训练,验证和测试集
· 过度拟合
· 模型正则化
对概念进行了很好的描述,但仅此而已:一个描述。 机器学习是您需要动手才能真正掌握这些概念及其重要性的领域之一。 最好使用一些优秀的ML在线资源或在那里预订,以查看这些概念的端到端实现,并将您的理解真正带入一个新的高度。
机器学习分支
此处对不同类型的ML算法进行了本质上的区别,包括监督,非监督,半监督和强化学习技术。 本节还介绍了回归与分类,生成与判别模型,以及其他理论,示例和精算应用。 同样,这是对主题的很好的调查,但是您需要做一些进一步的研究以巩固一些概念。 观看视频,阅读书籍和博客-尝试自己建立联系,以充分利用材料。
机器学习过程
注释中为ML项目的一般步骤提供了合理数量的不动产,这是正确的。 机器学习不仅仅是开发,训练和评估模型,而且成功部署ML解决方案还有很多。 在这里我们谈论:
· 收集数据
· 探索性数据分析
· 资料准备
· 模型训练
· 验证与测试
· 改善模型性能
· 文件和可复制性的重要性
精算学生将对他们在课程中遇到的数学模型感到宾至如归-但是,至关重要的是,这只是ML故事中的一章。 如果您想继续将知识应用到实际的业务用例中,则需要对全局有深刻的了解。
关键算法
接下来,讨论了一些关键算法-尤其是:
· 惩罚广义线性模型
· 朴素贝叶斯分类
· 决策树
· K均值聚类
这些方面有很多材料,这是一件好事,它建立在前面介绍的一些概念的基础上。 而且,它以本课程其他部分及以后的一些主题为基础。 那些熟悉CS1中的回归,广义线性模型和主成分分析以及CS2中其他地方的比例危害模型的人将很高兴看到其中一些概念得到了扩展。
其他定量研究人员的观点
最后,我们讨论了机器学习从业者的观点与也许更传统的研究人员和建模者(例如统计学家)有何不同。 本节讨论了组之间进行沟通的困难,尤其是当对于本质上相同的概念使用不同的术语时,或者当两个组可能对分析的不同方面感兴趣时。 机器学习绝对是跨学科的研究领域,因此从业者将经常与其他背景的专业人员进行交流。 "缩小"以讨论在现实世界中开发和应用机器学习解决方案时出现的一些更一般但同样重要的问题,这很好地弥补了材料的不足,因为我们从理论的深度出发,以务实的观点结束。
那么究竟是什么使它进入了考试呢?
任何学生(勇敢地承认这一点)都会知道,倾向于对实际测试的材料投入更多的精力。 严格来说,阅读中的所有内容都是可以检查的,但这是自添加新材料以来的两次会议到目前为止所发生的事情。
2022年4月—关于有监督学习与无监督学习的简短问题以及每种学习方法的示例。 有关模型性能指标的计算和解释的较长问题。
2022年9月–讨论火车验证测试方法的一个更长的问题。 在给定的示例场景中评估机器学习是否合适。 讨论具有更多参数的更复杂模型的优缺点。
代码在哪里?
似乎不愿意让学生参与一些使用Python或R进行的更实际的,端到端的ML实践项目,这似乎是一个错失的机会-尤其是现在,使用R进行数据分析和精算统计已不仅仅只是一部分 但是两次IFoA考试。 即使是研究所全新的数据科学证书也不需要编写任何代码即可完成。 一方面,这似乎完全是傻瓜—毕竟,学习数据科学或机器学习的最好方法可能是让自己沉浸其中并开始使用您感兴趣的数据集。
不过,请务必注意,IFoA并未尝试创建数据科学家。 相反,他们的目标是"帮助精算师,在其职业生涯的任何阶段,通过对精算实践的实例和案例研究,对数据科学工具和技术以及如何将其应用到基础知识上"(在此处找到,以及 有关数据科学证书的其他常见问题解答)。 从本质上讲,您不必成为机器学习方面的专家,但您需要了解它的含义以及如何使用它,因为它在整个行业和整个社会中越来越普遍。
前景
精算角色正在演变。 去年,IFoA总裁约翰·泰勒(John Taylor)主持了该行业内数据科学的快速发展。 显然,这只是第一步-更新整个职业当然不是一件容易的事,但这无疑是正确的选择。 在IFoA的学生课程中,数据科学和机器学习技术的形式化是一种举措,旨在巩固精算师作为专业人士的地位,这些专业人士可以为客户增加真正的价值,而随着精算师在行业中的不断发展,这种做法越来越有用 更远的地方。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Ollama——大语言模型本地部署的极速利器
· 使用C#创建一个MCP客户端
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· Windows编程----内核对象竟然如此简单?
· ollama系列1:轻松3步本地部署deepseek,普通电脑可用