本帖最后由 zhizhizhi 于 2020-3-4 23:38 编辑
该篇文章是业内大牛,南开大学精算学系主任张连增教授写的,介绍了数据科学对精算师职业的机遇和挑战,为大家的精算发展方向指出另外一条道路。大家有什么看法呢?
精算数据科学与第五种类型精算师
传承、发展、融合、创新是精算的生命力。当前,精算职业最大的机遇与挑战来自数据科学的广阔领域,数据科学是精算师的核心能力之一。
溯本求源,今天的精算师actuary来自16世纪中期的拉丁语actuarius,原义是抄写员、账户管理员等。寿险精算师的萌芽出现在17世纪。1763年贝叶斯法则的发表标志着统计推断学科的开始。从20世纪50年代到现在,可称为“计算机时代”,在这段时间,计算作为统计应用的传统瓶颈,以百万倍的速度变得更快更容易。在本世纪,机器学习和人工智能的迅速发展正在创造产品和服务,这些产品和服务对精算职业而言,是挑战,也是机遇。
大数据和人工智能时代已然到来,保险和精算行业发展对精算师的技能要求,已从资产负债管理、企业风险管理、扩展到当前的精算数据科学。以精算与数据科学融合的跨学科研究应用为主要特点、以大数据和非结构性数据处理为核心,立足数据科学以数据赋能保险行业、面向未来的新宠——第五代精算师已经破茧而出,假以时日,必将茁壮成长。
第五代精算师的主要技能和特点是什么?精算数据科学历经了怎样的发展?与上一代相比,新一代精算师在专业技能上有哪些突破和变革?鉴古知今,张连增教授将请大家共历一场精算数据科学和精算师的发展之旅。希望通过分享能够为精算师们带来一些启示,更好地抓住机遇,迎接挑战!
精算数据科学与第五种类型精算师
精算学在不断发展,对精算师需要掌握的专业技能也提出了更高的要求。数据科学与精算学的交叉,产生了精算数学科学。按照瑞士精算师协会的精算师分类,目前精算师已有五种类型。与前一种类型的精算师相比,后一种类型的精算师在专业技能上有所扩展。从上个世纪80年代至今,精算职业的发展对精算师的技能要求,从资产负债管理、企业风险管理、扩展到当前的精算数据科学。 1
瑞士精算师协会数据科学工作组的主要结论
2017年6月,瑞士精算师协会成立了“数据科学”工作组。该工作组形成了研究报告,对瑞士精算师协会关于数据科学的应对措施提供建议。2018年8月发布了研究报告的第2版。该报告的主要结论如下: 同许多其它部门和社会本身一样,保险行业正在发生深刻的变化。变化原因是由于数据和技术的驱动带来的新可能性。人们普遍认为,保险行业将迎来全面改观,并在中短期内实现根本性变革。通过与其它行业(如传媒、娱乐、零售和旅游业)的比较,可以看出这一转变可能会产生多大的影响。随着保险行业的变化,精算师的工作以及最终的职业描述也会发生变化。 数据科学是一个跨学科的领域,其目标在本质上是从数据中获取知识并提取见解,用于合理的业务决策和预测。数据科学被定义为以下诸领域的交集: ① 数学和统计学 ② 计算机科学/信息技术 ③ 领域/业务知识 各个领域之间的关系可用图1表示。
图1:数据科学的交叉性
“数据科学”工作组建议瑞士精算师协会批准修订后的关于精算师的的愿景,以及关于数据科学的核心使命,并作为高度优先事项,执行所提议的相应行动项目。 总体愿景(Vision)保险和金融风险是精算师的核心业务。这需要以深入掌握数学、统计学和计算机科学为基础,并熟悉经济和法律。这些技能在非寿险、寿险、健康险及再保险中同等需要。 ◆ ◆ ◆ ◆ ◆
总体使命(Mission)精算技能将有实质性的扩展,包括统计学和计算机科学(从而包括数据科学)。这些技能是最新类型(第五种类型)的精算师开展工作的核心,是非寿险、寿险、健康险及再保险的基础。 ◆ ◆ ◆ ◆ ◆
动项目(Action items)为了实现新愿景并完成使命,建议在各个方面实施以下关键行动项目: (1) 基本的精算培训:作为瑞士精算师认证培训的一部分,精算师应完成至少三次具有很强实际应用的统计和数据科学讲座。其中至少有一次讲座应提供一种相关的计算机编程语言的详细说明,用于数据科学分析。统计方法和技术的讨论应纳入已有的讲座。 职业培训课程应整合法律和职业道德方面,如数据保护和数据安全。 (2) 特别的培训:瑞士精算师协会建议完成一到两门统计和数据科学的综合性的高级课程培训。 (3) 继续职业发展培训:作为现有的继续职业发展(CPD)培训要求的一部分,瑞士精算师协会建议在未来四年内(从2019开始),协会的所有成员,在统计和数据科学中获得的学分至少占CPD总学分的25%。
2 保险行业的变化推动精算职业的发展
保险行业发生的变化由计算能力、数据可获得性/大数据、云计算、机器学习和人工智能等领域的新技术和进步所推动,这些新技术和进步在保险行业价值链中应用广泛,尤其体现在定价、承保、理赔管理、销售和营销等方面。此外,新技术使得新业务线和新保险线(如网络保险)成为可能。新技术可能性也为目标客户服务和定制化或个性化的保险产品提供了动力。一个突出的例子是汽车保险中的远程信息处理定价。
非寿险业务中的远程信息处理概念也正在寿险和健康险中得以应用。类似地,健身跟踪器的广泛使用也在产生大量的高频数据。这些累积的用户健康数据以及关于疾病、药物和治疗的更多信息构成了大数据。数字化转换导致更全面的数据,更大容量的存储空间。通过使用特定的硬件和算法,这些海量数据可以被有效地处理,并在公司内部使用。换句话说,数据科学在保险行业的数字化转换中起着关键作用。
与数字化转换相关联的一个常见专题是保险科技的角色。这个术语结合了保险和技术,指示了保险行业非常新颖的一个趋势。保险科技运动定义为所有行业成员(包括保险公司)与新兴技术及其在保险行业中的应用相关联的综合活动。
精算师的核心能力一方面是对精算问题有透彻和全面的了解,能够可靠地评估保险活动的财务影响,并管理风险。另一方面,精算师的核心能力一直是处理和分析小规模和结构化保险数据,解决精算问题,例如在定价、准备金评估、及风险管理中的工作。考虑到保险行业面临的根本性变化,精算职业需要发展也是合乎逻辑的。
3
数据科学与精算数据科学
(1)数据科学 数据科学是一个跨学科的领域,其最终目的是从数据中获取知识并提取见解,用于做出合理的业务决策和预测。引用维基百科的定义,数据科学“应用来自数学、统计学和计算机科学/信息技术(包括信号处理)的技术和理论,并使用概率建模、机器学习、统计学习、计算机编程、数据技术、模式识别、预测、不确定性建模和数据存储。
在前面的图1中,传统的精算学包含于“传统研究”中。图1还显示了机器学习和软件开发这两个领域,这两者都已有较长的历史。
上述定义意味着如果一个问题或任务需要对上述三个领域都有深入的了解,就可以归为数据科学的框架。更严格地说,数据科学被定义为以下三部分的交叉部分: ① 统计建模/机器学习 ② 高性能计算/大数据管理 ③ 领域/业务知识
上述更精确的定义强调了数据科学需要应用机器学习的统计方法。使用适当的计算硬件和算法,这些方法被应用于大数据,以解决特定业务的问题。数据科学里面涉及了一些概念,
这里稍加说明。
大数据是指数据容量太大而且太复杂、或者变化太快、或者结构化程度非常弱,从而传统的数据处理方法不适合来处理。
引用维基百科的观点,小数据是指能够使得人类理解的足够“小”的数据。它在数据容量和格式方面,使得可访问、可了解、可操作。
结构化数据是指“已经组织到格式化存储库,通常是关系型数据库”中的数据,它以行和列方式存储。
非结构化数据是指未按预定义格式组织的数字化信息,如图像、文本、视频、语音数据。
统计学习是指用于建模和理解复杂数据的众多工具,是统计学和数学的一个领域。“机器学习”是计算机科学的一个领域,它使计算机能够通过数据学习,而不必事先有明确的解的形式。
预测建模是统计学和计算机科学的一个领域,其中统计模型用于预测事件。需要预测的结果(如损失事件)很多是未来的。预测建模与统计和机器学习有很多重叠之处。 在 精算工作中,业务知识就是精算知识。数学/统计学、计算机科学和精算知识的交叉领域称为精算数据科学。该领域的专业人员是精算数据科学家或数据科学精算师。这类精算师主要从事数据科学工作,对数据科学有更多的知识和经验。保险行业中的其它职业包括定价精算师、准备金评估精算师、注册风险精算师(CERA)。当提到应用于保险领域的数据科学时(需要对价值链的其它关键部分有专门知识),特指保险数据科学。
近年来,数据科学一直是一个快速发展的领域,主要驱动因素如下: ① 数据的可获得性:数量巨大而且细节丰富(如更多的协变量)的内部数据和外部数据的可获得。与此同时,还有很多可以公开获取的数据(如来自亚马逊、Kaggle、ImageNet的开放数据集)的激增。 ② 计算能力的供给:随着亚马逊网络服务(AWS)和图形处理单元(GPU)等公共云的出现,高性能计算正变得大公司、中小企业和消费者都能负担的。 ③ 开源软件:像谷歌、微软和亚马逊这样的大型科技公司在开源许可下共享他们的机器学习(TensorFlow、Cognitive Toolkit、DSSTNE)源代码。 ④ 公开课程:大量的开放在线课程(MOOC)使得在任何地方都可免费获取数据科学的专业知识。Kaggle是数据科学界著名的交流平台,它促进技术转让,并提供透明的竞争。
数据科学和人工智能(包括自动驾驶汽车、超级电脑Watson战胜顶级人类对手、AlphaGo战胜头号围棋选手)的最新成就极大地提高了公众对该领域的认识,也激励了大多数大型保险公司成立数据科学团队。
以数据科学为核心要素的最新想法涉及基于使用的保险(UBI)产品(如汽车业务中的远程信息处理)、寿险和健康险中的健身跟踪器。数据科学在保险行业中的其它公开应用包括:苏黎世保险公司推出了一个基于数据科学方法的系统,可以根据相应的医疗报告对人身伤害进行分类。这项任务现在是自动化完成的,而在以前它是由理赔处理人员手动执行的。瑞士再保险公司开发了一项智能搜索功能,可以针对特定的业务背景,自动筛选数以百计的合约。
在学术研究和教学中,在大多数大学及应用科学的大学里,数据科学是计算机科学的一部分,与数学和统计学有密切联系。各大学提供数据科学的(硕士)学位项目,通常以数学或计算机科学学士学位为前提条件。在瑞士苏黎世联邦理工学院(ETHZ),学位项目的核心课程包括机器学习、信息数学、数理统计基础、计算统计、大数据、数据科学中的算法、以及数据科学中的优化。
瑞士的两所联邦理工学院(苏黎世的ETHZ和洛桑的EPFL)将数据科学视为教学、研究、产业部门的所有领域的基础。因此,他们建立了自己的数据科学中心,为处理和存储数据提 供专门知识,也为所有学科提供硬件软件设施。 ◆ ◆ ◆ ◆ ◆
(2)精算学与数据科学的比较 对精算师和数据科学家的训练和工作进行比较,就发现如下特点:
在大学里,除了作为共同基础的数学,精算学和数据科学项目的课程科目几乎没有重叠。然而,在实务中,精算师和数据科学家的职业活动确实具有某些相似性和共性。投资组合分析和承保保单时的风险选择就是一个很好的有相似性的例子。数据科学家能够在保险公司的整个价值链中工作,而精算师基于已有的训练,其专业特长只集中在几个领域。
数据科学家可能缺乏传统统计学系统的基础。数据科学家开发的许多保险应用程序对精算实务产生影响(如承保、理赔)。
精算师缺乏最基础的数据科学知识,即使这些知识对精算实务有所影响。特别地,精算师在处理非结构化数据或大数据、计算机编程、可视化或计算统计/机器学习方面,几乎没有经验。精算师的技能可能因其学位的集中程度而有很大差异。例如,有些精算师掌握了统计学和数据科学(特别是计算机编程)的较高技能,作为其学位项目标准的一部分。 在工作中培训精算师成为数据科学家,有很大挑战,反之亦然。 表1给出了当前精算师与数据科学家训练和技能概况的详细比较。
4
五种类型的精算师
精算师的分类系统最早由瑞士苏黎世联邦理工学院(ETHZ)的Bühlmann提出。按照瑞士精算师协会的精算师分类,目前精算师已有五种类型。与前一种类型的精算师相比,后一种类型的精算师在专业技能上有所扩展。
他解释了选择2012年作为第五种类型精算师的标志,其理由是在2012年有两篇关键论文对深度学习的进一步发展产生了重大影响,是深度学习里程碑式的论文。而在精算行业,阐述第五种类型精算师的两篇报告分别是:
图2给出了五种类型的精算师的专业技能。
图2:五种类型精算师的演变 一种新类型的精算师的概念提出,前提是保险行业已经出现根本性的变化,这些变化将对精算师的工作描述产生重大而持久的变革性的影响。现代保险行业面临着很多变化,这些变化大多要求很强的量化精算功能,能够通过精心选择和明智引导的内部模型捕捉新出现的风险。其中的一个变化是数据科学(大数据)在精算学中的应用。 图3给出了第五种类型的精算师在专业技能上的扩展。 图3:第五种类型精算师的专业技能
对应于第五种类型的精算师,我们必须重新思考精算教育和研究议程:数据科学及其与计算机技术、人工智能、社会网络的各种交叉正在对整个社会产生相当大的影响,从而对这种不断变化的格局所需的保险产品产生影响。 5
其他建议前面第一部分已经介绍了瑞士精算师协会“数据科学”工作组提交给协会的核心建议。核心领域是最优先的领域,非核心领域是较为次要但仍然是重要的领域。以下介绍非核心 其他行动领域1:数据科学工作组使命:数据科学工作组是瑞士精算师协会的数据科学能力中心。 目标: ① 协助瑞士精算师协会实施行动项目 ② 开发和促进精算问题的统计建模 ③ 提交关于基础训练和论文,促进技术升级 ④ 提供培训材料 ⑤ 与其它国家精算协会的同行工作组保持联系 实施:瑞士精算师协会要求工作组领导层在业务层面实施目标。 逻辑依据:保持数据科学工作组将促进数据科学的发展,并加强瑞士精算师协会在国内外的地位 ◆ ◆ ◆ ◆ ◆
其他行动领域2:加强精算职业使命:在保险行业中,精算师被认为是一个高技能和有前途的职业。在学生中,这被视为一条有吸引力的职业道路。 行动项目: ① 落实数据科学的核心建议 ② 提高精算师职业对学生的吸引力 ③ 数据科学作为一门科目,给予及时的关注 实施:有关建议应按如上办法实施。瑞士精算师协会应制定并实施一项战略,以加强精算职业的形象。 逻辑依据:这项行动将提高精算职业的吸引力,从而在长期内提升其地位。 ◆ ◆ ◆ ◆ ◆ 其他行动领域3:数据科学家的特别培训
使命:瑞士精算师协会应将自己定位为一个组织,通过精算职业,适当地支持在保险行业内工作的据科学家,并使他们更熟悉精算师的工作。 行动项目: ① 瑞士精算师协会应考虑为保险行业的数据科学家设立一个部门。 ② 瑞士精算师协会应为大学里数学、物理和计算机科学/IT等专业的学生提供培训项目,课程大纲应涵盖统计、数据科学、及精算学的核心课程。通过培训项目,瑞士精算师协会将使数据科学领域的非精算师掌握精算学的深入知识,而不必完成精算师所需的所有培训。 实施:这些新的培训项目应与其它精算协会和大学合作建立,从2021年初开始提供。 逻辑依据:这项行动将促进精算师和数据科学家之间可持续和有效的合作,并有助于在长期内进一步加强这一职业。 6
部分国家精算师协会的行动
以下是对SOA活动的简要概述: 活动主要在SOA层面和各个部门组织。 一般来说,采用分布式、非中心方法。 SOA董事会已经制定了一个多管齐下的战略计划,其中包括保险科技。一个主要目的是评估由新数据、技术和方法可能为精算职业带来的潜在收益。SOA董事会注意到,已经有几个部门在提高精算师对保险科技公司及其影响的认识。 另一个战略重点是长期增长战略。作为一个广泛的专题,它讨论了数据处理、自动化和人工智能方面的新技能,以确定精算职业的增长机会。在2018年的试点阶段之后,一些部门可能会提供新的教育材料。 目前有一个预测分析证书试点项目。 预测分析课程已被纳入SOA的精算师资格教育体系,自2018年7月起生效。SOA提供了两个级别的资格:准精算师和精算师。预测分析课程是准精算师课程。 在面向寿险和健康险的营销中,SOA非常注重预测分析,以拓宽精算师的职业机会。 ◆ ◆ ◆ ◆ ◆ [size=1.2em]英国精算师协会(IFoA) 以下是对IFoA活动的简要概述: IFoA历时四至五年,审查课程体系,于2019年4月结束。在审查过程即将完成之时,协会决定不再在更大程度上追求数据科学的整合。 IFoA成立了一个“来自数据的建模、预测分析、见解”的跨行业工作组。 IFoA正在评估一个新的学习概念,该概念旨在对趋势和发展做出更灵活的反应。 在发现许多再保险/保险公司独立开展这一领域的研究后,IFoA受到启发,加紧了自己的研究工作。 ◆ ◆ ◆ ◆ ◆ [size=1.2em]德国精算师协会 2018年1月1日,德国精算师协会推出了精算师资格新课程和考试体系。新课程旨在培训精算师,以应对Solvency II带来的业务环境变化、渐进的数字业务转型以及风险管理方面的新挑战。新考试系统包括六门基础课程和四门专业课程。 基础课程科目:经济和法律商业环境、应用随机过程、金融数学和风险评估、精算数学、建模和企业风险管理、业务管理。 此外,学生还需要参加职业和交流课程(无考试)。 在上述基础上,参加四门专业课程考试,最终有资格成为精算师。其中有两门必须在七个专业领域中的一个领域选择:寿险、健康险、养老金、意外险、财务、社会储蓄、企业风险管理。除了这两门必修科目外,学生还要参加两门选修科目考试。这两门科目可以来自上述专业领域中的任何两个,或者来自新的专业领域精算数据科学(ADS)。 结论:新的考试系统将精算数据科学(ADS)纳入德国精算师课程,但作为选修的专业而不是必修的基础课程。因此,德国精算师的职业道路可能会选择也可能不选择精算数据科学。 注册参加精算数据科学专业课程的学生将参加两门考试:基本部分和高级部分。 为了使学生做好考试准备,协会会提供为期三天的研讨会,讨论相关内容。这两项研讨会从2019年开始提供。这些研讨会也提供给精算师,作为继续职业发展机会。 ◆ ◆ ◆ ◆ ◆ [size=1.2em]法国精算师协会 法国精算师协会提供精算数据科学方面的专业知识。这是一个为期12个月、168小时的课程。课程目标是让学生: ① 发展精算师在计算机科学方面的技术技能,以解决在业务层面的与数字化和新数据类型新应用有关的问题 ② 熟悉大数据处理链:存储、过滤、预测、验证、可视化和解释 ③ 在动态的法律和道德环境中确定业务方面(客户利益、客户定价、有针对性的风险预防) 为实现上述目标,本项目包括以下模块: ① Python中的逻辑要素与编程 ② R中的数据挖掘与编程 ③ 算法学习与Kaggle竞赛 ④ 机器学习基础 ⑤ 机器学习的并行化及其应用 ⑥ 精算背景与案例研究
|