出品|搜狐科技
(资料图片仅供参考)
编辑|汉雨棣
9月8日下午,蚂蚁集团发布了金融产业大模型,同步推出了金融AI任务评测集与基于大模型的两大应用产品。发布会后,蚂蚁集团副总裁、金融大模型负责人王晓航在与搜狐科技等媒体对话时,从产业侧讲解了蚂蚁集团的产业大模型布局,并对当今大模型应用于落地金融业的困难与解决方法提出了见解。
王晓航表示,现阶段的大模型擅长写作、生成、深度感知等文科类的事情,但对于数字型的、逻辑决策的、量化分析的理工科工作并不擅长,目前行业对生成式AI的“幻觉”情况还没有很好的解决方案,金融行业知识专业性、逻辑严谨性与合规要求很高,原生大模型在产业落地方面还有很大的鸿沟。
王晓航指出,大模型要想真正深入金融专业领域,就牵涉到风险管理、研判等核心业务,当前的银行业还不能全面驾驭大模型所带来的机会。金融科技公司及金融体系内部需要发挥科技力量,真正将大模型转化成产品和平台。这大概还需要一到两年的时间。
以下为对话实录,经编辑:
媒体:下午发布的蚂蚁金融大模型1+1+2四个部分(金融大模型+金融AI任务评测集+支小宝和支小助两大应用产品),请问在金融科技的架构体系方面,这四个部分分别处于怎样的位置?是不是可以理解为大模型是基础设施层,金融AI是任务评测集属于技术支持层,支小宝和支小助属于产品应用层?
王晓航:刚才讲了1+1+2,更多的是从产业角度。在金融这样一个严谨的领域,工业级的产品很少。大家看到的,都是开源为基础,或者说是自研的通用大模型,我们虽然有基础大模型很扎实的通识基础,今天我们既然发布的是产业大模型,还是希望能解决产业问题。所以今天选择了把我们产品和产业大模型一起发布。
其中我们发布开放了一个测试集Fin-eval。通用算法有非常多的测试集,包括大模型本身有四五个比较常见的测试集,以前的计算机视觉、自然语言等等,非常多。我们也参与了很多技术打榜,对我们来讲都已经麻木了。因为最大的问题是在这个做完以后,你回到产业价值落地上面,它不能直接解决问题,不能转化成对金融问题的理解和解决。所以我们希望这个行业里面,在通用的数据基础上对行业做一些贡献,把我们对行业的技术理解毫无保留的贡献出来,希望产学、包括工业界更好的解决问题,这是它的初衷。
媒体:刚才提到蚂蚁在大模型上布局还是蛮早的,但是真正智能AI的涌现还是ChatGPT出现这个时点或者说ChatGPT3.5-4.0。当所谓的人工智能出现了之后,你们内部是怎么评估大模型对蚂蚁尤其是对支付宝可能的影响,会不会有其他的竞争对手或者新兴企业利用这个AI来彻底把像蚂蚁、或者支付宝这样的已经占领市场优势地位的企业给颠覆掉?你们是怎么评估它的冲击和影响的?
王晓航:中国科技企业都经过这一段的焦虑期(今年3、4月份),我们刚才开玩笑说,最怕睡觉,因为一起床就发现又有一个新的论文和新的产品要研究。那个时候我跟大家一样,感觉发生太快了,有很多各种各样的可能性。但是每个技术都有它的发展周期,我们对它了解得越深刻,对它当下的能力和边界认知越深刻的,我们心里越有把握。长期来说会颠覆,但是短期内大模型还是一个知识型和需要积累的技术。所以我个人认为,不会一夜之间某一个行业被颠覆了,它是一个持续长期的过程。我们有扎实的AI布局,非常巨大的投入,万卡的高性能GPU,这是代表了蚂蚁的认真和决心。
产业是我们的优势,无论是生活服务还是金融服务、支付服务,这方面对我们来说有非常强的动力,以最敏捷的姿态去把已有的这些技术发挥到极致,这是我们一直以来的风格。所以产业我们动的比较快,我们认为这是一个快速试错和迭代的过程,试出来不行的话再继续探索这个技术的极致在什么地方。所以,技术需要一个长坡厚雪的过程,但是对于具体产品的优化,我们是非常有急迫感和速度感的。
媒体:现在蚂蚁的金融业务已经全面升级到大模型范式,我想问一下大模型范式是怎么样的一个概念?是怎么升级的?具体升级之后它的效果怎么样?有没有一些具体的数据支撑吗?
王晓航:更确切地说是大模型在金融产业落地的范式。因为现在大模型离产业应用还是有很大距离的。很多问题你们可以想象一下,在一个知识专业性和金融逻辑的严谨性,以及合规要求很高的行业里面,原生大模型是没有办法去满足的,有很大的鸿沟。所以怎么能让专业知识、专业逻辑、真实的金融世界与大模型相融合?这个是我们金融大模型要解决的问题,有很多方式翻译成技术的语言,确保它的一致性、真实性,防止知识注入之后的幻觉。所以那是一个系统工程,怎么让我们金融业务面向消费者和面向专家的,真正意义上面能使用它,这是一个范式。我们提到的是说,大模型最终还是一个中枢,它认知和交互语言的中枢,当需要严谨的知识和专业的逻辑的时候,它还是会跟数字化严谨的金融系统业务进行交互,这个阶段我们认为是行之有效的。
至于很多事情单讲效果、降本增效,意义不大。因为大模型我们本身的看点不是这些东西,还是希望能够有替代性的一些体验,比如说支小宝能够在生成式体验真正做到聪明、智能、科学,像理财专家一样进行交互,这样一种数字化体验以前是很难做到的。还有我们的专家,专家以前用CRM,很多工作现在被替代完了以后,他到底应该发挥他的创造性和专业性?这是我们看中的东西。那些降本增效、效率的提升、精度的提高,那些东西累加在一起会产生量变变成质变。比如说支小宝,确实是它的用户对话理解水平高很多,高了一大截,然后投研的分析师,现在没有办法对金融市场热点的事件进行很深度的推理,比如说iPhone15会对什么样的行业和产业链的金融产品产生什么样的影响?这样的分析是非常重的,然后怎么去通过大模型基于金融框架进行自动化的推理,达到他的要求和水平。这些东西它都加在一起,怎么改变他的工程模式,这是更重要一些。其他东西都是现有已有技术到什么程度,有没有用到极致,然后累积在一起会发生的局面。
媒体:很多专家谈到大模型的不确定性,AI生成错误性答案它自己都不知道,这个在金融行业我觉得会危害性更大,您怎么看待这个问题,以及能不能具体谈谈我们蚂蚁的大模型在这方面有没有一些解决的措施或者能力是可以分享的。
王晓航:行业里面怎么解决幻觉,客观讲其实没有很好的办法。所以,我们采用了在商用和大规模产业级应用里面是知识图谱这样的结构化数据,与大模型参数化数据相结合的方式,双驱动的方式。在严谨和头部的这些大量的推理和生成上面,我们希望通过我们积累起来最大规模的金融领域的知识图谱,能够确保它的专业和严谨性。对一些常委,无伤大雅的,比如说投教或者一个客服的问题错了,会有影响,但不会像投资理财、风险决策、理赔大额保单这么严重,这时候我们可以更放开一些,交给参数知识。但是行业里面那些通用的解决方法,当然我们都会使用、对齐,数据本身的知识的注入、一致性的对齐,然后在生成完以后的真实和一致性的判别,这是一个系统化的过程,因为我们是真实开放的,未来对广大用户开放的,我们从第一天开始就本着工业化要上线的角度,所以我们做的还是比较细致的。
媒体:今天发布的这两个产品它主要停留在知识分享、交互层面,想问蚂蚁在其他的领域,比如说信贷风控层或者核心业务有没有相关产品的探索和布局,要落地的话还有哪些挑战,预计投入期还有多长?
王晓航:我们发布的支小宝系列是面向六大类的专家,行业从业者,做得比较深的是现在的财富顾问和保险顾问,专家的展业工具、投研、理赔分析师,理赔就是量化风险的工作,然后风险管理人员的策略开发的工具。所以,跨度比较广,您刚才提到风险决策领域,我们也在开发,也在赋能这些职能角色。对我们来说,关键环节里面,只要能够在生产力和模式上有变革的,我们认为都值得。
其中刚才讲到的风险策略研发的这个领域,是有很大的潜力的。具体到什么程度?我觉得很难说,因为这个领域里面它要解决的不光是知识型问题。我们发现通用大模型进入到今天,它擅长一些事情,又不擅长一些事情。它非常擅长文科的事情,写作、生成、理解、推理,然后深度感知这些事情。它不是很擅长数字型的、复杂逻辑决策的、量化分析的,优化相关的这些理工科的工作。大量的科研工作者和研发人员在试图解决一些问题,但是并没有达到工业级的水平。所以,风险管理本质上是一个量化的工作,是一个理科工作,大模型现在带来的价值不在于怎么去更精准的做风险定价或者运筹优化的算法,而在于数据怎么理解,工作流程怎么更加的极致的流畅和低成本,而不是在于本身怎么去为某些人群、某些人做精准的基于量化的定价,现在还不是在这个方面发挥作用。
所以,我回答你的问题,它有能力、有边界,有些地方是我们认为现在没有成熟,我们不会去太过早进入到这个领域里面。
媒体:今天上午在银行业分论坛上,有好几家银行高管说,大模型可能会在1-3年内大范围的落地于银行业,你能不能预测一下,最先落地的是哪几个场景?
王晓航:金融本质差不太多,无外乎是外部的风险定价、资金资产,它是资产资源配置的问题。在银行业上,客户服务方面,真正意义上能把会员的人性化的服务能够数字化,这个我觉得大模型是有希望的。刚才讲了,信贷是银行业最重要的业务。其实信贷真正要的是一个数据业务,怎么从海量的数据中提取有意义的信息,去做模式的信息的提取,以及行业中宏观大量研判的分析,这些都可以得益于大模型已经有的能力。但是还有很多,银行业还做财富管理。所以我觉得金融行业当中,银行业是这个阶段得益于大模型能力的一个行业,实实在在的。
但是现在大家也看到一个问题,很多时候因为这个技术本身在某些通用领域里面,是已经开始普惠,门槛降低。但是真正深入到专业领域深处的地方,牵涉到风险管理、研判这些领域,很多还是停留在想象力,把它当做一个许愿池的阶段。我觉得这个阶段会过去,但是现在银行业本身还没有成熟到一个程度,今天可以全面的利用驾驭大模型所带来的机会。它需要金融科技公司,包括金融体系内部的科技力量,能够真实的把它转化成产品、转化成平台,真实的产业落地的能力,我觉得这个还需要大概1、2年的时间。
媒体:现在也有很多的金融科技公司也开放了大模型,在银行因为它是一个比较封闭式的,数据隐私非常关注的行业,所以会涉及到落地的精调的问题。但是据我所知,这次大模型不会落地涉及到他们精调,在落地业务过程当中,怎么帮助业务建立他们自己的大模型能力?
王晓航:我讲讲产业这一侧。刚才讲的这些问题不是因为大模型带来的,它的数据安全、隐私保护和金融数据的合规的对独立性和严苛要求,不是今天发生的。所以银行业使用AI大模型,它的私有部署、隐私计算的保护等等这一系列技术会用武之地,这是第一点,可以解决这些问题,只是通过不同的方式。
我们今天发布的是产品级的,不是裸模型的开放,很多做云厂商的来说,他们更多关注的是解决方案,我有一个通用模型,然后进到垂直领域里,帮助客户去解决这些问题。这是两种不同的商业模式,我们不卷云厂商,单纯云厂商的赛道这不是我们的重点。我们还是希望说有平台、有产品帮助金融机构去解决我们定义比较清晰的关键问题。
责任编辑:
标签: