华为姚骏:构建自主可控的全栈AI能力,为世界提供第二选择
2025年12月27—28日,中国财富管理50人论坛2025年会暨国研平台第三届“AI+金融”峰会在京召开。在前沿对话环节,阿里、腾讯、字节、华为四家互联网大厂同台对话,分享对2026年AI最新趋势与产业协同的观点。
华为算力先遣队副总参谋长姚骏介绍,全面智能化(All Intelligence)是华为的战略发展方向,其中一个重要环节是打造基于昇腾的算力底座,为世界提供第二选择。当前,AI算力的竞争重点,包括训练和推理两方面都已经从单卡性能转向集群性能。华为推出的大EP技术能够高效利用多机多卡推理,降低时延、提升吞吐量,降低推理成本,进一步推动大模型用的好、用的起。华为持续推动AI领域的开源开放,近期已实现昇腾算力的使能层(CANN)和模型OpenPangu的开源,未来将长期坚持开源路线,并在生态建设上持续支持多样化的模型发展。姚骏认为,行业AI的算力需求远未饱和,金融领域有望成为继互联网之后的第二大AI应用高地。在行业应用中,大模型仅是系统的一部分,更高水平的行业智能需要结合行业经验,进行针对具体场景的模型构建。在金融领域,华为已推动“提示词工程-RAG-微调-智能体”四阶段范式的落地,助力垂直应用的发展。

一、自身定位:自主可控的算力底座
华为是一家算力公司,致力于构建自主可控的全栈AI能力,希望为世界提供第二选择。华为在2017年就预判了AI是未来的发展方向,确立了“All in AI”战略。在算力上,从昇腾910A到910C,再到Atlas超节点集群,华为始终致力于全栈AI能力的构建。国计民生行业对自主可控有很高的要求,我们不仅帮助客户“能建”、“能用”,更通过集群算力、推理优化和开源生态,让AI算力从少数人会用的稀缺资源变为人人可得的基础服务,真正做到“会用”、“好用”,最终使华为算力成为客户的主动选择。
基于现在掌握的工艺,国内AI单芯片的能力不如业界最领先的AI芯片,这种差距并非一家之力能瞬间抹平的。然而单芯片算力并不是当前AI使能的唯一指标,AI的大规模应用需要有好的系统级的解决方案。无论是千亿还是万亿参数的大模型,都必须依赖集群能力,这正是通过系统级优化弥补单点不足的突围之道。华为推出了“灵衢总线”等集群技术,通过优化通讯时延来提升整个集群的有效算力。华为的竞争力体现在大规模集群训练上,能支持客户高效的从零训练出领先的大模型。2025年的主战场在推理,模型训练出来只是第一步,真正的挑战在于大规模应用时的成本和时延。为此,华为推出了“大EP”技术(分布式推理优化),在DeepSeek、通义千问等主流模型上实现了高吞吐、低时延的运行效果,将AI的使用成本降至“人人可得”的水平。
二、开源生态实现技术平权
在模型等策略上,华为持开放态度。华为支持各类模型在昇腾卡上的0day适配,并将芯片使能层CANN层(类比英伟达的CUDA)进行开源,支持开发者开发算子,将适配周期从过去的一两个月缩短至一两周,甚至更短。华为盘古模型也经历了从闭源到开源的转变,推出了“OpenPangu”系列(1B/7B/72B/718B等),OpenPangu自身的智力水平在持续提升,并且对大规模集群训练推理是一个很好的参考设计。我们希望通过开源,推动技术平权,支撑提升全行业的智能化水平。
三、四阶范式实现金融行业落地
作为除互联网外最大的AI算力需求方,金融行业的智能化路径备受关注。金融行业因其庞大的To C属性(如手机银行、财富助手),天然具备海量的推理场景,为了帮助金融机构更好地落地大模型,我们提出了“四阶范式”的方法论:提示词工程:在不修改模型的前提下,通过优化Prompt解决通用问题;RAG:引入外部知识库,解决模型幻觉和知识滞后;增量微调/强化学习:针对风控、审计等高阶应用,注入行业数据和专家逻辑,这是落地的“深水区”;Agent:帮助具体岗位处理复杂任务,实现操作闭环,成为岗位助理。其中的多智能体是未来通过群体智能提升行业智能化水平的重点,未来的团队构成也将从现在的人-人,演进到人-机、机-机共事,人作为团队的Leader,带队完成最终的决策。
四、金融AI算力“扩容潮”来袭
除互联网外,金融的行业智能化起步很早,推进很快。金融是除互联网外,算力需求最大的行业,约占非互联网行业算力的一半。这主要得益于金融行业具备庞大的ToC属性,如手机银行、财富助手等,海量用户调用带来了巨大的推理需求。随着DeepSeek R1等优秀模型的引入和优化,金融机构的算力利用率在2025年提高很快,Token量和调用次数都有大幅提升,AI算力从“用不起来”演进到“完全不够用”,扩容已成为必然趋势。华为算力平台先遣队正致力于帮助金融灯塔客户,完成从算力建设到智能水平提升的跨越。