CNFinBench公布大语言模型综合得分:中国平安金融大模型荣登榜首

中国平安金融大模型登顶CNFinBench榜单

　　近日，中国平安金融大模型PingAnGPT-Qwen3-32B在行业权威大模型评测体系CNFinBench大语言模型公开榜单上综合排名榜首。本次参评模型阵容强大、竞争激烈，涵盖DeepSeek-R1（671B）、Qwen3-235B-A22B、Kimi-K2（1000B）等开源大模型，以及GPT-4o、Claude-Sonnet 4、Doubao-1.5-pro等领先的闭源商业模型，代表当前行业水平。此次评测登顶也标志着平安在金融大模型领域的技术能力已达到行业先进水平。

CNFinBench：权威金融大模型评测基准

　　CNFinBench是由上海人工智能国家实验室团队联合金融领域权威机构打造的中文金融大模型综合性评测基准，为当前国内具权威性和行业认可度的金融大模型能力评估平台。本次测评中，PingAnGPT-Qwen3-32B在金融事实推理与计算、金融专业知识问答、金融合规与风险控制等多项关键指标表现卓越，展现出精准的金融数值计算能力、严谨的逻辑推理能力和全金融领域知识体系的深度掌握，尤其在金融投研分析、风险计量等场景具有重要应用价值和安全可控优势。

轻量高效，实现性能与效率突破

　　评测方表示，此次登顶CNFinBench，体现了平安在金融大模型领域的技术实力。值得关注的是，中国平安参评的模型仅采用32B参数规模，不足DeepSeek-R1（671B）的5%及Kimi-K2（1000B）的3.2%规模，却实现了综合性能上的超越，在模型效率与性能平衡上实现了重要技术突破。依托于“轻量高效”特性，该模型已支持产险车险报案、人事员服智能问数、客服实时质检、智能话术、集团财资费用审核等97个业务场景，并为其后续在私有化部署、场景化应用提供了坚实基础。

五大核心维度全面评估

　　据悉，CNFinBench评测体系覆盖金融专业知识问答、金融业务理解与分析、金融事实推理与计算、金融合规与风险控制、金融内生与应用安全五大核心维度，全面检验模型在金融垂直领域的专业深度、业务理解力、计算准确性、合规意识及安全可控性。

数据与专利双轮驱动

　　2025年前三季度，平安的数据库已沉淀30万亿字节数据，覆盖近2.50亿个人客户；基于海量数据训练大模型，积累超3.2万亿高质量文本语料，31万小时带标注的语音语料，超75亿图片语料。以海量数据为基础，以科技公司服务技术开发与应用，平安持续拓展场景应用的深度和广度，赋能金融业务优体验、控风险、降成本、促销售。2026年2月，国家知识产权出版社发布《金融科技行业2025年专利分析白皮书》与《医疗健康行业2025年专利分析白皮书》，中国平安再度揽获2025年金融科技、医疗健康行业专利数双榜首，并在多项核心技术与关键应用场景中占据领先地位。

践行服务承诺，助力金融强国建设

　　中国平安表示，通过打造领先AI能力，推进模型优化迭代，深化场景化应用落地，公司持续将技术优势转化为服务价值，以高质量的数字化金融供给，不断满足人民群众对美好生活的向往，践行“省心、省时、又省钱”的服务承诺，为金融强国建设贡献平安力量。

智算多多

联系我们

官方邮箱：service@zsdodo.com

公司地址：北京市丰台区南四环西路188号总部基地三区国联股份数字经济总部

关注我们

公众号

视频号