行业首批！昆仑万维完成中国信通院“可信AI”大模型开发与能力两大模块标准符合性验证

发布日期：2023-11-17 来源：昆仑万维集团分享到：

大规模预训练模型（以下简称“大模型”）作为数字时代的智能基座，逐渐成为新一轮科技革命和产业变革的重要驱动力量。然而，目前大模型产品种类繁多、实际生产价值难以量化、能力判断标准尚未统一，亟需通过标准符合性验证等手段进行全面评价，推动产业高质量发展。

中国信息通信研究院（以下简称“中国信通院”）高度重视大模型发展动态，依托人工智能关键技术和应用评测工业和信息化部重点实验室，联合业内百余家单位根据技术发展态势快速迭代大模型标准体系2.0。标准涵盖大模型全生命周期，紧密围绕开发、能力、运营、应用和可信要求五个关键环节，在技术提质、产品增信、服务规范等方面具有重要作用。

▲图1 中国信通院大模型标准体系2.0

2023年8月-9月，昆仑万维天工大模型（V3.5）参与中国信通院组织的可信AI大模型标准符合性验证，顺利完成模型开发和模型能力两大模块验证，并获得当前模块4+级最高评分。

此次评测，依据《大规模预训练模型技术和应用评估方法第1部分：模型开发》、《大规模预训练模型技术和应用评估方法第2部分：模型能力》开展，其中模型开发模块涉及5大能力域、29个能力项，模型能力模块涉及2大能力域、37个能力项，多维度验证大模型在数据管理、模型训练、模型管理、模型部署、开发流程一体化方面的技术成熟度，全方位评估大模型在语义、视觉、语音、跨模态等方面的服务丰富度。

参与本次符合性验证的昆仑万维天工大模型（V3.5）在模型开发方面表现突出，在数据清洗、数据质检、数据版本管理、开发过程稳定性、资源优化调度、有效计算能力、镜像管理、版本管理、日志管理、模型微调、模型转换、模型蒸馏、开发流程一体化方面具备较为完善的能力。

在模型能力方面表现优异，支持智能语义、智能视觉、智能语音和跨模态四个任务领域，支持词法分析、句法分析、语义分析、语义消歧、机器翻译、对话系统、情感分析、文本分类、文本生成、代码生成、阅读理解、摘要生成、文本纠错、OCR、人脸识别、图像分类、动作识别、图片生成、目标检测、语义分割、实例分割、视觉检索、语音识别、语音合成、声纹识别、图文检索、图文生成、视频文本相关性匹配等多项任务，且相应能力项均具备较高的准确率和可接受度。

▲图2 天工大模型平台展示界面

天工大模型致力于生成顺畅、准确且内容相关的自然语言文本。模型采用了类似GPT-3的深层Transformers架构，通过使用注意力机制和多头机制，使模型具有较强的上下文理解力并能够准确识别词语间的联系，提高了模型的预测精度。除文本能力外，天工大模型在多模态等前沿领域也不断进行探索和场景，并在训练环节中积累了一系列专有技术，以保证模型的专有性和独特性。

行业首批！昆仑万维完成中国信通院“可信AI”大模型开发与能力两大模块标准符合性验证

你知道你的Internet Explorer是过时了吗?