行业首批!昆仑万维完成中国信通院“可信AI”大模型开发与能力两大模块标准符合性验证
大规模预训练模型(以下简称“大模型”)作为数字时代的智能基座,逐渐成为新一轮科技革命和产业变革的重要驱动力量。然而,目前大模型产品种类繁多、实际生产价值难以量化、能力判断标准尚未统一,亟需通过标准符合性验证等手段进行全面评价,推动产业高质量发展。
中国信息通信研究院(以下简称“中国信通院”)高度重视大模型发展动态,依托人工智能关键技术和应用评测工业和信息化部重点实验室,联合业内百余家单位根据技术发展态势快速迭代大模型标准体系2.0。标准涵盖大模型全生命周期,紧密围绕开发、能力、运营、应用和可信要求五个关键环节,在技术提质、产品增信、服务规范等方面具有重要作用。

▲图1 中国信通院大模型标准体系2.0
2023年8月-9月,昆仑万维天工大模型(V3.5)参与中国信通院组织的可信AI大模型标准符合性验证,顺利完成模型开发和模型能力两大模块验证,并获得当前模块4+级最高评分。
此次评测,依据《大规模预训练模型技术和应用评估方法 第1部分:模型开发》、《大规模预训练模型技术和应用评估方法 第2部分:模型能力》开展,其中模型开发模块涉及5大能力域、29个能力项,模型能力模块涉及2大能力域、37个能力项,多维度验证大模型在数据管理、模型训练、模型管理、模型部署、开发流程一体化方面的技术成熟度,全方位评估大模型在语义、视觉、语音、跨模态等方面的服务丰富度。
参与本次符合性验证的昆仑万维天工大模型(V3.5)在模型开发方面表现突出,在数据清洗、数据质检、数据版本管理、开发过程稳定性、资源优化调度、有效计算能力、镜像管理、版本管理、日志管理、模型微调、模型转换、模型蒸馏、开发流程一体化方面具备较为完善的能力。
在模型能力方面表现优异,支持智能语义、智能视觉、智能语音和跨模态四个任务领域,支持词法分析、句法分析、语义分析、语义消歧、机器翻译、对话系统、情感分析、文本分类、文本生成、代码生成、阅读理解、摘要生成、文本纠错、OCR、人脸识别、图像分类、动作识别、图片生成、目标检测、语义分割、实例分割、视觉检索、语音识别、语音合成、声纹识别、图文检索、图文生成、视频文本相关性匹配等多项任务,且相应能力项均具备较高的准确率和可接受度。

▲图2 天工大模型平台展示界面
天工大模型致力于生成顺畅、准确且内容相关的自然语言文本。模型采用了类似GPT-3的深层Transformers架构,通过使用注意力机制和多头机制,使模型具有较强的上下文理解力并能够准确识别词语间的联系,提高了模型的预测精度。除文本能力外,天工大模型在多模态等前沿领域也不断进行探索和场景,并在训练环节中积累了一系列专有技术,以保证模型的专有性和独特性。


