“求索”人工智能评测基准体系测试工作启动
中国消费者报北京讯(记者董芳忠)近日,中国电子技术标准化研究院(以下简称电子标准院)正式启动基于“求索”人工智能评测基准体系的测试工作。
据介绍,电子标准院将对大模型的高阶通用能力、重点行业能力、大模型安全能力、智能体、具身智能等领域展开测试。其中,大模型高阶通用能力测试将重点评估大模型在深度推理与复杂问题求解、代码理解与生成、多模态理解与生成等方面的突破性能力。重点行业能力测试将评估AI模型在工业流程决策、电力设备智能运检、钢材表面缺陷视觉检测、油气勘探数据分析等专业场景下的实际表现,加速AI技术在关键行业落地应用。
电子标准院相关负责人表示,“求索”人工智能评测基准体系测试工作的启动,将极大地促进我国人工智能技术的规范化、高质量发展及在各行各业的安全可靠应用,为发展新质生产力注入强劲动能。