通用认知智能大模型有了能力评测体系

科技日报记者 吴长锋


(资料图片)

6月3日,以“AI大模型时代的长三角数字化之路”为主题的长三角企业家联盟产业数字化峰会在安徽合肥举行。会上,认知智能全国重点实验室、中国科学院人工智能产学研创新联盟和长三角人工智能产业链联盟共同发布了通用认知智能大模型评测体系,旨在形成一套覆盖多任务的大模型能力客观评测体系,引导中国认知智能大模型技术和产业健康发展。

认知智能大模型或迎爆发式增长

伴随着人工智能技术的进步,认知智能大模型或成为实现通用人工智能的“曙光”。

未来几年,随着业界长期系统性推进人工智能的技术研发,认知智能大模型或将迎来爆发式增长,传统的内容生产及传播方式或被改写,人机协作将进一步改变人们的生产生活方式,甚至将改写现有的产业生态格局——一些传统产业将“被迫”进行转型升级,认知智能技术将创造出新的职业、岗位,为整个信息产业和数字经济带来新的发展契机。

5月6日,科大讯飞股份有限公司(以下简称科大讯飞)正式发布讯飞星火认知大模型。仅一个月后,科大讯飞宣布,星火认知大模型“牵手”工业互联网平台,实现在“产、供、销、服、管”等各流程的知识学习与人工智能赋能,有效助力企业降本增效。

从各大互联网企业的发展路径可以看出,工业互联网建设和企业数字化转型等或是实现认知智能大模型规模化落地应用的重要切入口。

然而,如何提前研判认知智能大模型给各行各业带来的颠覆性改变和创新性发展机遇,使得企业能够及时且有针对性地作出相应的调整?这就需要一套科学、系统的客观评测体系,既可以综合判断现阶段的技术进展,还能够明确认知智能大模型多维度的发展路径。认知智能大模型领域“百花齐放”,效果度量和评价成为重点,覆盖多维度、多任务的客观评测成为验证认知智能大模型能力的重要手段。

科学研判通用认知智能大模型

针对现实需求,认知智能全国重点实验室牵头设计,与中国科学院人工智能产学研创新联盟、长三角人工智能产业链联盟一起,从产学研源头技术创新和产业链应用落地两方面出发,组织多轮评测标准研讨会议,邀请中国科学院科技战略咨询研究院、中科寒武纪科技股份有限公司、科大讯飞等产学研各界代表探讨交流,共同形成了通用认知智能大模型评测体系。

“评测体系根据底层认知智能能力的智能涌现对通用认知智能大模型的能力进行分析,从而制定通用认知智能大模型的评测标准与评测方法,更科学地衡量通用认知智能大模型各个方面的能力和水平。”认知智能全国重点实验室副主任王士进介绍说。

王士进表示,本次发布的评测体系覆盖内容生成、语言理解、知识问答、逻辑推理、数学能力、编程能力、多模态7大能力维度,共计481个细分任务类型,力求为大模型的研究、行业标准的制定提供参考和借鉴。

他表示,未来评测体系将致力于让认知智能大模型技术真正解决社会刚需,助力长三角打造具有全球影响力的通用人工智能科技创新策源地和新兴产业聚集地。“围绕推动通用人工智能评测体系共建,下一步,认知智能全国重点实验室希望与长三角企业家联盟单位基于通用评测体系持续合作优化,共同推动行业评测方案落地,促进技术和产业健康发展。”王士进说。

关键词:

为您推荐

通用认知智能大模型有了能力评测体系

科技日报记者 吴长锋6月3日,以“AI大模型时代的长三角数字化之路”为

来源:科技日报2023-06-12

2023天津市海河教育园体育中心招聘拟聘用人员公示-每日观点

根据《天津市事业单位公开招聘人员实施办法(试行)》(津人社局发〔2011

来源:天津市体育局2023-06-12

三星终于用上水滴铰链!Galaxy Z Fold5折痕缩小15%

三星终于用上水滴铰链!GalaxyZFold5折痕缩小15%

来源:站长之家2023-06-12

【世界快播报】前海开源沪港深乐享生活增聘基金经理刘博源

近日,前海开源基金管理有限公司公告,前海开源沪港深乐享生活增聘基金

来源:中国经济网2023-06-12

【独家】农发行重庆市分行银政携手 精准施策共谋山城发展

近年来,农发行重庆市分行不断把积极深化与地方政府合作作为推动全分行

来源:证券日报2023-06-12

全球速递!烟台市莱山区实验小学夺得“区长杯”足球赛五连冠

5月9日—6月7号,莱山教体局举办了2023莱山区“区长杯”小学生校园足球

来源:教育文摘周报2023-06-12

世俱杯已确定曼城、吉达联合、浦和红钻等6队,仅南美冠军未确定 天天播资讯

世俱杯已确定曼城、吉达联合、浦和红钻等6队,仅南美冠军未确定,欧冠,

来源:直播吧2023-06-12

前沿热点:京津城际列车即将扩容

记者从中国铁路北京局集团有限公司获悉,为满足广大群众出行需求,中国

来源:央广网2023-06-12