中文大模型基准测评2025年5月报告—2025中文大模型阶段性进展5月评估SuperCLUE团队2025.05.28精准量化通用人工智能(AGI)进展,定义人类迈向AGI的路线图AccuratelyquantifyingtheprogressofAGI,definingtheroadmapforhumanity'sjourneytowardsAGI.一、2025上半年度关键进展及趋势1.2025年上半年大模型关键进展2.2025年最值得关注的中文大模型全景图3.2025年国内外大模型差距报二、5月通用测评介绍1.SuperCLUE基准介绍2.SuperCLUE大模型综合测评体系告3.SuperCLUE通用测评基准数据集及评价方式目4.各维度测评说明及示例5.测评模型列表录三、总体测评结果与分析1.SuperCLUE模型象限2.SuperCLUE通用能力测评榜单3.SuperCLUE-Agent:智能体测评分析4.SuperCLUE性价比区间分布5.SuperCLUE大模型综合效能区间分布6.国内...
发表评论取消回复