DeepSeek:重塑全球AI格局的中国力量国盛计算机2025.5目录顶尖大模型发布进展不断AI应用:MCP驱动Agent生态加速构建AI应用:端侧/智驾/机器人/军工等AI驱动中国科技资产重估AI基建带动国产算力、云厂商需求2DeepSeek震撼科技圈:一月时间差并肩最强推理模型o1数学、代码能力追平o12024.5DeepSeek-V2发布提出MLA和DeepSeekMoE架构相比第一代DeepSeek67B实现了更强的性能,节省了42.5%的训练成本,减少了93.3%的KV缓存2024.11推理模型DeepSeek-R1.Lite预览版发布媲美01-preview的推理效果并为用户展现了o1没有公开的思考过程2024.12DeepSeek-V3发布DeepSeek-V3671B在2048块NVIDIAH800集群上训练2个月,训练成本仅558万美元,达到GPT-4o和ClaudeSonnet3.5水准2025.1.20DeepSeek-R1发布从数学(AIME/MATH)、编程(Codefor...
发表评论取消回复