DeepSeek:重塑全球AI格局的中国力量

阅读 36 格式 pdf 大小 9.64 MB 共70页2025-06-24 19:47:16发布于浙江
DeepSeek:重塑全球AI格局的中国力量国盛计算机2025.5目录顶尖大模型发布进展不断AI应用:MCP驱动Agent生态加速构建AI应用:端侧/智驾/机器人/军工等AI驱动中国科技资产重估AI基建带动国产算力、云厂商需求2DeepSeek震撼科技圈:一月时间差并肩最强推理模型o1数学、代码能力追平o12024.5DeepSeek-V2发布提出MLA和DeepSeekMoE架构相比第一代DeepSeek67B实现了更强的性能,节省了42.5%的训练成本,减少了93.3%的KV缓存2024.11推理模型DeepSeek-R1.Lite预览版发布媲美01-preview的推理效果并为用户展现了o1没有公开的思考过程2024.12DeepSeek-V3发布DeepSeek-V3671B在2048块NVIDIAH800集群上训练2个月,训练成本仅558万美元,达到GPT-4o和ClaudeSonnet3.5水准2025.1.20DeepSeek-R1发布从数学(AIME/MATH)、编程(Codefor...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

提示信息

syntax error, unexpected string content "filee", expecting ")"

[返回上一页]