书单推荐
更多
新书推荐
更多

大模型轻量化:模型压缩与训练加速

大模型轻量化:模型压缩与训练加速

定  价:129 元

        

当前图书已被 4 所学校荐购过!
查看明细

  • 作者:梁志远
  • 出版时间:2025/4/1
  • ISBN:9787302686002
  • 出 版 社:清华大学出版社
  • 中图法分类:TP18 
  • 页码:396
  • 纸张:
  • 版次:1
  • 开本:
9
7
6
8
8
7
6
3
0
0
0
2
2
"《大模型轻量化:模型压缩与训练加速》围绕大模型轻量化这一主题,系统地阐述大模型轻量化的基本理论与实现方法,旨在提升模型的部署效率和计算性能。全书分为3部分,共10章。第1部分(第1~5章),介绍大模型的背景与面临的问题,以及Transformer和MoE架构的基本原理;重点讲解模型压缩、训练加速和推理优化等核心技术,包括量化、蒸馏和剪枝等,并通过实际案例验证其效果。第2部分(第6、7章),重点介绍端侧学习与计算引擎优化策略,尤其是动态Batch和异构执行的工程实现。第3部分(第8~10章),针对高性能算子库与手工算子开发,分别以cuDNN、NEON、CUDA等为代表,揭示算子优化的细节,最后,以国产开源模型DeepSeek-V3为例,展现从训练到推理的综合优化方案。
《大模型轻量化:模型压缩与训练加速》提供全面实用的轻量化方法论,结合丰富代码示例与实践案例,适合从事大模型开发与优化的工程师,也为研究人员提供深入探讨的素材与视角,助力解决大模型训练与推理中的实际问题。"
 你还可能感兴趣
 我要评论
您的姓名   验证码: 图片看不清?点击重新得到验证码
留言内容