MARC状态:审校 文献类型:中文图书 浏览次数:4
- 题名/责任者:
- 大模型轻量化:模型压缩与训练加速/梁志远著
- 出版发行项:
- 北京:清华大学出版社,2025
- ISBN及定价:
- 978-7-302-68600-2/CNY129.00
- 载体形态项:
- 384页:图;24cm
- 其它题名:
- 模型压缩与训练加速
- 个人责任者:
- 梁志远 著
- 学科主题:
- 人工智能
- 中图法分类号:
- TP18
- 提要文摘附注:
- 本书分为三部分共10章, 首先聚焦大模型的背景与面临的问题, 讲解了Transformer和MoE架构的基本原理; 随后重点讲解模型压缩、训练加速和推理优化等核心技术, 包括量化、蒸馏和剪枝等, 并通过实际案例验证其效用; 后续则详述端侧学习与计算引擎优化策略, 尤其是动态Batch和异构执行的工程实现。最后针对高性能算子库与手工算子开发, 分别以cuDNN、NEON、CUDA等实际案例为导向, 揭示算子优化的细节; 结尾以最新的国产开源模型DeepSeek-V3为例, 展现从训练到推理的综合优化方案。
- 使用对象附注:
- 从事大模型开发的工程师
全部MARC细节信息>>
| 索书号 | 条码号 | 年卷期 | 馆藏地 | 书刊状态 | 还书位置 |
| TP18/1064 | 2417159 | 自然科学书库-四楼西北
|
可借 | 自然科学书库-四楼西北 | |
| TP18/1064 | 2417160 | 自然科学书库-四楼西北
|
可借 | 自然科学书库-四楼西北 |
显示全部馆藏信息




自然科学书库-四楼西北