MARC状态:订购 文献类型:中文图书 浏览次数:7
- 题名/责任者:
- 大模型训练与推理加速实战:基于CUDA计算平台/温浩编著
- 出版发行项:
- 北京:电子工业出版社,2025.07
- ISBN及定价:
- 978-7-121-50543-0/CNY129.00
- 载体形态项:
- X, 454页:图;24cm
- 个人责任者:
- 温浩 编著
- 学科主题:
- 机器学习
- 学科主题:
- 程序语言-程序设计
- 非控制主题词:
- Python
- 中图法分类号:
- TP181
- 中图法分类号:
- TP312PY
- 责任者附注:
- 温浩, 长期专注于GPU加速计算、大模型训练与推理优化等方向。曾在某芯片公司担任系统架构师, 主导多个基于CUDA平台的深度学习框架与高性能计算模块的研发工作, 积累了丰富的一线实践经验。近年聚焦于大模型的高效训练与部署, 在CUDA性能调优、显存管理和并行计算等方面有深入研究。
- 提要文摘附注:
- 本书共10章, 首先介绍大模型训练面临的计算复杂性、内存带宽和数据传输瓶颈等问题, 并讲解基于NCCL的优化方法 ; 然后, 通过深入浅出的讲解, 展示如何使用TensorRT进行推理加速, 探讨多模型并行推理架构、混合精度训练与推理等优化策略 ; 最后, 详细阐述端侧推理加速, 特别是在移动设备和边缘设备中的应用, 强调模型量化、裁剪等技术在推理加速中的重要作用。
全部MARC细节信息>>



