机读格式显示(MARC)
- 000 01519nam0 2200325 450
- 010 __ |a 978-7-121-50543-0 |d CNY129.00
- 092 __ |a CN |b 人天1188-3333
- 099 __ |a CAL 012025087314
- 100 __ |a 20250901d2025 em y0chiy50 ea
- 200 1_ |a 大模型训练与推理加速实战 |A da mo xing xun lian yu tui li jia su shi zhan |e 基于CUDA计算平台 |e Python版 |f 温浩编著
- 210 __ |a 北京 |c 电子工业出版社 |d 2025.07
- 215 __ |a X, 454页 |c 图 |d 24cm
- 314 __ |a 温浩, 长期专注于GPU加速计算、大模型训练与推理优化等方向。曾在某芯片公司担任系统架构师, 主导多个基于CUDA平台的深度学习框架与高性能计算模块的研发工作, 积累了丰富的一线实践经验。近年聚焦于大模型的高效训练与部署, 在CUDA性能调优、显存管理和并行计算等方面有深入研究。
- 330 __ |a 本书共10章, 首先介绍大模型训练面临的计算复杂性、内存带宽和数据传输瓶颈等问题, 并讲解基于NCCL的优化方法 ; 然后, 通过深入浅出的讲解, 展示如何使用TensorRT进行推理加速, 探讨多模型并行推理架构、混合精度训练与推理等优化策略 ; 最后, 详细阐述端侧推理加速, 特别是在移动设备和边缘设备中的应用, 强调模型量化、裁剪等技术在推理加速中的重要作用。
- 606 0_ |a 机器学习 |A ji qi xue xi
- 606 0_ |a 程序语言 |A cheng xu yu yan |x 程序设计
- 701 _0 |a 温浩 |A wen hao |4 编著
- 801 _0 |a CN |b 人天书店 |c 20250901
- 962 __ |a 92686131 |x c753224712e4c1cb11d5270cc0666a