潍坊科技学院图书馆书目检索系统

| 暂存书架(0) | 登录



MARC状态:审校 文献类型:中文图书 浏览次数:4

题名/责任者:
大模型轻量化:模型压缩与训练加速/梁志远著
出版发行项:
北京:清华大学出版社,2025
ISBN及定价:
978-7-302-68600-2/CNY129.00
载体形态项:
384页:图;24cm
其它题名:
模型压缩与训练加速
个人责任者:
梁志远
学科主题:
人工智能
中图法分类号:
TP18
提要文摘附注:
本书分为三部分共10章, 首先聚焦大模型的背景与面临的问题, 讲解了Transformer和MoE架构的基本原理; 随后重点讲解模型压缩、训练加速和推理优化等核心技术, 包括量化、蒸馏和剪枝等, 并通过实际案例验证其效用; 后续则详述端侧学习与计算引擎优化策略, 尤其是动态Batch和异构执行的工程实现。最后针对高性能算子库与手工算子开发, 分别以cuDNN、NEON、CUDA等实际案例为导向, 揭示算子优化的细节; 结尾以最新的国产开源模型DeepSeek-V3为例, 展现从训练到推理的综合优化方案。
使用对象附注:
从事大模型开发的工程师
全部MARC细节信息>>
索书号 条码号 年卷期 馆藏地 书刊状态 还书位置
TP18/1064 2417159   自然科学书库-四楼西北     可借 自然科学书库-四楼西北
TP18/1064 2417160   自然科学书库-四楼西北     可借 自然科学书库-四楼西北
显示全部馆藏信息
CADAL相关电子图书
借阅趋势

同名作者的其他著作(点击查看)
用户名:
密码:
验证码:
请输入下面显示的内容
  证件号 条码号 Email
 
姓名:
手机号:
送 书 地:
收藏到: 管理书架