MARC状态:订购 文献类型:中文图书 浏览次数:14
- 题名/责任者:
- 高效深度学习:模型压缩与设计/汪玉,宁雪妃著
- 出版发行项:
- 北京:电子工业出版社,2024
- ISBN及定价:
- 978-7-121-48059-1/CNY109.00
- 载体形态项:
- 301页
- 丛编项:
- 通用智能与大模型丛书
- 中图法分类号:
- TP181
- 提要文摘附注:
- 在生成式人工智能的时代,我们见证了模型推理对存储空间和计算能力的巨大需求,这对大语言模型和视觉生成模型的实际应用提出了前所未有的挑战。在这样的背景下,高效模型压缩和模型设计技术显得尤为重要,它们是降低模型计算和存储需求的关键,使得模型的快速部署和高效运行成为可能。本书系统地介绍了高效模型压缩和模型设计的方法,在编写上兼顾理论和实践。本书主体部分详细介绍了模型压缩的方法论,包括高效模块设计、模型剪枝、模型量化、模型二值化、神经网络架构搜索、知识蒸馏几大部分。另外,简要介绍了定制化硬件加速器的设计及大语言模型的加速和压缩。
全部MARC细节信息>>



