潍坊科技学院图书馆书目检索系统

| 暂存书架(0) | 登录



MARC状态:订购 文献类型:中文图书 浏览次数:12

题名/责任者:
DeepSeek硬核技术解读/刘丹,尹俊希,杨院伶著
出版发行项:
北京:机械工业出版社,2025.11
ISBN及定价:
978-7-111-79228-4/CNY99.00
载体形态项:
10,242页:图;24cm
丛编项:
智能系统与技术丛书
个人责任者:
刘丹
个人责任者:
尹俊希
个人责任者:
杨院伶
学科主题:
人工智能
非控制主题词:
DeepSeek
中图法分类号:
TP18
提要文摘附注:
本书是系统剖析DeepSeek系列大模型技术体系与实践路径的专著,结合作者一线研发经验与深度学习、强化学习、分布式系统等多领域知识,全面阐述DeepSeek在模型架构、训练推理、基础设施及数据工程等方面的核心突破与工程实践,兼具理论严谨性与实践指导性,旨在帮助AI研究者、工程师和技术决策者理解大模型关键技术,掌握高效、低成本构建和部署先进AI系统的方法。全书分为两部分:第一部分(第1-5章):DeepSeek学习前置知识,从DeepSeek模型概述和重要突破切入,系统介绍经典Transformer架构、强化学习基础、大语言模型RLHF、量化技术及分布式训练基础知识,为读者奠定理论与技术基础。第二部分(第6-11章):DeepSeek核心技术,先解析DeepSeek的模型架构创新(MoE、MLA、分词器设计等),探讨跨模态对齐、负载均衡、基础设施优化及数据处理等关键议题;再聚焦DeepSeek V3、VL2及开源推理模型的训练逻辑(训练策略、超参数设计、数据构建等)与推理优化(Prefill、Decode阶段优化),提供构建高效可扩展AI系统的完整方法论与实战参考。本书不仅解读技术报告,更注重前沿理论与工业实践结合,帮助读者理解AI系统构建的本质规律与发展趋势,为学术界和工业界提供清晰可复现的高效能人工智能研发路径。
使用对象附注:
AI工程师、大模型研究人员、计算机专业师生及技术爱好者
全部MARC细节信息>>
此书刊没有复本
此书刊可能正在订购中或者处理中
显示全部馆藏信息
CADAL相关电子图书
借阅趋势

同名作者的其他著作(点击查看)
用户名:
密码:
验证码:
请输入下面显示的内容
  证件号 条码号 Email
 
姓名:
手机号:
送 书 地:
收藏到: 管理书架