机读格式显示(MARC)

000 01229nam0 2200253 450

001 0000747775

005 20240910105000.0

010 __ |a 978-7-121-47740-9 |d CNY159.00

100 __ |a 20240509d2024 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a a z 000yy

106 __ |a r

200 1_ |a 解构大语言模型 |A jie gou da yu yan mo xing |e 从线性回归到通用人工智能 |f 唐亘著

210 __ |a 北京 |c 电子工业出版社 |d 2024

215 __ |a xviii, 414页 |c 彩图 |d 24cm

300 __ |a 博文视点

330 __ |a 本书从模型的结构和数据基础两个方面解构大语言模型，以便帮助读者理解和搭建类似ChatGPT的系统。在模型的结构方面，大语言模型属于深度神经网络，其设计核心是注意力机制，因此，本书涵盖了多层感知器、卷积神经网络和循环神经网络等经典模型。在模型的数据基础方面，本书既涉及模型训练的工程基础，如反向传播，又涉及数据的使用方式，如迁移学习、强化学习，以及传统的监督学习和无监督学习。此外，本书还阐述了如何从计量经济学和经典机器学习模型中汲取灵感，以提高模型的稳定性和可解释性。

517 1_ |a 从线性回归到通用人工智能 |A cong xian xing hui gui dao tong yong ren gong zhi neng

606 0_ |a 自然语言处理 |A zi ran yu yan chu li

690 __ |a TP391 |v 5

701 _0 |a 唐亘 |A tang gen |4 著

801 _0 |a CN |b WFKJXY |c 20240910

905 __ |a WFKJXY |d TP391/218