机读格式显示(MARC)

000 01536nam0 2200289 450

001 0000843560

005 20250926213700.0

010 __ |a 978-7-122-47873-3 |d CNY99.00

100 __ |a 20250818d2025 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a a a 000yy

106 __ |a r

200 1_ |a 视觉语言模型VLM原理与实战 |A shi jue yu yan mo xing VLM yuan li yu shi zhan |d = Principles and practice of vision language model(VLM) |f 吴建明, 吴一昊编著 |z eng

210 __ |a 北京 |c 化学工业出版社 |d 2025

215 __ |a 267页 |c 图 |d 24cm

300 __ |a 灵境蓝图

314 __ |a 吴建明, 上海燧原科技首席专家, 博士研究生毕业于上海交通大学模式识别与智能系统专业。

320 __ |a 有书目 (第265-267页)

330 __ |a 本书共15章, 分为三大部分: 基础综述 (第1章)、关键技术 (第2-14章) 与未来展望 (第15章)。第一部分详解视觉语言模型的网络架构、预训练目标、评估方法及数据集体系, 对比分析对抗训练、生成式预训练等范式, 并建立性能评估基准。第二部分: 第2章通过19个案例展示技术多样性 ; 第3-5章深入探讨少样本学习、鲁棒微调等关键问题, 提出约束线性探测等原创方法 ; 第6-10章聚焦模型扩展性, 涵盖InternVL亿级参数训练、VinVL视觉表征重构等前沿实践 ; 第11-14章探索提示工程、异常检测等应用场景, 包含MATCHER一次性分割等突破性方案。第三部分展望多模态生成、组合推理等未来方向。

510 1_ |a Principles and practice of vision language model (VLM) |z eng

606 0_ |a 自然语言处理 |A zi ran yu yan chu li

690 __ |a TP391 |v 5

701 _0 |a 吴建明 |A wu jian ming |4 编著

701 _0 |a 吴一昊 |A wu yi hao |4 编著

801 _0 |a CN |b WFKJXY |c 20250926

905 __ |a WFKJXY |d TP391/279