机读格式显示(MARC)
- 000 01536nam0 2200289 450
- 010 __ |a 978-7-122-47873-3 |d CNY99.00
- 100 __ |a 20250818d2025 em y0chiy50 ea
- 200 1_ |a 视觉语言模型VLM原理与实战 |A shi jue yu yan mo xing VLM yuan li yu shi zhan |d = Principles and practice of vision language model(VLM) |f 吴建明, 吴一昊编著 |z eng
- 210 __ |a 北京 |c 化学工业出版社 |d 2025
- 215 __ |a 267页 |c 图 |d 24cm
- 314 __ |a 吴建明, 上海燧原科技首席专家, 博士研究生毕业于上海交通大学模式识别与智能系统专业。
- 320 __ |a 有书目 (第265-267页)
- 330 __ |a 本书共15章, 分为三大部分: 基础综述 (第1章)、关键技术 (第2-14章) 与未来展望 (第15章)。第一部分详解视觉语言模型的网络架构、预训练目标、评估方法及数据集体系, 对比分析对抗训练、生成式预训练等范式, 并建立性能评估基准。第二部分: 第2章通过19个案例展示技术多样性 ; 第3-5章深入探讨少样本学习、鲁棒微调等关键问题, 提出约束线性探测等原创方法 ; 第6-10章聚焦模型扩展性, 涵盖InternVL亿级参数训练、VinVL视觉表征重构等前沿实践 ; 第11-14章探索提示工程、异常检测等应用场景, 包含MATCHER一次性分割等突破性方案。第三部分展望多模态生成、组合推理等未来方向。
- 510 1_ |a Principles and practice of vision language model (VLM) |z eng
- 606 0_ |a 自然语言处理 |A zi ran yu yan chu li
- 701 _0 |a 吴建明 |A wu jian ming |4 编著
- 701 _0 |a 吴一昊 |A wu yi hao |4 编著
- 801 _0 |a CN |b WFKJXY |c 20250926
- 905 __ |a WFKJXY |d TP391/279