MARC状态:审校 文献类型:中文图书 浏览次数:5
- 题名/责任者:
- 视觉语言模型VLM原理与实战/吴建明, 吴一昊编著
- 出版发行项:
- 北京:化学工业出版社,2025
- ISBN及定价:
- 978-7-122-47873-3/CNY99.00
- 载体形态项:
- 267页:图;24cm
- 个人责任者:
- 吴建明 编著
- 个人责任者:
- 吴一昊 编著
- 学科主题:
- 自然语言处理
- 中图法分类号:
- TP391
- 一般附注:
- 灵境蓝图
- 责任者附注:
- 吴建明, 上海燧原科技首席专家, 博士研究生毕业于上海交通大学模式识别与智能系统专业。
- 书目附注:
- 有书目 (第265-267页)
- 提要文摘附注:
- 本书共15章, 分为三大部分: 基础综述 (第1章)、关键技术 (第2-14章) 与未来展望 (第15章)。第一部分详解视觉语言模型的网络架构、预训练目标、评估方法及数据集体系, 对比分析对抗训练、生成式预训练等范式, 并建立性能评估基准。第二部分: 第2章通过19个案例展示技术多样性 ; 第3-5章深入探讨少样本学习、鲁棒微调等关键问题, 提出约束线性探测等原创方法 ; 第6-10章聚焦模型扩展性, 涵盖InternVL亿级参数训练、VinVL视觉表征重构等前沿实践 ; 第11-14章探索提示工程、异常检测等应用场景, 包含MATCHER一次性分割等突破性方案。第三部分展望多模态生成、组合推理等未来方向。
全部MARC细节信息>>
| 索书号 | 条码号 | 年卷期 | 馆藏地 | 书刊状态 | 还书位置 |
| TP391/279 | 2338150 | 自然科学书库-四楼西北
|
可借 | 自然科学书库-四楼西北 | |
| TP391/279 | 2338151 | 自然科学书库-四楼西北
|
可借 | 自然科学书库-四楼西北 | |
| TP391/279 | 2338152 | 自然科学书库-四楼西北
|
可借 | 自然科学书库-四楼西北 |
显示全部馆藏信息




自然科学书库-四楼西北