所属分类:学术专著 > 工业技术 > 自动化技术与计算机技术
视觉描述生成理论与方法研究
- 作者:王岚晓,李宏亮,著
- 定价:48 元
-
内容简介:视觉描述生成是视觉场景理解领域的基础问题,旨在深入理解视觉场景中的目标与环境信息,生成与视觉内容相匹配且符合人类语言规则 的文本描述。在生成式人工智能、智能态势...阅读全部
关注
26
点赞
0
转发
0
索引声明:本图书信息来源于第一次总署获批信息。如图书信息后期变动,本索引不同步变动。
- 成都电子科大出版社 出书
图书详情
- 出版时间:2025.1
- 出版地区:成都
- CIP核准号:2024JB9486
- ISBN:978-7-5770-1210-0
- 正文语种:
- 中图法分类:TP302.7
- 主题词:计算机视觉;研究
- 出版单位:成都电子科大出版社
内容介绍:
视觉描述生成是视觉场景理解领域的基础问题,旨在深入理解视觉场景中的目标与环境信息,生成与视觉内容相匹配且符合人类语言规则
的文本描述。在生成式人工智能、智能态势感知等诸多领域具有重要的理论意义和应用价值。然而,实际应用场景复杂多变,具有对象分
布密集、目标种类繁多、数据收集和标注困难等特性,并且视觉和文本之间模态差异大,从而导致模型生成的描述面临结构完整性较低、
内容准确性不足、描述充分性欠缺、数据依赖性过高等。本书以视觉描述生成任务为切入点,针对实际应用场景复杂多变、对象分布密
集、目标种类繁多、数据收集和标注困难等特性与难点,从语义特征编码与解码两个角度出发,开展视觉描述生成理论与方法研究,并进
一步探索了半监督、无监督下的视觉描述生成问题。本书适用于关注人工智能、计算机视觉、多模态场景解析等相关领域的研究人员。
CIP信息:
视觉描述生成理论与方法研究/王岚晓,李宏亮著.
成都:成都电子科大出版社,2025.1.--ISBN 978-7
-5770-1210-0
I.TP302.7
中国国家版本馆CIP数据核字第2024JB9486号