视觉描述生成理论与方法研究 - 中图百佳出版收录索引数据库·学术专著

所属分类：学术专著 > 工业技术 > 自动化技术与计算机技术

视觉描述生成理论与方法研究

作者：王岚晓,李宏亮，著
定价：48 元
内容简介：

视觉描述生成是视觉场景理解领域的基础问题，旨在深入理解视觉场景中的目标与环境信息，生成与视觉内容相匹配且符合人类语言规则的文本描述。在生成式人工智能、智能态势...阅读全部

关注
548

索引声明：本图书信息来源于第一次总署获批信息。如图书信息后期变动，本索引不同步变动。

图书详情

内容介绍：

视觉描述生成是视觉场景理解领域的基础问题，旨在深入理解视觉场景中的目标与环境信息，生成与视觉内容相匹配且符合人类语言规则

的文本描述。在生成式人工智能、智能态势感知等诸多领域具有重要的理论意义和应用价值。然而，实际应用场景复杂多变，具有对象分

布密集、目标种类繁多、数据收集和标注困难等特性，并且视觉和文本之间模态差异大，从而导致模型生成的描述面临结构完整性较低、

内容准确性不足、描述充分性欠缺、数据依赖性过高等。本书以视觉描述生成任务为切入点，针对实际应用场景复杂多变、对象分布密

集、目标种类繁多、数据收集和标注困难等特性与难点，从语义特征编码与解码两个角度出发，开展视觉描述生成理论与方法研究，并进

一步探索了半监督、无监督下的视觉描述生成问题。本书适用于关注人工智能、计算机视觉、多模态场景解析等相关领域的研究人员。

CIP信息：

视觉描述生成理论与方法研究/王岚晓,李宏亮著.

成都:成都电子科大出版社,2025.1.--ISBN 978-7

-5770-1210-0

I.TP302.7

中国国家版本馆CIP数据核字第2024JB9486号