中图百佳出版收录索引数据库
所属分类:学术专著 > 工业技术 > 自动化技术与计算机技术
视觉描述生成理论与方法研究
  • 作者:王岚晓,李宏亮,著
  • 定价:48 元
  • 内容简介:
    视觉描述生成是视觉场景理解领域的基础问题,旨在深入理解视觉场景中的目标与环境信息,生成与视觉内容相匹配且符合人类语言规则 的文本描述。在生成式人工智能、智能态势...阅读全部

关注
26

点赞
0

转发
0

索引声明:本图书信息来源于第一次总署获批信息。如图书信息后期变动,本索引不同步变动。
成都电子科大出版社 出书
图书详情
  • 出版时间:2025.1
  • 出版地区:成都
  • CIP核准号:2024JB9486
  • ISBN:978-7-5770-1210-0
  • 正文语种:
  • 中图法分类:TP302.7
  • 主题词:计算机视觉;研究
  • 出版单位:成都电子科大出版社
内容介绍:

视觉描述生成是视觉场景理解领域的基础问题,旨在深入理解视觉场景中的目标与环境信息,生成与视觉内容相匹配且符合人类语言规则

的文本描述。在生成式人工智能、智能态势感知等诸多领域具有重要的理论意义和应用价值。然而,实际应用场景复杂多变,具有对象分

布密集、目标种类繁多、数据收集和标注困难等特性,并且视觉和文本之间模态差异大,从而导致模型生成的描述面临结构完整性较低、

内容准确性不足、描述充分性欠缺、数据依赖性过高等。本书以视觉描述生成任务为切入点,针对实际应用场景复杂多变、对象分布密

集、目标种类繁多、数据收集和标注困难等特性与难点,从语义特征编码与解码两个角度出发,开展视觉描述生成理论与方法研究,并进

一步探索了半监督、无监督下的视觉描述生成问题。本书适用于关注人工智能、计算机视觉、多模态场景解析等相关领域的研究人员。

CIP信息:

视觉描述生成理论与方法研究/王岚晓,李宏亮著.

成都:成都电子科大出版社,2025.1.--ISBN 978-7

-5770-1210-0

I.TP302.7

中国国家版本馆CIP数据核字第2024JB9486号