图像理解理论与方法

出版时间:2009-10  出版社:科学出版社  作者:高隽,谢昭 著  页数:542  字数:683000  
Tag标签:无  

前言

  图像理解是近年来的热点研究领域,它是一门覆盖范围很广的综合性交叉学科,涉及图像工程、计算机视觉、人工智能和认知学等诸多学科领域,在目标识别及解释和图像与视频检索等方面有着广阔的应用前景。  《图像理解理论与方法》的总体编写思路:给出图像理解的定义及框架,并将其与图像工程、人工智能的相关方法有机结合起来,逐步阐述图像理解的理论方法;以图像理解的研究内容为导向,详细介绍图像理解的方法,以及图像理解系统必不可少的开发环境和图像数据机。基于这一编写思路,《图像理解理论与方法》介绍了数据/知识驱动方式不同的判别模型和生成模型,以此作为整个图像理解任务的理论基础;接着从图像理解的研究内容入手,分别详述了场景中目标识别、场景中目标之间的关系、场景描述与理解和图像句法语义四个子任务,并介绍了相应的学习算法,给出了经典、实用的应用实例。具体内容分布如下:  第1章给出了图像理解的定义以及结构框架,介绍了图像理解的研究内容,阐述了图像理解与图像工程、计算机视觉、人工智能和认知学的联系与区别及其应用;第2章介绍无结构特征组织方式的分类判别模型,有Boosting、支持向量机以及协同神经网络;第3章介绍半结构化的生成模型,主要有无向图模型中的随机场模型和星群模型,以及有向图模型中的认知图模型、pLSA模型和LDA模型;第4章从图像的处理技术人手,介绍了图像特征表示、提取和评价三个方面内容,并给出部分应用实例加以分析,重点介绍了特征不变性描述子SIFT;第5章介绍场景中的目标识别,主要分为图像分割、目标识别以及广义目标识别三个方面,介绍了以第2、3章为理论基础的各种方法,给出仿真应用实例或经典实例;第6章介绍场景中目标之间的关系,首先简单介绍表达场景中目标之间关系的有力载体(与或图和解析图),然后介绍关联描述的视觉三层(低层、中层和高层)词汇,接着详细介绍目标之间的各种关联和结构,最后给出体现目标之间关系的经典应用实例;第7章介绍场景的描述与理解,首先介绍图像理解中场景分类的相关概念和特点;然后给出场景分类的方法(低层场景建模和高层语义建模),最后重点介绍了基于视皮层组织的场景Gist特征的场景全局感知分类,以及基于混合高斯模型的场景分类,并在高斯概率模型进行场景分类研究的基础上对场景分类的约束机制进行初步探讨;第8章介绍场景中的句法语义,首先简单介绍了句法语言,然后重点介绍了上下文有关随机句法的学习和推理过程,最后给出基于统计句法策略的实现新型语义关系的构建。

内容概要

“图像理解”是近年来计算机科学的热点研究领域,本书对图像理解的前沿理论与方法进行了详细论述。主要内容包括分类判别模型、生成模型、图像信息表示与特征提取、场景中的目标识别、场景中目标之间的关系、场景描述与理解、场景中的句法语义、图像理解开发环境和图像数据集等。本书紧跟上述内容的国内外发展现状和最新成果,阐述作者对图像理解理论方法的理解和认识。    本书可以作为计算机科学与技术、信息与通信工程、电子科学与技术等专业的研究生、高年级本科生教材,同时可作为从事图像理解、计算机视觉、机器学习等相关专业研究人员的参考书。

书籍目录

前言第1章  绪论    1.1  图像理解的基本概念    1.1.1  图像理解与图像工程    1.1.2  图像理解与计算机视觉    1.1.3  图像理解与人工智能    1.1.4  图像理解与认知学    1.2  图像理解的研究内容    1.2.1  场景中目标识别    1.2.2  场景中目标之间的关系    1.2.3  场景描述与理解    1.2.4  图像语义描述推理  1.3  图像理解的研究方法    1.3.1  判别分类方法    1.3.2  生成模型方法    1.3.3  句法语义分析方法  1.4  图像理解的应用    1.4.1  遥感图像解释    1.4.2  目标识别和解释    1.4.3  基于内容的图像和视频检索  参考文献第2章  分类判别模型  2.1  引言  2.2  Boosting分类方法    2.2.1  Boosting产生与发展    2.2.2  Boosting基本思想    2.2.3  Boosting分类模型    2.2.4  方法总结  2.3  SVM分类方法    2.3.1  统计学习理论    2.3.2  SVM模型    2.3.3  方法总结  2.4  协同学与协同神经网络    2.4.1  协同学简介    2.4.2  协同模式识别方法    2.4.3  方法总结  2.5  总结  参考文献第3章  生成模型  3.1  引言    3.1.1  图论中的无向图与有向图    3.1.2  图像理解中的标记问题  3.2  无向图模型    3.2.1  无向图简介    3.2.2  随机场模型    3.2.3  星群模型    3.2.4  小结  3.3  有向图模型    3.3.1  有向图简介    3.3.2  认知图模型    3.3.3  pLSA模型      3.3.4  LDA模型    3.3.5  小结  3.4  总结  参考文献第4章  图像信息表示与特征提取  4.1  引言  4.2  图像信息表示    4.2.1  图像数据结构    4.2.2  知识表示    4.2.3  数据与知识的融合  4.3  图像特征提取    4.3.1  基本图像特征提取    4.3.2  常用图像特征提取    4.3.3  方法小结  4.4  图像特征表达    4.4.1  直方图表达    4.4.2  区域特征表达    4.4.3  边缘特征表达    4.4.4  基于包的表达    4.4.5  方法小结  4.5  图像特征评价    4.5.1  检测算子评价    4.5.2  特征描述子评价    4.5.3  方法小结  4.6  总结  参考文献第5章  场景中的目标识别  5.1  引言  5.2  图像分割    5.2.1  基于SVM的图像分割    5.2.2  基于取样的图像分割    5.2.3  全互连结构的图像分割    5.2.4  MRF+pLSA区域分割标记    5.2.5  基于产生式规则的图像分割  5.3  目标识别    5.3.1  基于认知图的目标形状识别    5.3.2  基于协同神经网络的生物特征识别    5.3.3  基于Boosting的目标识别    5.3.4  基于SVM的目标识别  5.4  广义目标识别    5.4.1  Boosting多值分类的目标检测识别    5.4.2  视觉注意机制引导的协同目标识别    5.4.3  pLSA的视觉目标分类    5.4.4  pLSA下的无向图广义目标识别  5.5  总结  参考文献第6章  场景中目标之间的关系  6.1  引言  6.2  与或图和解析图  6.3  视觉词汇    6.3.1  视觉词汇表达    6.3.2  低层图像基元    6.3.3  中层图基元对    6.3.4  高层目标部分  6.4  关联和结构    6.4.1  关联    6.4.2  结构  6.5  目标间关系的视觉应用    6.5.1  星群模型的部分关联分析    6.5.2  场景-目标关联的目标识别  6.6  总结  参考文献第7章  场景描述与理解  7.1  引言  7.2  场景分类    7.2.1  场景分类的概念    7.2.2  场景分类的特点      7.2.3  场景的视觉感知层次    7.2.4  场景分类的方法  7.3  场景理解的视觉应用    7.3.1  基于Gist特征的场景全局感知分类    7.3.2  基于高斯统计概率模型的场景分类    7.3.3  图像理解的场景分析约束机制  7.4  总结  参考文献第8章  场景中的句法语义  8.1  引言  8.2  句法语言    8.2.1  句法重用和歧义结构    8.2.2  语义词汇表达    8.2.3  WordNet词汇网    8.3  基于统计的句法分析    8.3.1  句法公式    8.3.2  随机句法    8.3.3  上下文有关随机句法    8.3.4  随机句法与或图      8.3.5  句法学习与推理  8.4  基于统计句法的视觉应用    8.4.1  人造场景解析    8.4.2  人体外观建模与推理    8.4.3  目标类别推理识别  8.5  总结  参考文献第9章  图像理解开发环境  9.1  引言  9.2  图像理解环境    9.2.1  IUE起源    9.2.2  IUE类谱系    9.2.3  IUE任务库    9.2.4  IUE执行界面和接口  9.3  OpenCV    9.3.1  OpenCV起源    9.3.2  OpenCV类谱系    9.3.3  OpenCV任务库    9.3.4  OpenCV执行界面和接口    9.3.5  OpenCV应用实例  9.4  VXL    9.4.1  VXL起源    9.4.2  VXL类谱系    9.4.3  VXL任务库    9.4.4  VXL执行界面和接口      9.4.5  VXL应用实例  9.5  总结  参考文献第10章  图像数据集  10.1  引言  10.2  传统图像集    10.2.1  一般目标识别图像集    10.2.2  图像检索图像集    10.2.3  手势识别图像集    10.2.4  数字识别图像集    10.2.5  PASCAL图像集  10.3  融合视觉知识的图像集    10.3.1  图像集中的视觉知识    10.3.2  LabelMe图像集    10.3.3  LotusHill图像集  10.4  总结  参考文献

章节摘录

  1.3协同学的核心概念  支配原理和序参量是协同学理论的两个核心概念,下面分别进行详细讨论。  1)支配原理  对于由大量子系统构成的巨大系统来说,基本演化方程中包含的变量数目极大,即基本演化方程的维数非常高,要处理这样高维的方程,实际上是不可能的。因此,如何对维数极高的基本演化方程进行简化,以适当的低维方程近似描述原来系统,是协同学的一个重要研究内容。为此,协同学发展了微观方法的基本原理——支配原理,包括绝热消去原理、慢流形定理和中心流形定理等三个方面内容,核心是绝热消去原理。  协同学把表征子系统状态及它们之间耦合的所有量的临界行为分为两类:一类是临界处阻尼大衰减快的快弛豫参量,它们在临界过程中此起彼伏、活跃异常,但是它们对系统演变过程的性质并不起主导作用,处于次要地位。系统中绝大多数的状态变量都是这类快弛豫参量。另一类临界行为是慢弛豫参量,这类慢弛豫参量在临界过程中的行为与快弛豫参量并没有明显区别,但是当系统达到临界点时,它们出现了临界无阻尼现象(这往往是由于环境条件和边界条件对它们的生长有利形成的)。这类参量数量极少,却驱使着其他快弛豫参量的运动,并且系统演变的最终状态或结构是由它们决定的。  绝热消去原理是指当系统处在阈值时,有序结构形成的速度很快,外界对系统的影响可以忽略,而在系统内部,忽略相对衰减很快的快弛豫量的变化,可以使方程大大简化,也就是用慢弛豫参量表示(或近似表示)所有的快弛豫参量,最后得到仅有慢驰豫参量的方程——序参量方程。这样处理不仅消去了大量自由度使方程易于求解,而且深刻反映出子系统之间的协同作用产生了序参量,序参量又支配着子系统的运动,使系统出现整体的有序运动状态。  在研究系统的演化序列时,协同学又发展了慢流形定理和中心流形定理。这两个定理都是针对系统在相空间轨道而言的。慢流形是指代表着系统演变结果的那些稳定的吸引子流形,相当于系统中的慢弛豫参量的轨道。慢流形定理表明,如果相空间存在快流形和慢流形,系统最终会稳定地运动到慢流形上;中心流形定理是指在中心流形的轨道上,系统的行为是属于中性的。

图书封面

图书标签Tags

评论、评分、阅读与下载


    图像理解理论与方法 PDF格式下载


用户评论 (总计6条)

 
 

  •   书不错,很全面,很详细,一本好的专业书
  •   内容不错,比较新,也比较严谨,是一本好书
  •   真是自学够难懂的。。。估计看的变数多了就好了
  •   It'sagoodbooktoread,whichwilltakeyouagreatdealofunexpectedideatoyou~~Fighting
  •   专业,有的看不懂
  •   据说不错,还没开始看
 

250万本中文图书简介、评论、评分,PDF格式免费下载。 第一图书网 手机版

京ICP备13047387号-7