计算机视觉中的数学方法

出版时间:2008-3  出版社:科学出版社  作者:吴福朝  页数:374  字数:572000  
Tag标签:无  

前言

  计算机视觉的研究目标是使计算机具有从二维图像认知三维现实环境的能力,这种能力不仅使计算机能感知三维物体的结构与运动信息,而且能对它们进行识别与理解。自20世纪80年代初形成的Marr计算框架,以及随后发展的其他计算理论框架,使得人们相信通过计算手段能实现从二维图像对三维现实世界的感知。为适应不同计算理论框架和增强计算机视觉系统鲁棒性的需要,研究人员通过坚持不懈的努力,引进了众多数学方法和相应的计算方法。这些数学方法涉及代数学、几何学、分析学、概率论以及众多应用数学分支,这对初学者和从事多年研究的人员都感到非常困惑,真的需要这么多复杂的数学来解决计算机视觉问题吗?是数学的无能还是我们没有发现能解决计算机视觉问题的一种“好数学”?这正是计算机视觉的魅力所在,它吸引着众多学者在该领域进行探索与研究。  如果“计算能实现从二维图像对三维现实世界的感知”是正确的话,则不论使用什么数学方法其目的都是为了做两件事情,即为计算机视觉问题建立数学模型和模型估计与选择。在建立模型过程中,需要反映计算机视觉的数学理论和需要描述模型的数学工具与方法;在模型估计与选择中,需要数学计算技术,包括数值计算与统计计算。本书从以上提出的3个需要出发,介绍三维计算机视觉所涉及的基本数学理论与方法。  本书由以下3篇构成:  第一篇:射影几何。它是三维计算机视觉的数学理论基础,主要内容包括:平面与空间射影几何,摄像机几何,两视点几何,自标定理论和三维重构理论。  第二篇:矩阵与张量。它是描述三维计算机视觉模型的基本数学工具,同时也是模型估计线性算法的数学基础,主要内容包括:矩阵分解,矩阵分析,张量代数,运动与结构,多视点张量。  第三篇:模型估计。模型估计是三维计算机视觉的基本问题。本篇描述模型估计与选择的基本数学理论与方法,主要内容包括:迭代优化理论,参数估计理论,视觉模型估计的代数方法、几何方法、鲁棒方法与统计方法,以及模型选择的数学方法。  上述3篇所涉及的数学内容是相对独立的,但计算机视觉将它们组成一个有机的整体。

内容概要

  本书由射影几何、矩阵与张量、模型估计3篇组成,它们是三维计算机视觉所涉及的基本数学理论与方法。射影几何学是三维计算机视觉的数学基础,本书着重介绍射影几何学及其在视觉中的应用,主要内容包括:平面与空间射影几何,摄像机几何,两视点几何,自标定技术和三维重构理论。矩阵与张量是描述和解决三维计算机视觉问题的必要数学工具,本书着重介绍与视觉有关的矩阵和张量理论及其应用,主要内容包括:矩阵分解,矩阵分析,张量代数,运动与结构,多视点张量。模型估计是三维计算机视觉的基本问题,通常涉及变换或某种数学量的估计,本书着重介绍与视觉估计有关的数学理论与方法,主要内容包括:迭代优化理论,参数估计理论,视觉估计的代数方法、几何方法、鲁棒方法和贝叶斯方法。  本书可作为大学高年级本科生、研究生的教材。相关领域的研究人员也可以参考。

书籍目录

第一篇 射影几何 第1章 平面射影几何  1.1 射影平面   1.1.1 射影平面     1.1.2 叉积     1.1.3 交比    1.2 二次曲线     1.2.1 矩阵表示     1.2.2 切点与切线     1.2.3 配极对应     1.2.4 对偶二次曲线     1.2.5 圆环点及其对偶   1.3 二维射影变换     1.3.1 二维射影变换     1.3. 2直线与二次曲线的变换规则   1.4 变换群与不变量     1.4.1 等距变换群     1.4.2 相似变换群     1.4.3 仿射变换群     1.4.4 射影变换群 第2章 空间射影几何    2.1 射影空间     2.1.1 空间点     2.1.2 空间平面     2.1.3 空间直线      2.1.4 共线平面束的交比   2.2 三维射影变换     2.2.1 三维射影变换     2.2.2 平面与直线的变换规则   2.3 二次曲面与变换规则     2.3.1 基本性质     2.3.2 二次曲面的对偶     2.3.3 绝对二次曲线与绝对二次曲面    2.4 变换群与不变量     2.4.1 仿射变换群     2.4.2 相似变换群     2.4.3 等距变换群     2.4.4 二次曲面的分类    2.5 射影坐标系与射影坐标变换 第3章 摄像机几何   3.1 摄像机模型     3.1.1 摄像机模型     3.1.2 摄像机矩阵的元素     3.1.3 摄像机矩阵估计     3.1.4 欧氏空间与射影空间   3.2 投影与反投影     3.2.1 空间点     3.2.2 空间直线     3.2.3 空间平面     3.2.4 二次曲线     3.2.5 二次曲面   3.3 恢复平面景物的结构     3.3.1 仿射结构     3.3.2 相似结构     3.3.3 绝对欧氏结构 第4章 两视点几何    4.1 基本矩阵     4.1.1 极几何     4.1.2 基本矩阵     4.1.3 几何解释   4.2 单应矩阵     4.2.1 单应矩阵     4.2.2 与基本矩阵的关系     4.2.3 不动点与不动线   4.3 基本矩阵估计     4.3.1 8一点算法     4.3.2 最小点对应算法   4.4 恢复摄像机矩阵     4.4.1 射影相关     4.4.2 射影意义下的摄像机矩阵 …… 第5章 自标定理论 第6章 三维重构理论第二篇 矩阵与张量 第7章 正交对角化 第8章 矩阵分解 第9章 矩阵分析 第10章 张量代数 第11章 运动与结构 第12章 多视点张量第三篇 模型估计 第13章 迭代优化 第14章 参数估计 第15章 代数方法 第16章 几何方法 第17章 鲁棒方法 第18章 模型选择参考文献

章节摘录

  第3章 摄像机几何  三维计算机视觉的主要任务是利用三维物体的二维图像所包含的信息,获取三维物体的空间位置与形状等几何信息,并在此基础上识别三维物体。图像上每一点的亮度与物体某个表面点的反射光的强度有关,而图像点在图像平面上的位置仅与摄像机与空间物体的相对方位和摄像机的内部结构有关,摄像机的内部结构是由摄像机的内部参数所决定的。为了描述摄像机的成像几何关系,需要对摄像机进行数学建模。本章所介绍的摄像机模型是计算机视觉中广泛使用的针孔模型,通常也称为线性模型。这种模型在数学上是三维空间到二维平面的中心投影,由一个3×4矩阵来描述,可以说这种模型是一个(退化的)射影变换,因此通常又称它为射影摄像机。在本章,利用前两章的射影几何知识,给出摄像机关于空间点、直线、平面、二次曲线和二次曲面的投影性质,以及图像平面点、直线与二次曲线的反投影性质。这些投影与反投影性质,是从图像恢复物体三维几何结构的基础,尤其是绝对二次曲线与绝对二次曲面的投影性质。从本章可以看出,摄像机关于空间平面的投影是平面到平面的一个二维中心投影变换,因此可以使用第一章所介绍的二维射影变换的知识从平面景物图像恢复它的几何结构。对于空间物体,由于摄像机将三维物体表面投影到二维平面上,是一个(退化的)射影变换,因此不可能从三维物体的单幅图像恢复其三维结构。能否从多幅图像恢复物体的三维结构?这是三维计算机视觉中三维重构问题,将在第6章讨论。  3.1 摄像机模型  3.1.1 摄像机模型  1.基本模型  摄像机的基本成像模型,通常称为基本针孔模型,由三维空间到平面的中心投影变换所给出。令空间点Oc是投影中心,它到平面丌的距离为/。空间点Xc在平面X上的投影(或像)m真是以点oc为端点并经过点xc的射线与平面丌的交点,如图3.1.1 (a)所示。平面,r称为摄像机的像平面,点0称为摄像机中心(或光心),f称为摄像机的焦距,以点Oc为端点且垂直于像平面的射线称为光轴或主轴,主轴与像平面的交点p称为摄像机的主点。

编辑推荐

  《计算机视觉中的数学方法》可作为大学高年级本科生、研究生的教材。相关领域的研究人员也可以参考。

图书封面

图书标签Tags

评论、评分、阅读与下载


    计算机视觉中的数学方法 PDF格式下载


用户评论 (总计32条)

 
 

  •   本书有三大部分,射影几何,矩阵与张量,模型估计为初学者介绍三维计算机视觉中的基本数学理论、方法及其应用
  •   这本书非常好。对计算机视觉常用的一些数学方法进行了详细介绍。吴老师做事严谨,这从他的书中可以感觉出来。谢谢。
  •   这本书相当好,可以说是国内的“计算机视觉中的多视图几何”,写的通俗易懂,而且涵盖了几乎所有中科院关于机器视觉的研究内容。是一本难得的好书!!!
  •   做视觉稍微深入一点,就会觉得数学知识不够用(数学出身的人咱就不提了),要是去找书吧,基本上都是扯得天远地远的。这本书的作者应该是视觉领域的大牛,虽然无缘认识,但是我电脑中的好多论文的作者都有他的大名,尤其是在相机自标定方面的论文中。书的内容相当不错,如果不看这本书,要补充这些数学知识可能要翻好多本书书,而且不一定就能找到这本书里的这些知识。总结一下,这是一本好书,如果你是做视觉方面的,而且这本书的目录中的这些数学知识你还没学过,我想是有必要和我一样补充一下的。期待这个领域出现更多的好书。
  •   这本书我目前只看了一部分。该书涉及的范围还是比较广的,基本上视觉领域的数学基础或多或少都有涉及到。对于入门的童鞋来说,这些应该都是必备的基础。总体上,这是一本很有价值的书。
  •   不错,一本好书。数学是基础,哪儿都不例外,搞视觉测量的人必备的一本好书~~~
  •   这本书很不错 对学习机器视觉很有帮助
  •   这本书的内容涵盖全面,从数理角度阐述了数字图像处理理论
  •   不错,送货快,不过这次却不让用信用卡付款,让付现金,不着为何?
    书的内容大体看了一下,还可,如果举例在详细点就好了。
  •   正在上这门课,是这本书的作者讲的,感觉虽然抽象,但要是认真学进去了还是蛮有意思的。
  •   当当网的服务还是可以的嘛
  •   经典书籍无需评价
  •   很好,还是信任当当!
  •   偏重数学,可以和<计算机视觉中的多视图几何>一起看
  •   比较简单的介绍计算机视觉的数学方法,简单是指方法的详细分析。我也正在读,虽然没有人推荐,感觉还是不错的
  •   感觉挺难的,我的qq376384683,欢迎正在学习此书的朋友添加,交流心得体会。(添加注明:计算机视觉的数学方法)。
  •   很好的一本书,做计算机视觉数学要求很重要,这本书讲得很全面~~
  •   数学基础要比较好才能看懂,只有又重新学了一般大学的数学
  •   数学分析的比较丰富,特别是泛函分析在图像处理方面的运用。
  •   自然科学基金支持,篇章功能性明确,需要一定的数学基础
  •   书本质量不错,内容也很好........................
  •   一本不错的书,当当的送货也很及时!
  •   正在阅读.....
  •   数学方法的汇总,有点受不了的是,这本书居然是大开硬皮本……浪费啊……
  •   全是数学公式。看懂需要时间
  •   买了一年,现在还没有阅读。
    比较的难啃,一直无法坚持看下去!
  •   有点罗嗦,不过整体还行。
  •   原以为是一本不错的书,但与书名相差太大!
  •   专业,不适合入门
  •   为什么要评价500字?
  •   400-150买的,屯书
  •   一秀秀,此书啊
 

250万本中文图书简介、评论、评分,PDF格式免费下载。 第一图书网 手机版

京ICP备13047387号-7