光学信息的本质:图像的信息

视觉是为了提供关于外部世界的精确信息,l因此环境中物体表面彼此之间构成的几何学与进入特定观察位点的眼睛的光之间有着确定的联系。

1.光学图像11外部世界三维空间的物体沐浴在光的照射下,l被物体表面反射的光沿着直线进入观察者的眼睛(图16-A)。光子穿过眼睛在其视网膜形成了一个上下颠倒的二维图像(图16-B.C)。这个外部世界中的物体通常被称作远端刺激(即与观察者相距较远),l而它在眼睛视网膜上的光学图像则被称作近端刺激(即与观察者相距较近)。正如图16-5A所示,l物体在眼睛中图像的大小取决定于它的视角:i即图像的端点间距离和眼睛的注视点之间所夹角的度数。同样大小的外界物体在距离观察者眼睛较远时对应一个较小的角度,l在距离观察者较近时则对应一个较大的角度。这种介于物体大小、i距离、i图像大小之间的关系对于理解我们是如何感知物体的位置和大小是很重要的。理解视觉的难点在于:i眼睛视网膜上的图像是二维而不是三维的,l也就是说,l眼睛视网膜的光学图像就像投射到弧形屏幕上的一张幻灯片。这意味着,l从真实的三维世界到眼睛的二维图像的转化过程中,l重要的空间信息被丢失了。图像中消失的是深度维,l即从观察者眼睛的注视点到环境中物体将光反射入眼的表面之间的距离。为了感知三维形式的世界,l必须设法将深度维从光学图像的二维信息中揭示出来;我们显然已经做到了这一点,l但又是如何做到的呢?

图16-51图像的形成与大小一距离的关系

[A.三维物体(远端刺激)把光反射入眼,l形成视网膜上的二维投射图像(近端刺激)。因为物体所处的距离不能直接从其二维投射图像上反映出来,l所以环境中大小相等而距离不等的物体投射到视网膜上的图像表现出不同的大小,l如图B、iC所示]

2.投射几何学11将三维世界映射成为二维图像的图像处理过程是非常有规律的,l可以对这种规律采用数学分析。对它最适用的数学是投射几何学,l即研究多维空间是如何被映射成低维空间的科学。对于静态的视觉,l是把三维空间的环境映射成二维空间的平面图像。投射几何学能特异的将给定的三维物体上的每一点投射到对应的二维平面图像上去,l而该物体图像的特征经过这些不同的投射后并不会发生变化。在动态视觉中,l投射是把空间一时间的四维结构转变为随着时间推移而展现在眼睛视网膜二维表面的“视觉流”的三维空问结构。

虽然投射几何学是理解图像信息的理想数学工具,l但投射几何学并不能囊括视觉现象的所有复杂性,l因为它不包括能够阐述光的反射、i吸收或折射的适当的模型构建。举例说明,l在充满不透光表面的世界中,l只有由最近的表面反射的从某一特定方向射来的光能进入眼睛。从其它更远的点发出的光子将被吸收或被相邻表面反射,l以至于它们不能到达眼睛。由光和物体表面的相互作用引起的复杂性,l使得投射几何学在对来自于三维世界的二维视觉图像进行模型化的过程中,l只能发挥部分的作用。

3.感知和正字法投射11另外一个将三维世界转变为二维图像的方法是,l在一张平面图前方的一定距离放置一个针孔或将针孔置于一个不透光盒子前部的某个位置上,l而盒子里与针孔相对的是一个二维平面。这样的装置叫做针孔相机。因为光子是呈直线运动的,l那么落在针孔相机平面图像上的每一点上的光都是环境空间中特定的点直接射入或反射入的。这些环境空间中特定的点沿辐射线排列,l并且这些点反射或直接射入的光从一开始就朝着各自在平面图像上所对应的点而穿过针孔(如图16-A)。这是感知投射(或极性投射)最基本的几何学关系,l在种图像形成过程中,l光是向着单个焦点(或极点)汇聚的。获得好的针孔图像并不是上述方法看起来那么容易。要得到生动的针孔图像,l针孔必须很小。直径0.4mm最为理想。然而因为孔径太小,l落到图像平面上的光非常少,l所以必须在非常暗的条件下才能进行观察。如果把孔做得大些以便允许更多的光射入,l图像将变得模糊,l因为所有的光不再是通过针孔上的一个单独的点,l而是通过许多不同的点(如图16-6B)。这个难题可以用下述方法解决:i在相机的开口处装上一个透明的凸透镜,l可使射入的光通过它时发生弯折而汇聚到凹透镜后面一定距离的焦点上(如图16-C)。因此,l凸透镜事实上为它本身的焦点提供了一个“针孔”,l使得投影到后面的图像再次变得轮廓清晰而鲜明,l就像针孔相机所得的图像那样,l惟一不同的是图像更加明亮了,l因为更多的光从增大了的开口处通过。人类的眼睛有这样的一个晶状体,l其作用是把图像聚焦在视网膜上。

图16-611机和凸透镜的光学原理

[A.针孔相机(不带凸透镜)产生清晰图像R不带凸透镜的大孔相机产生落在焦点以外的模糊图像;C.如果凸透镜的焦距与凸透镜到成像平面的距离相适合时,l带凸透镜的大孔相机就会产生聚焦良好的清晰图像]

设想光-物体表面之间的复杂相互作用能最终合成一个模型,l那么感知投射(或极性投射)的数学对人眼图像信息模型化就十分有用了(如图16-7A.B)。然而,l光-物体表面之间的复杂相互作用比我们已经提到的还要复杂得多。为了将情况简化,l视觉理论家通常运用正字法投射(或平行投射)来替代感知投射,l将图像信息的几何学进行模型化(如图16-7C)。在这种情况下,l图像被概念化为由彼此平行且均垂直于图像平面的光线形成,l而不是由向针孔会聚的光线形成。这种由正字法投射所致的数学简化,l把物体在环境中的深度维,l也就是物体与图像之间的距离忽略了,l但是与视线方向垂直平面上的所有空间信息却毫无改变的保留下来。这意味着当图像与物体之间的距离远大于物体自身的长度时(如图16-7B)正字法投射就非常接近于感知投射。因此,l正字法投射可以作为感知投射的一种限定性情况,l在此情况下,l物体和焦点之间的距离是无限远的。当图像与物体之间的距离较近时,l正字法投射和感知投射之间的区别就变得十分明显(如图16-7A)。

图16-7感知和正字法投射

[知投射通过针孔(A和B)产生向某点汇聚的光束;近距离感知(A)较远距离(B)需要更强的会聚;正字法投射以平行光线为基础,l在投射图像上不产生光束的会聚]