Marr 的计算视觉理论(1)视觉信息处理的三个描述水平 视觉研究的最终目标是要阐明视觉系统究竟是怎样完成视觉任务的
Marr 认为:神经系统所作的信息处理与机器相似
视觉是一种复杂的信息处理任务,目的是要把握对我们有用的外部世界的各种情况,并把它们表达出来
这种任务必须在三个不同的水平上来理解,这就是:a
计算理论 b
机制(见表 1)
这一划分并不是很严格的,但如果不符合上述分类,则没有一个或一组描述将是完善的
在视知觉中,上述三个水平各有其特定的位置,它们基本上是互相独立的
因此,在探讨理论问题时必须把它与法、机制严格地区别开来,并采用新的研究方法
计算理论算法机制信息处理问题的定义,它的解就是计 算的目标
这种计算的抽象性质的特 征
在可见世界内找出这些性质,构 成这个问题的约束条件为完成期望进行的 计算所采用的算法 的研究
完成算法的物理实 体,它由给定的硬 件系统构成
机器 硬件的构架
表【1】 从计算理论这一级水平来看,所谓信息处理(process),其实就是把一些符号表象变成另一些符号表象
这一处理过程从外部世界投射到视网膜上的图象开始,一直到形成某种知觉为止
因此表象是计算理论中最重要的概念
所谓表象(representation),简单地说,就是与所述问题有关的某种特殊的信息表达方式,其主要特点是使一些对后级处理有用的重要信息变明确
表象作为信息的一种表达方式其实是被普遍采用的
例如,物理系统中的能量是表象;数学中的数字、直角座标系中的点是表象;表象在人脑中的“痕迹”在一定的刺激条件下会再现出来,这种痕迹也是一种表象
用表象来描绘某一整体现象即应用表象的具体实例则称为该表象中的一个描述(desc1’i-Ption)
例如 12 就是阿拉伯数字表象中的一个描述
同样一个问题可以用许多不同类型的表象来表示,其中有些计算简单而有效,有些则不是