数字图像处理(MATLAB版)(第2版)
上QQ阅读APP看书,第一时间看更新

1.2 数字图像的相关概念

人出生以后第一次睁开眼睛,首先接收的就是各种各样的图像信息,因此有人说,图像与生俱来是人类生活中最直观、最丰富和最生动的信息表示形式。但对于数字图像处理学科而言,图像的定义并非是不言自明的,为研究和讨论的需要,应建立一个统一的概念。

1.2.1 图像及其类型

图像包括各种各样的形式,如可见图像和非可见图像、抽象图像和实际图像、适于和不适于计算机处理的图像,因此不同种类的图像大量存在于人类生活之中。然而尽管大家天天接触图像,也知道什么是图像,但对图像却没有严格的定义。

在韦氏(Webster)英文词典中,图像(Image)一词的英文定义是“an imitation or representation of a person or thing, drawn, painted, photograhed…”,即图像是人或事物的一个逼真模仿或描述……Castleman博士在《数字图像处理》中将图像定义为“在一般意义下,一幅图像是一个物体或对象(objects)的另一种表示”。例如,美国总统布什的照片是他某时出现在镜头前的一种描述或表示。因此,图像是其所表示物体或对象信息的一个直接描述和浓缩表示。著名学者阮秋琦教授将图像定义为“以某一技术手段被再现于二维平面上的视觉信息”,简而言之,即图像是物体在平面坐标上的直观再现。因此,一幅图像包含了所表示物体的描述信息和特征信息,或者说图像是与之对应的物体或对象的一个真实表示,这个表示可以通过某一种或某几种技术手段实现。

此外,图片(picture)和图形(graphic)是与图像密切相关的两个概念。目前比较一致的观点认为,图片就是图像的一种类型,在一些经典的教科书中,将图片定义为“经过合适的光照条件一个可见的物体分布”,这一定义侧重强调了现实世界中的可见物体。在韦氏词典中,对图形的定义是“the art of making drawings, as architecture or engineering, in accordance with mathematical rules”,它强调应用一定的数学模型来生成图形。但图形与图像的数据结构不同,图形采用矢量结构,而图像则采用栅格结构。

日常生活中可能会遇到各种各样的图像,如非光学数字图像、高维图像(维数等于或大于3)、多光谱图像、非均匀采样图像、非均匀量化图像等,图像的分类方法也多种多样。通常情况下,图像可根据形式或产生方法进行分类。目前被一致接受的分类方法是Castleman博士所采用的基本集合论的分类方法,如图1-1所示。如果考虑所有物体的集合,图像便形成了其中的一个子集,在图像子集中的每幅图像都和它所表示的物体存在对应关系根据图像的产生方法,图像可分为以下三类。

1. 可见图像

可见图像(visible image)是指视觉系统可以直接看见的图像,这也是大多数人在日常生活中所见到的和所理解的图像,这一类图像一般通过照相、手工绘制等传统方法获取,通常计算机不能直接处理,但经过数字化处理后可变为数字图像。在该子集中又包含了几种不同方法产生的图像的子集,其中一个子集为图片(picture),它包括照片(photograph)、图(drawing)和画(painting)。另一个子集为光学图像(optical image),即用透镜、光栅和全息技术产生的图像。

2. 物理图像

物理图像(physical image)所反映的是物体的电磁波辐射能,包括可见光和不可见光图像。例如,光学图像是光强度的空间分布,它们能被肉眼所看到,因此也是可见的图像。不可见的物理图像的例子如温度、压力、高度以及人口密度等的分布图。物理图像一般可以通过某一种光电技术获得,第一类图像中的照片也可以归入此类。物理图像的一个重要子集是多光谱图像,包含物体的近红外、中红外、热红外等波谱信息。绝大部分的物理图像也是数字图像。多光谱图像的每一个点所包含的不只是一个局部特性,如红、绿、蓝三光谱图像,它的技术原理普遍用于彩色照相技术和彩色电视等实际应用当中。黑白图像在每个点只有一个亮度值,而彩色图像则在每个点都具有红、绿、蓝三个亮度值,这三个值表示在不同波段上的强度,就是人眼看到的不同颜色。

图1-1 图像的基本类型

3. 数学图像

数学图像指由连续函数或离散函数生成的抽象图像。其中离散函数所产生的图像就是计算机可以处理的数字图像。

1.2.2 图像与数字图像

图像是其所表示物体的信息的直接描述和概括表示。一般而言,一幅图像所包含的信息应比原物体所包含的信息要少,因此一幅图像并非是该物体的一个完全精确的表示,但却是一个直观和恰当的表示。

以数学方法描述图像时,图像可以认为是空间各个坐标点上光照强度的集合。也就是说,从物理光学和数学的角度看,一幅图像可以看作是物体辐射能量的空间分布,这个分布是空间坐标、时间和波长的函数,即

上式中,对于静止图像,则与时间t无关;对于单色图像,则与波长无关;对于二维平面图像,则与空间坐标变量z无关。

因此,一幅二维静态单色平面图像可以用如下二维强度函数(也称为亮度函数)表示,即

如果说图像是与之对应的物体的一个表示,那么数字图像可以定义为一个物体的数字表示,或者说是对一个二维矩阵施加一系列的操作,以得到所期望的结果。其中,数字是与采用数字方法或离散像素单元进行的计算有关,像素就是离散的单元,量化的(整数)灰度就是数字量值。处理是指让某个事物经过某一过程的作用,过程即指为实现期望目标而进行的一系列操作。

因此,数字图像处理可以定义为对一个物体的数字表示施加一系列的操作,以得到所期望的结果。其过程表现为一幅图像变为另一幅经过修改或改进的图像,是一个由图像到图像的过程。而数字图像分析则是指将一幅图像转化为一种非图像的表示。在图片的例子中,处理的过程就是改变图片使其达到某一预定目标,或使其更具吸引力,更令人满意。通常情况下,若无特别声明,数字图像是指一个被采样和量化后的二维强度函数(该二维函数可以由光学方法产生),采用等距离矩形网格采样,对幅度进行等间隔量化。也可以说,一幅数字图像是一个被均匀采样和均匀量化(即离散处理)的二维数值矩阵。

1.2.3 数字图像的表示法

数字图像在计算机中采用二维矩阵表示和存储,如图1-2所示,该图描述了由一幅数字图像到该图像所对应的二维矩阵的简易过程和原理。图1-2(a)是一幅大小为128×128的二维数字图像,为了表述方便,以图1-2(a)中取出一个小矩形方块为例,将该小方块放大至像素水平,即图1-2(b),可以看出这是原始图像图1-2(a)中的一个8×8的子图像,放大后的子图像如图1-2(b)所示的每一个像素点都具有一个确定的灰度值,将这些灰度值按像素的顺序排列,就是一个二维矩阵,矩阵各元素的值如图1-2(c)所示。

图1-2 数字图像的矩阵表示

上述由图1-2(a)到图1-2(b)的过程中,原始图像被等间隔的网格分割成大小相同的小方格(grid),其中的每一个方格称为像素点,简称为像元或像素(pixel)。像素是构成图像的最小基本单位,图像的每一个像素都具有独立的属性,其中最基本的属性包括像素位置和灰度值两个属性。位置由像元所在的行和列的坐标值决定,通常以像素的位置坐标(x, y)表示,像素的灰度值即该像素对应的光学亮度值。

因此,对一幅图像按照二维矩形扫描网格进行扫描的结果是生成一个与原图像相对应的二维矩阵,且矩阵中的每一个元素都为整数,矩阵元素(像素)的位置则由扫描的顺序决定,每一个像素的灰度值通过采样获取,然后经过量化得到每一像素亮度(灰度)值的整数表示。因此,一幅图像经数字化后得到的数字图像,实际上就是图1-2(c)所示的一个二维整数矩阵,矩阵的大小由图像像素的多少决定。