图像处理
图像处理一般指数字图像处理,大多数依赖于软件实现。
其目的是去除干扰、噪声,将原始图像编程为适合计算机进行特征提取的形式。
图像处理主要包括图像采集、图像增强、图像复原、图像编码与压缩和图像分割。
图像采集
数字图像数据提取的方式
图像增强
为了使图像的主体结构更加明确,必须对图像进行改善。
- 减少噪声
- 改变原有图像的亮度、色彩分布、对比度等参数
- 提高图像的清晰度、质量
- 使图像中的物体轮廓更加清晰
- 细节更加明显
为后期的图像分析和图像理解奠定基础
图像复原
为了提取比较清晰的图像,需要对图像进行恢复。
- 图像恢复主要采用滤波方法。从降质的图像恢复原始图像。
- 图像复原的另一种特殊技术是图像重建,该技术是从物体横剖面的一组投影数据建立图像。
图像编码与压缩
为了能快速方便地在网络环境下传输图像或视频,必须对图像进行编码和压缩。
目前,图像压缩编码已形成国际标准。例如静态图像压缩标准JPEG,该标准主要针对图像的分辨率、彩色图像和灰度图像,处理为适用于网络传输的数码相片、彩色照片等方面。
视频可以被看作是一幅幅不同但又紧密相关的静态图像的时间序列,动态视频的单帧图像压缩可以应用静态图像的压缩标准。
图像分割
图像分割是把图像分成一些互不重叠而又具有各自特征的子区域,每一区域是像素的一个连续集,特性可以是图像的颜色、形状、灰度和纹理等。
图像分割根据目标与背景的先验知识将图像表示为物理上有意义的连通区域的集合。即对图像中的目标、背景进行标记、定位,然后把目标从背景中分离出来。
方法主要有基于区域特征的分割方法、基于相关匹配的分割方法和基于边界特征的分割方法。
采集图像受到各种条件影响,模糊,噪声干扰,图像分割会遇到困难。
图像识别
图像识别是将处理得到的图像进行特征提取和分类。
flowchart LR |
统计(识别)法(决策理论法)
通过对研究的图像进行大量的统计分析达到提取图像本质特点的特征来进行图像识别的方法
建立在数学上的决策理论的基础上,建立统计学识别模型,因而是一种分类误差最小的模型。常用的图像统计模型有贝叶斯(Bayes)模型和马尔柯夫(Markow)随机场(MRF)模型。
缺点:基于严格的数学基础导致了对图像的空间结构关系的忽略,当图像非常复杂、类别数很多时,特征提取、分类难以实现。尤其是当被识别图像(如指纹、染色体等)的主要特征是结构特征时,用统计法就很难进行识别。
句法识别法(统计识别方法的补充)
用符号描述图像特征。把复杂图像分解为单层或多层的相对简单的子图像,主要突出被识别对象的空间结构关系信息**。侧重于模拟人的逻辑思维**
模式识别源于统计方法,而句法方法则扩大了模式识别的能力,使其不仅能用于对图像的分类,而且可以用于对景物的分析与物体结构的识别。
但是,当存在较大的干扰和噪声时,句法识别方法抽取子图像(基元)困难,容易产生误判率,难以满足分类识别精度和可靠度的要求。
神经网络方法
用神经网络算法对图像进行识别的方法。
特别适合处理需要同时考虑许多因素和条件的问题,以及信息模糊或不精确等不确定性问题。
应用过程中存在收敛速度慢、训练量大、训练时间长,局部最优,识别分类精度不够,难以适用于经常出现新模式的场合。
模板匹配法
首先设计出一套模板:为了检测待识别图像的某些区域特征而设计的阵列。它既可以是数字量,也可以是符号串。
模板匹配法把已知物体的模板与图像中所有未知物体进行比较,如果某一未知物体与该模板匹配,则该物体被检测出来,并被认为是与模板相同的物体。
缺点
- 因为要表明所有物体的各种方向及尺寸,需要较大数量的模板,且其匹配过程由于需要的存储量和计算量过大而不经济。
- 高度依赖模板,如果已知物体的模板变化会导致错误识别
- 图像存在噪声加上形状结构的不确定性,较复杂的情况下得不到理想的效果,难以绝对精确
经典的模板匹配法利用互相关计算匹配量度,绝对差的平方和来作为不匹配量度。但这两种方法往往出现不匹配的情况,因此利用几何变换的匹配方法有助于提高稳健性。
几何变换方法
霍夫变换HT (Hough Transform)是一种快速形状匹配技术**。它对图像进行某种形式的变换,把图像中给定形状曲线上的所有点变换到霍夫空间,形成峰点**。
给定形状的曲线检测问题就变换为霍夫空间中峰点的检测问题。
可以用于有缺损形状的检测,是一种鲁棒性很强的方法。
为了减少计算量和和内存空间以提高计算效率,又提出了改进的霍夫算法,如快速霍夫变换(FHT)、自适应霍夫变换(AHT)及随机霍夫变换(RHT)。