计算机视觉领域,图像分割(segmentation)指的是将数字图像细分为多个图像子区域(像素的集合)(也被称作超像素)的过程。图像分割的目的是简化或改变图像的表示形式,使得图像更容易理解和分析。[1]图像分割通常用于定位图像中的物体和边界线曲线等)。更精确的,图像分割是对图像中的每个像素标签的一个过程,这一过程使得具有相同标签的像素具有某种共同视觉特性。

图像分割的结果是图像上子区域的集合(这些子区域的全体覆盖了整个图像),或是从图像中提取的轮廓线的集合(例如边缘检测)。一个子区域中的每个像素在某种特性的度量下或是由计算得出的特性都是相似的,例如颜色亮度纹理邻接区域在某种特性的度量下有很大的不同。[1]

分割操作也可以利用像素的全局和局部特性來完成。全局特性是通過多個像素的均值和物體的連續邊緣來計算,而局部特性則由連續像素和圖像邊界的相互作用來表徵。通過改進的加權函數來適應局部項和全局項之間的權重,可以顯著提高分割速度。[2]

图像分割的应用

编辑

图像分割在实际中的应用包括:

现已有许多各种用途的图像分割算法。对于图像分割问题没有统一的解决方法,这一技术通常要与相关领域的知识结合起来,这样才能更有效的解决该领域中的图像分割问题。

二值化

编辑

二值化(英語:thresholding)是最简单的图像分割方法,会根据特定的限幅值(英語:clip-value)将灰度图转换为黑白图,该值也称阈值(英語:threshold)。

该方法的关键在于如何选取阈值。工业上所采用的方法有很多,如大津算法K-平均算法

基於像素強度,此方法將圖像劃分為兩部分,即像素值低於閾值和像素值高於閾值。在許多應用中,彩色圖像分割需要多階段閾值法[4]。為了分割紅、綠和藍色分量,可能需要多個最佳閾值。未來可能需要更多的閾值,但更多的閾值會降低分割過程的性能。多級閾值分割的主要缺點是執行時間過長[5]。在處理低質量圖像時,可能會導致閾值錯誤預測。改進的Salp Swarm算法可以最小化閾值數量,以確保有效的分割過程。改進的Grasshopper Optimization算法[6]、Metaheuristic算法、Firefly算法和新型基於群體的Bee Foraging算法[7]也被用於優化閾值。[8]

聚类法

编辑
源图像。
执行k-均值聚类(k=16)后的图像。注意:为了提高速度,通常可以先对较大图片进行下采样后再计算聚类。

K-均值算法是一种将图像分割成K个聚类的迭代技术。基本算法如下:

  1. 首先从n个数据对象任意选择 k 个对象作为初始聚类中心;
  2. 对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;
  3. 然后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);
  4. 重复第2和3步骤,直至收敛(聚类不再发生变化)。

这里,距离指像素与聚类中心之间绝对偏差或偏差的平方。偏差通常用像素颜色、亮度、纹理、位置,或它们的加权组合。K值可以手动选取、随机选取、或其它方式得到。此算法保证收敛,但它可能不会返回最佳的解决方案。该解决方案的质量取决于最初的一组集群和K值。

直方图法

编辑

相对于其他的图像分割算法来说,基于直方图的方法是一种效率非常高的方法,因为通常来说,该方法只需要对整幅图片扫描一遍即可。该方法对于整幅图像建立一张直方图,并通过图中的峰和谷来进行分类。颜色与灰度是通常进行直方图统计的特征。

边缘检测

编辑

边缘检测主要是图像的灰度变化的度量、监测和定位,其实质就是提取图像中不连续部分的特征。边缘检测在图像处理中比较重要,边缘检测的结果是图像分割技术所依赖的重要特征,因此边缘检测是图像分割领域的一部分。边缘检测常用于计算机视觉、武器跟踪控制及自控制式的车船运动研究等领域。

首先介绍图像边缘检测,具体就梯度算子、kirsch算子、laplacian-gauss算子、canny算子、log滤波算子、sobel算子、Robert算子、prewitt算子边缘检测方法介绍检测原理并通过编程实现,比较各种方法的处理结果。

区域生长

编辑

区域生长的基本思想是将具有相似性质的像素集合起来构成区域。具体先对每个需要分割的区域找一个种子像素作为生长的起点,然后将种子像素周围邻域中与种子像素具有相同或相似性质的像素(根据某种事先确定的生长或相似准则来判定)合并到种子像素所在的区域中。将这些新像素当做新的种子像素继续进行上面的过程,直到再没有满足条件的像素可被包括进来,这样,一个区域就长成了。

水平集方法

编辑

水平集方法最初由Osher和Sethian提出,目的是用于界面追踪。在90年代末期被广泛应用在各种图像领域。这一方法能够在隐式有效的应对曲线/曲面演化问题。基本思想是用一个符号函数表示演化中的轮廓(曲线或曲面),其中符号函数的零水平面对应于实际的轮廓。这样对应于轮廓运动方程,可以容易的导出隐式曲线/曲面的相似曲线流,当应用在零水平面上将会反映轮廓自身的演化。水平集方法具有许多优点:它是隐式的,参数自由的,提供了一种估计演化中的几何性质的直接方法,能够改变拓扑结构并且是本质的。

小波變換方法

编辑

小波變換常被用來抽取影像的特徵,並能應用在去除雜訊、邊界偵測、辨識等問題,因此也能用來處理圖像分割的問題。Andrea Gavlasova在2006年被提出的Wavelet Based Image Segmentation[9],示範了小波變換用來處理圖像分割的流程,整個演算法的流程如下:

  • 令原影像的大小為NxN,對影像中每4x4的區域做使用哈爾變換的離散小波轉換,以抽取出影像的特徵。
  • 計算抽取出的特徵的energy以及contrast,作為新的特徵,計算公式如下:
    •  
    •  
  • 對上一步所算出的特徵矩陣,計算縱軸和橫軸像素兩兩之間的差,藉此找出影像中的物體邊界,作為初步的分割結果。
  • 在初步的分割結果會有瑕疵和雜點,這是因為上一步相減兩兩像素的結果。為了讓結果更平滑,就使用circular averaging filter來過濾分割的結果。
  • 將輸出取閾值,變成能夠代表物體邊界的黑白影像,像素值為一的部份即代表物體邊界。
  • 將黑白的分隔影像骨架化(skeletonize),讓輸出能以白色細線來表示要分割的物體邊界,完成影像分割。

请参阅

编辑

参考文献

编辑
  1. ^ 1.0 1.1 Linda G. Shapiro and George C. Stockman (2001):“Computer Vision”, pp 279-325, New Jersey, Prentice-Hall, ISBN 0-13-030796-3
  2. ^ A Study on Image Segmentation Method for Image Processing. 
  3. ^ Dzung L. Pham, Chenyang Xu, and Jerry L. Prince (2000):“Current Methods in Medical Image Segmentation”, Annual Review of Biomedical Engineering, volume 2, pp 315-337
  4. ^ Jia, Heming; Ma, Jun; Song, Wenlong. Multilevel Thresholding Segmentation for Color Image Using Modified Moth-Flame Optimization. IEEE Access. 2019, 7. ISSN 2169-3536. doi:10.1109/access.2019.2908718. 
  5. ^ Jia, Heming; Ma, Jun; Song, Wenlong. Multilevel Thresholding Segmentation for Color Image Using Modified Moth-Flame Optimization. IEEE Access. 2019, 7. ISSN 2169-3536. doi:10.1109/access.2019.2908718. 
  6. ^ Liang, Hongnan; Jia, Heming; Xing, Zhikai; Ma, Jun; Peng, Xiaoxu. Modified Grasshopper Algorithm-Based Multilevel Thresholding for Color Image Segmentation. IEEE Access. 2019, 7. ISSN 2169-3536. doi:10.1109/access.2019.2891673. 
  7. ^ Zhang, Zhicheng; Yin, Jianqin. Bee Foraging Algorithm Based Multi-Level Thresholding For Image Segmentation. IEEE Access. 2020, 8. ISSN 2169-3536. doi:10.1109/access.2020.2966665. 
  8. ^ A Study on Image Segmentation Method for Image Processing. 
  9. ^ Andrea Gavlasova, Ales Prochazka, and Martina Mudrova. WAVELET BASED IMAGE SEGMENTATION. Annual Conference Technical Computing. 2006, (14th). 

外部链接

编辑