什么是传统图像分割算法？什么是现代图像分割算法？

在线咨询

专属客服在线解答，提供专业解决方案

声网 AI 助手

您的专属 AI 伙伴，开启全新搜索体验

首页 / 博客 / 正文

什么是传统图像分割算法？什么是现代图像分割算法？

博客, 技术实践

2024-07-17

一、传统图像分割算法

传统图像分割算法主要是基于图像处理技术，包括基于阈值、区域、边缘检测·、分水岭、聚类等方法。

Otsu阈值分割算法是一种基于图像直方图的自适应阈值选择方法，它可以通过寻找最佳阈值，将图像分为两个类别，从而实现图像的二分分割，它的优点是简单快速，适用于图像中目标和背景的灰度级差别较大的情况，对于灰度级差异不明显的图像可能会产生不理想的分割结果。
分水岭分割算法则是一种基于图像的灰度梯度和区域边界的方法，它会把邻近像素点的相似性作为重要的参考依据，将在空间位置上相近并且灰度值接近的像素点互相连接起来构成一个封闭的轮廓，它的优点是能够处理复杂的图像场景，并且能够在目标之间保持较好的分割边界，然而对于图像中的噪声和纹理较强的区域可能会产生不理想的分割结果。此外，分水岭算法对初始标记的选择非常敏感，不正确的标记可能导致错误的分割。

二、现代图像分割算法

现代图像分割主要包括两个阶段，第一阶段是基于传统机器学习的分割，不少研究者将Adaboost、SVM、GMM等机器学习算法，结合人工设计的特征应用到分割任务中。第二阶段便是基于深度学习的分割。FCN（Fully Convolutional Network）于2015年提出，它使用全卷积层代替传统CNN中的全连接层，通过转置卷积操作实现图像尺寸的上采样，并结合跳跃连接将中间层特征与上采样后的特征进行融合，FCN算法的提出标志着卷积神经网络（CNN）在图像分割领域的应用算是正式拉开了序幕。

同年，另一个经典算法U-Net也被提出，U-Net是一种经典的图像分割网络，由编码器和解码器组成，采用U形结构连接两部分。编码器用于提取图像特征，解码器通过上采样和跳跃连接逐步恢复分割结果的分辨率，同时将低层次的特征与高层次的特征进行融合。SegNet是伴随着U-Net同时发布的，引入跳跃连接，来弥补下采样带来的信息丢失。Deeplab系列算法相继引入空洞卷积（Dilated Convolution）、空洞池化金字塔模块（Atrous Spatial Pyramid Pooling, ASPP）、编解码（Encoder-Decoder）结构、跳跃连接（Skip Connect）等结构，取得了很好的分割效果。PSPNet（Pyramid Scene Parsing Netowork）提出了空间金字塔池化模块（Spatial Pyramid Pooling ,SPP），主要围绕多尺度信息和全局上下文进行建模设计，同时也借鉴了GoogleNet的思路引入辅助loss，帮助网络更好地收敛。HRNet（High-Resolution Network）是一种高分辨率网络，通过并行的多分支结构保留了高分辨率的特征信息。通过级联的并行分支，HRNet能够提高特征表达能力，并在保持高分辨率的同时实现精细的语义分割。SegFormer是一种最新的基于CNN的语义分割算法，采用Transformer结构进行特征编码和上下文建模。SegFormer通过自注意力机制和分层特征表示来提取全局和局部的语义信息，实现高质量的语义分割结果。