什么是图像语义分割?图像语义分割和图像实例分割有什么区别?

2025-04-14

语义分割和实例分割是图像识别领域里面重要的任务,但是很多初学者容易搞混掉。本文简单介绍一下图像语义分割和图像实例分割两者的区别。简单而言就是语义只分类而不针对每类个体,而实例分割不仅是分类,对这一类的每一个个体也加以区分。此外,本文对一些比较成功的语义分割算法也进行了简要介绍。

图像语义分割

图像语义分割是图像处理和是计算机视觉技术中关于图像理解的重要一环,也是AI领域中一个重要的分支。图像语义分割对图像中每一个像素点进行分类,确定每个点的类别 (如属于背景、边缘或身体等)。

需要注意的是,这里只区分类别,比如识别是人、是狗、是背景。但是不区分人A、人B、还是人C,在语义分割里面,都是统一分为“人”这一类。对于个体不再进行追究。

用专业一点的话语来描述就是:如果输入对象中有两个相同类别的对象,则分割本身不将他们区分为单独的对象。

图像实例分割

在上面语义分割的基础上,对于即便是同一类的目标,也会对每一个实例都进行区分。这就是图像语义分割与实例分割的最大区别。

下面这张图最能说明这两种的区别。原本是一张含有三个内容的照片,那就是人、羊(多只)、狗。

原图

现在分别进行语义分割以及实力分割。在语义分割中一共就四种颜色:背景、人、狗、羊。而在实例分割中,在这基础上,对每一只羊都进行了区分。

进行分割

语义分割的目标

什么是图像语义分割_分割图像语义是谁提出的_分割图像语义是什么

一般是将一张RGB图像(*width*3)或是灰度图(*width*1)作为输入。

输出的是分割图,其中每一个像素包含了其类别的标签(*width*1)。

下面就是一个语义分割的例子:

分割的示例

分割的示例

图像分割领域的实现

目前在图像分割领域比较成功的算法,有很大一部分都来自于同一个先驱: Long等人提出的Fully (FCN),或者叫全卷积网络。FCN将分类网络转换成用于分割任务的网络结构,并证明了在分割问题上,可以实现端到端的网络训练。

FCN神经网络

第二个要介绍的就是Unet网络模型。Unet是2015年诞生的模型,它几乎是当前项目中应用最广的模型。Unet能从更少的训练图像中进行学习。当它在少于 40 张图的生物医学数据集上训练时,IOU 值仍能达到 92%。

Unet网络模型

下一篇:没有了
上一篇:web语义化是什么意思
相关文章
返回顶部小火箭