商城首页欢迎来到中国正版软件门户

您的位置:首页 >OpenCV Grabcut图像分割教程

OpenCV Grabcut图像分割教程

  发布于2025-08-12 阅读(0)

扫一扫,手机访问

图像分割技术是将图像划分为多个具有独特属性的区域,并从中提取感兴趣目标的过程。它是图像处理向图像分析过渡的关键步骤。目前,图像分割方法主要包括基于阈值的分割、基于区域的分割、基于边缘的分割以及基于特定理论的分割等。从数学角度来看,图像分割是将数字图像划分为互不相交的区域的过程,同时也是一个标记过程,即将同一区域的像素赋予相同的编号。

为了解决传统的GrabCut和GraphCut算法需要用户提供精确的前景和背景种子,且种子覆盖不全时分割准确度受影响的问题,微软研究室提出了更为高效的GrabCut分割算法。GrabCut算法只需用户提供一个包含前景的矩形区域,矩形外的区域被视为背景。具体步骤如下:

  1. 将矩形外的像素标记为背景,矩形内的像素标记为前景,并使用这些标记来训练背景和前景的高斯混合模型(GMM);
  2. 使用训练好的GMM计算每个像素属于背景或前景的概率,从而计算能量函数中的Data项,Smoothness项的计算方法与GraphCut类似;
  3. 通过优化能量函数获得图像的一个分割结果;
  4. 使用步骤3中的分割结果重新训练前景和背景的GMM;
  5. 重复步骤2、3、4,直到分割结果收敛(不再有显著变化)。

从上述步骤可以看出,GrabCut是一个通过循环执行来实现EM(期望最大化)算法的过程。由于用户提供的矩形内可能包含部分背景像素,因此初始种子可能不完全准确。然而,GMM模型不需要所有训练数据都正确,即使部分分类错误,也可以通过EM步骤达到正确的最终结果。GrabCut正是利用了GMM的这一特性。不过需要注意的是,GMM存在陷入局部最优解的问题,GrabCut也同样面临这一挑战。

算法论文的地址为:https://www.microsoft.com/en-us/research/wp-content/uploads/2004/08/siggraph04-grabcut.pdf

API代码语言为JavaScript,代码运行次数为0。以下是API的代码示例:

public static void grabCut(Mat img, Mat mask, Rect rect, Mat bgdModel, Mat fgdModel, int iterCount, int mode)

参数说明如下:

  • 参数一:img,输入的待分割图像,必须是8位三通道图像。
  • 参数二:mask,输入/输出8位单通道掩码图像。像素值及其含义如下:GC_BGD(0)表示明显的背景像素,GC_FGD(1)表示明显的前景像素,GC_PR_BGD(2)表示可能的背景像素,GC_PR_FGD(3)表示可能的前景像素。
  • 参数三:rect,包含细分对象的ROI区域。ROI外的区域被标记为“明显的背景”。当第七个参数mode为GC_INIT_WITH_RECT时,该参数才会被使用。
  • 参数四:bgdModel,前景模型临时对象。处理同一图像时,请勿对其进行修改。
  • 参数五:fgdModel,背景模型临时对象。处理同一图像时,请勿对其进行修改。
  • 参数六:iterCount,迭代次数。可以通过使用mode == GC_INIT_WITH_MASKmode == GC_EVAL进行进一步调用来完善结果。
  • 参数七:mode,分割模式标志位。标志位值及其含义如下:GC_INIT_WITH_RECT(0)表示使用提供的矩形初始化状态和掩码,之后根据算法进行迭代更新;GC_INIT_WITH_MASK(1)表示使用提供的掩码初始化状态,可以组合使用GC_INIT_WITH_RECT和GC_INIT_WITH_MASK,然后使用GC_BGD自动初始化ROI之外的所有像素;GC_EVAL(2)表示算法应该恢复;GC_EVAL_FREEZE_MODEL(3)表示算法仅在固定模型下运行GrabCut算法(单次迭代)。

以下是JavaScript代码示例:

/** 
 * 图像分割 Grabcut 
 * author: yidong 
 * 2020/11/21 
 */
class GrabcutActivity extends AppCompatActivity {
    private val mBinding: ActivityGrabcutBinding by lazy {
        ActivityGrabcutBinding.inflate(layoutInflater)
    }
    private lateinit var mRgb: Mat
override fun onCreate(savedInstanceState: Bundle?) {
    super.onCreate(savedInstanceState)
    setContentView(mBinding.root)
    val bgr = Utils.loadResource(this, R.drawable.lena)
    mRgb = Mat()
    Imgproc.cvtColor(bgr, mRgb, Imgproc.COLOR_BGR2RGB)
    mBinding.ivLena.showMat(mRgb)
    GlobalScope.launch(Dispatchers.IO) {
        doGrabCut()
    }
}

private fun doGrabCut() {
    val rectMat = Mat()
    mRgb.copyTo(rectMat)
    val rect = Rect(80, 30, 340, 390)
    Imgproc.rectangle(rectMat, rect, Scalar.all(255.0), 2)
    GlobalScope.launch(Dispatchers.Main) {
        mBinding.ivLena.showMat(rectMat)
    }
    val bgdModel = Mat.zeros(1, 65, CvType.CV_64FC1)
    val fgdModel = Mat.zeros(1, 65, CvType.CV_64FC1)
    val mask = Mat.zeros(mRgb.size(), CvType.CV_8UC1)
    Imgproc.grabCut(mRgb, mask, rect, bgdModel, fgdModel, 5, Imgproc.GC_INIT_WITH_RECT)
    val result = Mat()
    for (i in 0 until mask.rows()) {
        for (j in 0 until mask.cols()) {
            val value = mask.get(i, j)[0].toInt()
            if (value == 1 || value == 3) {
                mask.put(i, j, 255.0)
            } else {
                mask.put(i, j, 0.0)
            }
        }
    }
    Core.bitwise_and(mRgb, mRgb, result, mask)
    GlobalScope.launch(Dispatchers.Main) {
        mBinding.ivResult.showMat(result)
    }
}

override fun onDestroy() {
    mRgb.release()
    super.onDestroy()
}

}

效果图如下:

Android OpenCV(四十三):图像分割(Grabcut)Android OpenCV(四十三):图像分割(Grabcut)

源码地址:https://github.com/onlyloveyd/LearningAndroidOpenCV

本文转载于:https://cloud.tencent.com/developer/article/1855142 如有侵犯,请联系zhengruancom@outlook.com删除。
免责声明:正软商城发布此文仅为传递信息,不代表正软商城认同其观点或证实其描述。

热门关注