面包屑图标 当前位置: 首页
AI资讯
热点详情

边缘检测系列1:传统边缘检测算子

AI热点日报
AI热点日报时间:2025-07-18
热点解读

本文介绍了图像边缘检测的原理,指出边缘是灰度剧变处,检测基于方向导数掩码卷积。实现了通用边缘检测算子EdgeOP,集成Roberts、Prewitt等多种算子,提供四种边缘强度计算

本文介绍了图像边缘检测的原理,指出边缘是灰度剧变处,检测基于方向导数掩码卷积。实现了通用边缘检测算子EdgeOP,集成Roberts、Prewitt等多种算子,提供四种边缘强度计算方式,并通过测试函数对比效果,展示了不同算子和计算方法的检测结果。

边缘检测系列1:传统边缘检测算子 - 游乐网

引入

图像的边缘指的是灰度值发生急剧变化的位置。

在图像形成过程中,由于亮度、纹理、颜色、阴影等物理因素的不同而导致图像灰度值发生突变,从而形成边缘。

边缘是通过检查每个像素的邻域并对其灰度变化进行量化的,这种灰度变化的量化相当于微积分里连续函数中方向导数或者离散数列的差分。

算法原理

传统的边缘检测大多数是通过基于方向导数掩码(梯度方向导数)求卷积的方法。

计算灰度变化的卷积算子包含Roberts算子、Prewitt算子、Sobel算子、Scharr算子、Kirsch算子、Robinson算子、Laplacian算子。

大多数边缘检测算子是基于方向差分卷积核求卷积的方法,在使用由两个或者多个卷积核组成的边缘检测算子时假设有 n 个卷积核,记 Conv1,Conv2,...,ConvnConv1,Conv2,...,Convn,为图像分别与个卷积核做卷积的结果,通常有四种方式来衡量最后输出的边缘强度。

取对应位置绝对值的和:i=1nconvi∑i=1n∣convi∣

取对应位置平方和的开方:i=1nconvi2∑i=1nconvi2

取对应位置绝对值的最大值:max{conv1,conv2,...,convi}max{∣conv1∣,∣conv2∣,...,∣convi∣}

插值法:i=1naiconvi∑i=1nai∣convi∣,其中 ai>=0ai>=0,且 i=1nai=1∑i=1nai=1

代码实现

构建通用的边缘检测算子

因为上述的这些算子在本质上都是通过卷积计算实现的,只是所使用到的卷积核参数有所不同所以可以构建一个通用的计算算子,只需要传入对应的卷积核参数即可实现不同的边缘检测并且在后处理时集成了上述的四种计算最终边缘强度的方式In [1]
import numpy as npimport paddleimport paddle.nn as nnclass EdgeOP(nn.Layer):    def __init__(self, kernel):        '''        kernel: shape(out_channels, in_channels, h, w)        '''        super(EdgeOP, self).__init__()        out_channels, in_channels, h, w = kernel.shape        self.filter = nn.Conv2D(in_channels=in_channels, out_channels=out_channels, kernel_size=(h, w), padding='SAME', bias_attr=False)        self.filter.weight.set_value(kernel.astype('float32'))        @staticmethod    def postprocess(outputs, mode=0, weight=None):        '''        Input: NCHW        Output: NHW(mode==1-3) or NCHW(mode==4)        Params:            mode: switch output mode(0-4)            weight: weight when mode==3        '''        if mode==0:            results = paddle.sum(paddle.abs(outputs), axis=1)        elif mode==1:            results = paddle.sqrt(paddle.sum(paddle.pow(outputs, 2), axis=1))        elif mode==2:            results = paddle.max(paddle.abs(outputs), axis=1)        elif mode==3:            if weight is None:                C = outputs.shape[1]                weight = paddle.to_tensor([1/C] * C, dtype='float32')            else:                weight = paddle.to_tensor(weight, dtype='float32')            results = paddle.einsum('nchw, c -> nhw', paddle.abs(outputs), weight)        elif mode==4:            results = paddle.abs(outputs)        return paddle.clip(results, 0, 255).cast('uint8')        @paddle.no_grad()    def forward(self, images, mode=0, weight=None):        outputs = self.filter(images)        return self.postprocess(outputs, mode, weight)
登录后复制

图像边缘检测测试函数

为了方便测试就构建了如下的测试函数,测试同一张图片不同算子/不同边缘强度计算方法的边缘检测效果In [2]
import osimport cv2from PIL import Imagedef test_edge_det(kernel, img_path='test.webp'):    img = cv2.imread(img_path, 0)    img_tensor = paddle.to_tensor(img, dtype='float32')[None, None, ...]    op = EdgeOP(kernel)    all_results = []    for mode in range(4):        results = op(img_tensor, mode=mode)        all_results.append(results.numpy()[0])        results = op(img_tensor, mode=4)    for result in results.numpy()[0]:        all_results.append(result)    return all_results, np.concatenate(all_results, 1)
登录后复制

Roberts 算子

边缘检测系列1:传统边缘检测算子 - 游乐网

In [3]
roberts_kernel = np.array([    [[        [1,  0],        [0, -1]    ]],    [[        [0, -1],        [1,  0]    ]]])_, concat_res = test_edge_det(roberts_kernel)Image.fromarray(concat_res)
登录后复制
登录后复制

Prewitt 算子

边缘检测系列1:传统边缘检测算子 - 游乐网

In [4]
prewitt_kernel = np.array([    [[        [-1, -1, -1],        [ 0,  0,  0],        [ 1,  1,  1]    ]],    [[        [-1,  0,  1],        [-1,  0,  1],        [-1,  0,  1]    ]],    [[        [ 0,  1,  1],        [-1,  0,  1],        [-1, -1,  0]    ]],    [[        [ -1, -1,  0],        [ -1,  0,  1],        [  0,  1,  1]    ]]])_, concat_res = test_edge_det(prewitt_kernel)Image.fromarray(concat_res)
登录后复制
登录后复制

Sobel 算子

边缘检测系列1:传统边缘检测算子 - 游乐网

In [5]
sobel_kernel = np.array([    [[        [-1, -2, -1],        [ 0,  0,  0],        [ 1,  2,  1]    ]],    [[        [-1,  0,  1],        [-2,  0,  2],        [-1,  0,  1]    ]],    [[        [ 0,  1,  2],        [-1,  0,  1],        [-2, -1,  0]    ]],    [[        [ -2, -1,  0],        [ -1,  0,  1],        [  0,  1,  2]    ]]])_, concat_res = test_edge_det(sobel_kernel)Image.fromarray(concat_res)
登录后复制
登录后复制

Scharr 算子

边缘检测系列1:传统边缘检测算子 - 游乐网

In [6]
scharr_kernel = np.array([    [[        [-3, -10, -3],        [ 0,   0,  0],        [ 3,  10,  3]    ]],    [[        [-3,  0,   3],        [-10, 0,  10],        [-3,  0,   3]    ]],    [[        [ 0,  3,  10],        [-3,  0,  3],        [-10, -3,  0]    ]],    [[        [ -10, -3, 0],        [ -3,  0, 3],        [ 0,  3,  10]    ]]])_, concat_res = test_edge_det(scharr_kernel)Image.fromarray(concat_res)
登录后复制
登录后复制

Krisch 算子

边缘检测系列1:传统边缘检测算子 - 游乐网

In [7]
Krisch_kernel = np.array([    [[        [5, 5, 5],        [-3,0,-3],        [-3,-3,-3]    ]],    [[        [-3, 5,5],        [-3,0,5],        [-3,-3,-3]    ]],    [[        [-3,-3,5],        [-3,0,5],        [-3,-3,5]    ]],    [[        [-3,-3,-3],        [-3,0,5],        [-3,5,5]    ]],    [[        [-3, -3, -3],        [-3,0,-3],        [5,5,5]    ]],    [[        [-3, -3, -3],        [5,0,-3],        [5,5,-3]    ]],    [[        [5, -3, -3],        [5,0,-3],        [5,-3,-3]    ]],    [[        [5, 5, -3],        [5,0,-3],        [-3,-3,-3]    ]],])_, concat_res = test_edge_det(Krisch_kernel)Image.fromarray(concat_res)
登录后复制
登录后复制

Robinson算子

边缘检测系列1:传统边缘检测算子 - 游乐网

In [8]
robinson_kernel = np.array([    [[        [1, 2, 1],        [0, 0, 0],        [-1, -2, -1]    ]],    [[        [0, 1, 2],        [-1, 0, 1],        [-2, -1, 0]    ]],    [[        [-1, 0, 1],        [-2, 0, 2],        [-1, 0, 1]    ]],    [[        [-2, -1, 0],        [-1, 0, 1],        [0, 1, 2]    ]],    [[        [-1, -2, -1],        [0, 0, 0],        [1, 2, 1]    ]],    [[        [0, -1, -2],        [1, 0, -1],        [2, 1, 0]    ]],    [[        [1, 0, -1],        [2, 0, -2],        [1, 0, -1]    ]],    [[        [2, 1, 0],        [1, 0, -1],        [0, -1, -2]    ]],])_, concat_res = test_edge_det(robinson_kernel)Image.fromarray(concat_res)
登录后复制
登录后复制

Laplacian 算子

边缘检测系列1:传统边缘检测算子 - 游乐网

In [9]
laplacian_kernel = np.array([    [[        [1, 1, 1],        [1, -8, 1],        [1, 1, 1]    ]],    [[        [0, 1, 0],        [1, -4, 1],        [0, 1, 0]    ]]])_, concat_res = test_edge_det(laplacian_kernel)Image.fromarray(concat_res)
登录后复制
登录后复制

总结

简单介绍并实现了几种常用的传统边缘检测算子
热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:边缘检测系列1:传统边缘检测算子要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://www.php.cn/faq/1413604.html
ai switch 算法

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-07-05 16:52
Mac M系列芯片运行Codex Hugging Face插件卡顿性能优化指南

在MacM系列芯片上使用Codex插件出现卡顿,主要源于默认运行模式未适配AppleSilicon架构。首先需确认VSCode是否通过Rosetta转译运行,并强制其以ARM64原生模式启动。随后配置专为ARM64优化的Python虚拟环境,安装支持MPS加速的PyTorch,并在插件中切换解释器。同时调整HuggingFace参数,启用CoreML、强制使

AI热点2026-07-05 16:52
Figma AI跨平台交付开发Dev Mode查看指南

启用DevMode后,通过删除线检查CSS兼容性,以px hex格式提取跨平台代码,并在Properties页签验证变量映射,避免硬编码“幽灵值”,从而确保开发交付的准确性和一致性。

AI热点2026-07-05 16:52
ComfyUI提示词与IPAdapter的搭配写法

在ComfyUI中使用IPAdapter时,提示词需与参考图形成语义锚定,明确主体身份、风格强化短语及权重标记。多图混合可采用单节点统一加权或多节点并行,权重之和不宜超1 8。避免引导词和抽象描述,改用具体特征如发型、眉形,且侧脸需标明朝向。

AI热点2026-07-05 16:52
Genspark高效梳理新闻事件起因经过

Genspark通过识别起因类型,将事件经过按主体动作、即时反馈、跨域扩散三层动态建模,并支持追问补全因果关系,最终输出带来源锚点和置信度标签的交互式因果图谱,便于直观掌握事件演变脉络。

延伸阅读