从一维信号卷积到图像卷积的过渡讲解
今天我们来探讨图像处理中一个非常基础但至关重要的核心概念——卷积。很多人一听到“卷积”这个词就感到头疼,觉得它是数学课上的噩梦。实际上,从一维信号到二维图像,它背后的逻辑非常直观,我们一步步来拆解。 (1)先从我们最熟悉的一维连续时间信号说起。 简单来说,连续时间信号的卷积是一种特殊的积分运算。它的
今天我们来探讨图像处理中一个非常基础但至关重要的核心概念——卷积。很多人一听到“卷积”这个词就感到头疼,觉得它是数学课上的噩梦。实际上,从一维信号到二维图像,它背后的逻辑非常直观,我们一步步来拆解。
(1)先从我们最熟悉的一维连续时间信号说起。

简单来说,连续时间信号的卷积是一种特殊的积分运算。它的过程可以想象成:一个函数固定不动,另一个函数先以y轴为对称轴进行“反转”,然后两个函数不断执行“相乘→积分→滑动”这一系列动作。这就是一维卷积的完整流程。
(2.)当我们把连续时间信号离散化之后,卷积的定义变成了下面这个样子。
其中,x(n)和h(n)就是参与运算的离散时间信号。在这个离散版本里,卷积的过程尤为清晰:在坐标轴上让x(n)保持不动,先把h(n)反转,然后不断执行“两者重合部分相乘求和,再让h(n)滑动”。
离散时间信号本质上是一串序列,它是一维的。那么,如果我们把它扩充为二维序列,那不就是图像了吗?没错,图像的本质就是灰度值的二维序列。这一步,其实就是从一维信号走向图像处理的桥梁。
(3.)下面我们就来看看图像卷积到底是怎么回事。

在这幅图中,“source pixel”就是我们的图像,它本质上是灰度的二维序列。图中的“convolution kernel”是什么呢?这个我们称之为卷积核。卷积核就好比是一维离散信号卷积中参与运算的那个信号,而图像本身,相当于另一个离散序列信号。图像卷积的过程与一维情况极其相似:
图像卷积,说白了就是卷积核在图像上按行滑动遍历像素时,不断进行“相乘再求和”的过程。举个例子:如图中所示,目前卷积核滑动到了图像的左上角。我们把图像上对应位置的9个像素值与卷积核上的9个数值,按照对应位置相乘再相加,得到一个和——这就是一个卷积值。然后,把卷积核向右移动一个像素,继续执行对应位置相乘再相加,得到第二个卷积值。当把整张图像的所有像素都遍历完之后,得到的结果就构成了一幅全新的图像。这就是我们常说的“卷积得到的图像”。
(4)不过在图像处理中,我们通常不会为了卷积而去卷积。为什么这么说?
按照卷积的定义,它是与卷积核相乘求和的结果。如果图像本身像素的数据类型是8位无符号数,那么它的灰度范围是0(黑色)到255(白色)。这样一来,相乘后的值很容易就超过255了。超了怎么办?一般就是直接截断为255。从上面的过程就能看出来,单纯的卷积确实没什么实用价值——图像卷积的真正用武之地,远不止于此。
(5)图像卷积最常用的场景包括:图像滤波(平滑化)、图像梯度、开运算、闭运算、黑帽运算、顶帽运算等形态学处理,以及基于梯度运算的边缘提取。
比如均值滤波,它的卷积核长这样:

它也是按照卷积运算的过程——相乘求和再滑动。只不过它的核里每个值都是1,而且在求和之后还会除以核的大小来取平均。这样一来,卷积的结果就变成了原图像像素的局部平均值。
再比如高斯滤波,它的卷积核长这样:

高斯滤波的核有个特点:离中心越近的值越大,也就是说不同位置的权重不同。在相乘求和之后,它会除以核内所有数值的总和,从而保证灰度值不会超出范围。
看到这里,你可能会疑惑:“不是正在说卷积吗,怎么开始扯滤波了?”
情况是这样:滤波的本质就是卷积,它是按照某种特殊规则去进行的卷积。此时使用的卷积核不是随意的,而是有既定的规矩。比如卷积核通常取3×3、5×5这样具有中心的对称核,而且核内数值的分布也有严格规定,具体视不同的滤波方式而定。
说到这儿,还得聊聊什么是卷积核。卷积核其实就是一种求和的规则,是一种映射规则。原图像像素点的值与对应位置上的卷积核的值相乘,然后按权重(即卷积核的数值)相加。如果用数学来表达,就是:
src(原图像) × kernel(映射规则) = result(卷积结果)。
所以,卷积核本质上就是一种运算规则。根据卷积核规则的不同,衍生出了不同的滤波方式、不同的梯度运算方式等等。
讲到这里,我想再展开说说“为什么卷积一下就能滤波”。举个例子:比如刚才提到的均值滤波,它的映射规则(也就是卷积核)就是全部是1除以核大小。这意味着,原图像与这样的卷积核卷积的结果,就是把原图像对应位置的像素值全部加起来再取平均值。对于5×5的核来说,就是所有值乘以1/25再相加。很显然,卷积的结果就是把原图像的像素值取了个平均值。这样一来,像素与像素之间的差异性就变小了。图像中那些分明的线条和边界,正是由于像素值存在巨大差异导致的。差异性减小了,边界自然就模糊了,图像也就变得平滑了。
说到滤波,它在数字信号处理中,比如高通滤波,就是为了滤除高频信号(那些分布在高频区域的信号)。在图像滤波中也是同理。刚才说滤波后像素之间的差异性变小了,这其实就意味着滤除了高频成分。高频信号的定义就是变化很快的信号。在图像中,如果两个像素差异很大,那就意味着移动一个像素的距离带来的变化是巨大的。当这些巨大的变化连接起来,就形成了图像中的图形边界或线条。这也是为什么线条和边缘被称之为图像中的“高频信号”。
看到这里,应该就能理解为什么卷积一下就能滤波了吧?卷积的一种重要应用形式就是滤波。当然,不同的卷积核会带来不同的卷积效果,所以卷积还有梯度运算等其他应用形式,差别就在于卷积核的不同。
总结起来就是:图像卷积依靠卷积核完成,卷积核规定了运算规则,滤波是卷积运算所带来的效果。不同的卷积核会得到不同的卷积效果,所以衍生出了不同种类的滤波、形态运算、梯度运算等等概念。可以看出,卷积是图像处理的基础,许许多多的处理方法都离不开卷积。
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:从一维信号卷积到图像卷积的过渡讲解要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点GoogleMeet是面向商业与企业的视频会议服务,支持屏幕共享、实时字幕及与GoogleWorkspace集成,适用于项目讨论、网络研讨和线上教学等多种会议场景,具备扎实的安全与隐私保护。
Lanter是Chrome扩展,利用AI将YouTube视频语音转为带时间戳的文字笔记,支持一键抓取高光、自动标点排版、书签管理、全局搜索及每日邮件汇总,方便高效回顾视频关键内容。
一款AI驱动的Chrome扩展音频笔记应用,支持录音自动转文字、标签分类与全文搜索,将语音转化为可检索的数字资产,显著提升信息定位与管理效率。
专为GoogleMeet设计的AIChrome扩展,实时转录会议内容,自动生成摘要并提取行动项与决策,无缝同步至Google文档、任务及Gmail,省去手动整理时间,显著提升协作效率。
- 日榜
- 周榜
- 月榜
热点快看
