用gabor滤波器 维基百科来提出手写数字的特征有什么优势

君,已阅读到文档的结尾了呢~~
基于gabor变换的特征提取及其应用,gabor变换,gabor 特征,不变换的特征值区别,gabor官网,gabor滤波,gabor,gabor滤波器,gabor filter,gabor鞋
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
基于gabor变换的特征提取及其应用
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口Gabor 特征总结 - 推酷
Gabor 特征总结
本文转载自
Gabor 特征是一种可以用来描述图像纹理信息的特征,Gabor 滤波器的频率和方向与人类的视觉系统类似,特别适合于纹理表示与判别。
Gabor 特征主要依靠 Gabor 核在频率域上对信号进行加窗,从而能描述信号的局部频率信息。
说到 Gabor 核,不能不提到傅里叶变换。正是靠傅里叶变换,我们才能将信号转换到频率域,才能让Gabor核在频率域去加窗。而在原本的空间域中,一个 Gabor 核实际上就是一个高斯核与正弦波调制的结果,可以看做是高斯核应用在了正弦波的频域部分。
上面说的还是比较笼统,下面我们一步一步介绍Gabor核是怎么对信号“加窗”的。
一、傅里叶变换
关于傅里叶变换,韩昊同学总结过一个
。我这里就不赘述了。
总之,傅里叶变换是图像处理里面一个很重要的工具,本质是将任意一个函数转化为若干不同频率正弦波的组合,(组合方式在离散函数中就是相加,在连续函数中就是积分)。由此,将空域(或时域)信号转换到了频域(即频率域)。
空间域中多个波叠加,在频率域中就对应着若干个散落的点。韩昊同学将其比喻为不同音阶组成的音谱。
频率域中的基本元素就是正弦波:空间域中的一个正弦波波形,在频率域中只要一个点就能表示。
上有一个动态图,展示了一个叠加波如何分解到频率域上的若干点:
事实上,任何波都可以看做是若干(乃至无穷)个不同频率正弦波的叠加。
就像可见光可以看做不同频率的光的叠加一样,通过傅里叶变换,我们能将任何波分解为不同频率波的叠加。这样转换的好处是:有些情况下空域中很复杂的问题,在频率域会变得十分简单。
二、Gabor 核
2.1 一维 Gabor 核
2.1.1 一维傅里叶变换
一维傅里叶变化定义如下:
$$ \hat{f}(\xi)=\int_{-\infty}^\infty f(t) e^{-i2\pi t \xi}\, dt,\quad \xi \text{为任意实数} \tag{1}\label{1} $$
其中,f 为输入信号,$\xi$ 表示分解得到的各个波的频率,$\hat{f}(f, \xi)$ 为变换后的信号。公式中的 $e^{-i2\pi x \xi}$ 表示一个复数波,关于复数波的解释可以看我
从上面的公式可以看出,原信号 $f(t)$ 以 t 为自变量,描述了信号值随时间的变化,说明原信号空间在时间域中。经过傅里叶变换后,函数自变量变为了 $\xi$ ,$\hat{f}(\xi)$ 描述了信号值随频率的变化,即信号转换到了频率域空间中。如果说原来信号的图示需要以时间(空间)为坐标轴的话,信号在傅里叶变换后的图示就需要以频率为坐标轴了。
2.1.2 一维 Gabor 核
一维Gabor核由一个高斯核与一个复数波的乘积定义:$$ Gabor(t) = ke^{i\theta} \omega(at) s(t) \tag{2}\label{2}$$
$$\begin{cases}
\omega(t)=e^{-\pi t^2} \\\
s(t) = e^{i(2\pi f_0 t)} \\\
\end{cases}$$
这里,$f_0$ 是复数波$s(t)$的频率。
将复数波$s(t) = e^{i(2\pi f_0 t)}$代入$\ref{2}$式中,得到:
$$\begin{align}
Gabor(t) & = k \omega(at) e^{i(2\pi f_0 t + \theta)} \\\
& = k \omega(at) \left[ \cos(2\pi f_0 t+\theta) + i\sin(2\pi f_0 t+\theta) \right]
\end{align}$$
上面最后一步得到了 Gabor 核的复数表示,我们就可以按实部和虚部将其拆分为实核和虚核,在很多应用中,我们只需要应用 Gabor核的实数部分即可:
$$\begin{cases}
Gabor_{real}(t) = \omega(at)\cos(2\pi f_0 t + \theta) \\\
Gabor_{imag}(t) = \omega(at)\sin(2\pi f_0 t + \theta)
\end{cases}$$
2.1.3 Gabor 核的傅里叶变换
将 Gabor 核(式$\ref{2}$)套入一维傅里叶变换(式$\ref{1}$)中,得到 Gabor 核的傅里叶变换:
$$\begin{align}
\hat{Gabor}(f)
& = ke^{i\theta} \int_{-\infty}^{\infty} e^{-i 2\pi f t} \omega(at) s(t) \,dt \\\
& = ke^{i\theta} \int_{-\infty}^{\infty} e^{-i2\pi (f-f_0)t} \omega(at) \,dt \\\
& = (k/a) \cdot e^{i\theta} \cdot \hat{\omega}\left( (f-f_0)/a \right) \\\
\end{align} \tag{3}\label{3}$$
上式中出现了 $\hat{\omega}(\frac{f-f_0}{a})$ 的形式,这里需要补充高斯核一个很有趣的性质:$\hat{\omega}(f) = \omega(f) = e^{-\pi f^2}$,这个性质这里就不证明了,有兴趣的同学可以自己推导一下。根据这个性质,上式中的 $\hat{\omega}(\frac{f-f_0}{a})$ 也可以写作 $\omega(\frac{f-f_0}{a})$,二者可以自由转换。
此外,$\ref{3}$式中的末尾,我们知道了Gabor核傅里叶变换后是这样一个形式:$\frac{k}{a} e^{i\theta} \hat{\omega}(\frac{f-f_0}{a})$,这个形式可以看做是一个复数波,它的幅度$$A = \left\lVert \hat{Gabor}(f) \right\rVert = \frac{k}{a} \hat{\omega}(\frac{f-f_0}{a}) = \frac{k}{a} \omega(\frac{f-f_0}{a}) $$
也就是说,Gabor核相当于在频率域应用了一个高斯核窗口。假设我们这时有了一个信号的频率域:$f_{in}(f)$,那么我们直接用频率域的Gabor核 $\hat{Gabor}$ 与其相乘,就实现了对 $f_0$ 频率邻域范围内的滤波效果:输入信号频率离这个 Gabor 核的 $f_0$ 越远,则乘上Gabor核之后的结果就越小,尤其是当 $f_{in}$ 在 $f_0$ 的 $3\sigma$ 区间外时,这个频率几乎可以忽略不计。于是,最终能保留下来的信号就都是 $f_0$ 频率附近的信号了。
这个想法,用公式表示出来就是:$$ \hat{Gabor} \cdot \hat{f_{in}} $$
从这个角度出发,给我们任意一个输入信号,我们先用傅里叶变换将其变换到频率域得到$\hat{f_{in}}$,再用 Gabor 核的傅里叶变换结果与之相乘,就是频域滤波的结果了。
不过我们大可不必这么麻烦,因为有卷积定理:
$$Gabor * f_{in} = \hat{Gabor} \cdot f_{in} $$
这样看来,我们只需要用 Gabor 核和输入信号卷积就可以得到输入信号在某频率邻域附近的响应结果!!
我们既可以用这个响应结果来实现频域滤波,又可以用它来描述信号的频率信息。下面要提到的Gabor特征,就是用Gabor核来描述信号的频率信息,从而作为信号的特征的。
2.2 二维 Gabor 变换
将上面的一维情况推广至二维:
2.2.1 二维傅里叶变换:
二维傅里叶变换定义如下:$$ \hat{f}(\xi_x, \xi_y) = \iint f(x,y) e^{-i2\pi (\xi_x x + \xi_y y)}\, dx dy$$
为了简洁,改用 $(u_0, v_0)$ 来代替 $(\xi_x, \xi_y)$,则上式可写为:
$$ \hat{f}(u_0, v_0) = \iint f(x, y) \exp {\left( -i2\pi {\left( u_0 x + v_0 y\right) }\right) } \, dxdy \tag{4}\label{4}$$
提醒一下,这里 $(x, y)$ 表示空域坐标,$(u_0, v_0)$ 表示频域坐标。
2.2.2 二维复数波
二维复数波完整定义如下(用复指数形式表示):$$ s(x,y) = \exp\left( i \left(2\pi (u_0 x + v_0 y) + P \right) \right) $$
由于初始相位对Gabor核影响不大,因此可以将其省略,得到更简洁的形式(论文中关于 Gabor 函数的定义各不一样,主要是这些细节的考虑不同):$$ s(x,y) = \exp \left(i \left(2\pi (u_0 x + v_0 y) \right) \right) $$
2.2.3 二维高斯函数
二维高斯函数定义如下:
$$ \omega(x, y, \sigma_x, \sigma_y) = K \exp(-\pi \left (x-x_0)^2 / \sigma_x^2 + (y-y_0)^2 / \sigma_y^2\right ) \tag{5}\label{5}$$
其中,$\sigma_x, \sigma_y$ 分别为两个方向上的尺度参数(scaling parameters),用来控制高斯函数在两个方向上的“展布”形状。$(x_0, y_0)$ 为高斯函数的中心点。$K$ 为常数。
考虑全面的话,高斯函数还要有(顺时针)旋转,即:
$$\begin{cases}
(x-x_0)_r = (x-x_0)\cos \theta + (y-y_0)\sin \theta \\\
(y-y_0)_r = -(y-y_0)\sin \theta + (y-y_0)\cos \theta
\end{cases}$$
加入旋转参数后的二维高斯函数为:$$ \omega_r(x, y, \theta, \sigma_x, \sigma_y) = K \exp(-\pi \left (x-x_0)_r^2 / \sigma_x^2 + (y-y_0)_r^2 / \sigma_y^2\right )$$
上图即是一个二维高斯核的图像,该高斯核中,$(x_0, y_0) = (0, 0)$,$(\sigma_x^2, \sigma_y^2) = (50, 40)$,$\theta = -45&$
从图像可以看出,$\sigma_x 和 \sigma_y$分别控制了高斯两个方向的“展布”情况。
2.2.4 Gabor 滤波器核
类似一维 Gabor 核,我们将二维高斯函数与二维复数波相乘,就得到了二维的Gabor核:
$$\begin{align}
Gabor(x_0, y_0, \theta, \sigma_x, \sigma_y, u_0, v_0)
& = s(x,y) \omega_r(x,y) \\\
& = K \exp\left(-\pi \left( (x-x_0)_r^2/\sigma_x^2 + (y-y_0)_r^2/\sigma_y^2 \right) \right) \exp\left(i 2\pi (u_0 x + v_0 y) \right) \\\
\end{align}$$
它的各个参数含义如下:
$(x_0, y_0)$: 高斯核的中心点
$\theta$: 高斯核的旋转方向(顺时针)
$(\sigma_x, \sigma_y)$: 高斯核两个方向上的尺度
$(u_0, v_0)$: 频域坐标
$K$: 高斯核的幅度(magnitude)的比例
上图为Gabor核在频率域中的图示,这个Gabor核就是从之前那个高斯核得到的,其参数分别为:$u_0 = v_0 = 1/80$,$x_0 = y_0 = 0$,$\sigma_x^2 = 50$,$\sigma_y^2 = 40$,$\theta = -45&$,$F_0 = \sqrt{2}/80$,$\omega_0=45&$。
上图为Gabor核在空间域中的图示,参数和上面那个Gabor核一样。图像左边是实部,右边是虚部。这样的Gabor核与图像进行卷积,我们便能得到图像在$(u_0, v_0)$频率附近的响应情况。在图像处理中,通常使用Gabor的实部进行卷积就可以。
三、Gabor 核作为图像特征
通过上面的分析,我们知道了,一个Gabor核能获取到图像某个频率邻域的响应情况,这个响应结果可以看做是图像的一个特征。那么,我们如果用多个不同频率的Gabor核去获取图像在不同频率邻域的响应情况,最后就能形成图像在各个频率段的特征,这个特征就可以描述图像的频率信息了
上图展示了一系列具有不同频率的 Gabor 核,用这些核与图像卷积,我们就能得到图像上每个点和其附近区域的频率分布情况。
由于纹理特征通常和频率相关,因此Gabor核经常用来作为纹理特征。又因为字符识别问题通常都是识别纹理的过程,所以Gabor核在光学字符识别(OCR)系统中也有广泛应用。
由于本人对信号处理不是太了解,因此对傅里叶变换、频率域的理解都是个人粗浅的理解。为了完成这篇文章,我学习了很多信号处理的知识,重新理解了一些基本概念,看别人的帖子建立过一些认识,随后这层理解不牢又被推翻,再重新建立……前前后后用了一周的时间才最终完成。如有不严谨或错误的地方,还请大家谅解。要严肃学习的话最好还是看权威教材、看论文,我这篇文章可以作为另一个角度的补充。
Movellan J R. Tutorial on Gabor filters[J]. Open Source Document, 2002.
Idrissa M, Acheroy M. Texture classification using Gabor filters[J]. Pattern Recognition Letters, ): .
查看更多文章
已发表评论数()
请填写推刊名
描述不能大于100个字符!
权限设置: 公开
仅自己可见
正文不准确
标题不准确
排版有问题
主题不准确
没有分页内容
图片无法显示
视频无法显示
与原文不一致图像处理(93)
1.傅里叶变换
数字图像处理的方法主要分成两大部分:空域分析法和频域分析法。空域分析法就是对图像矩阵进行处理;频域分析法是通过图像变换将图像从空域变换到频域,从另外一个角度来分析图像的特征并进行处理。频域分析法在图像增强、图像复原、图像编码压缩及特征编码压缩方面有着广泛应用。
如果一个信号f(t)在上满足:
① f(t)在任一有限区间上满足狄氏条件;
② f(t)在上绝对可积即
就可以通过傅里叶变换把时域信号f(t)转化到频域进行处理:
然后再通过傅里叶反变换把频域信号转化到时域:
傅里叶变换是线性系统分析的有力工具,提供了一种把时域信号转换到频域进行分析的途径,时域和频域之间是一对一的映射关系。图像的频率是表征图像中灰度变化剧烈程度的指标,是灰度在平面空间上的梯度。如:大面积的沙漠在图像中是一片灰度变化缓慢的区域,对应的频率值很低;而对 于地表属性变换剧烈的边缘区域在图像中是一片灰度变化剧烈的区域,对应的频率值较高。
傅立叶变换在实际中有非常明显的物理意义,设f是一个能量有限的模拟信号,则其傅立叶变换就表示f的 谱。从纯粹的数学意义上看,傅立叶变换是将一个函数转换为一系列周期函数来处理的。从物理效果看,傅立叶变换是将图像从空间域转换到频率域,其逆变换是将 图像从频率域转换到空间域。换句话说,傅立叶变换的物理意义是将图像的灰度分布函数变换为图像的频率分布函数,傅立叶逆变换是将图像的频率分布函数变换为 灰度分布函数。
2) 不足之处
经典Fourier变换只能反映信号的整体特性(时域,频域)。对傅里叶谱中的某一频率,无法知道这个频率是在什么时候产生的。从傅里叶变换的定义也可看出,傅里叶变换是信号在整个时域内的积分,因此反映的是信号频率的统计特性,没有局部化分析信号的功能。另外,要求信号满足平稳条件。傅里叶变换时域和频域是完全分割开来的。
l 由式可知,要用Fourier变换研究时域信号频谱特性,必须要获得时域中的全部信息;
l 信号在某时刻的一个小的邻域内发生变化,那么信号的整个频谱都要受到影响,而频谱的变化从根本上来说无法标定发生变化的时间位置和发生变化的剧烈程度。也就是说,Fourier变换对信号的齐性不敏感。不能给出在各个局部时间范围内部频谱上的谱信息描述。然而在实际应用中齐性正是我们所关心的信号局部范围内的特性。如,音乐,语言信号等。即:局部化时间分析,图形边缘检,地震勘探反射波的位置等信息极重要。
l 为解决傅里叶变换的局限性,产生了Gabor变换和小波变换。
2.Gabor变换
Gabor变换是D.Gabor 1946年提出的。为了由信号的Fourier变换提取局部信息,引入了时间局部化的窗函数,得到了窗口Fourier变换。由于窗口Fourier变换只依赖于部分时间的信号,所以,现在窗口Fourier变换又称为短时Fourier变换,这个变换又称为Gabor变换。
1) Gabor优点
Gabor小波与人类视觉系统中简单细胞的视觉刺激响应非常相似。它在提取目标的局部空间和频率域信息方面具有良好的特性。虽然Gabor小波本身并不能构成正交基,但在特定参数下可构成紧框架。Gabor小波对于图像的边缘敏感,能够提供良好的方向选择和尺度选择特性,而且对于光照变化不敏感,能够提供对光照变化良好的适应性。上述特点使Gabor小波被广泛应用于视觉信息理解。
Gabor滤波器和脊椎动物视觉皮层感受野响应的比较:第一行代表脊椎动物的视觉皮层感受野,第二行是Gabor滤波器,第三行是两者的残差。可见两者相差极小。Gabor滤波器的这一性质,使得其在视觉领域中经常被用来作图像的预处理。
2) Gabor定义
① 具体窗函数――Gaussaion的 Gabor变换定义式
Gabor变换的基本思想:把信号划分成许多小的时间间隔,用傅里叶变换分析每一个时间间隔,以便确定信号在该时间间隔存在的频率。其处理方法是对f(t)加一个滑动窗,再作傅里叶变换。
设函数f为具体的函数,且,则Gabor变换定义为
其中,,是高斯函数,称为窗函数。其中a&0,b&0.
是一个时间局部化的“窗函数”。其中,参数b用于平行移动窗口,以便于覆盖整个时域。对参数b积分,则有
信号的重构表达式为
Gabor取g(t)为一个高斯函数有两个原因:一是高斯函数的Fourier变换仍为高斯函数,这使得Fourier逆变换也是用窗函数局部化,同时体现了频域的局部化;二是Gabor变换是最优的窗口Fourier变换。其意义在于Gabor变换出现之后,才有了真正意义上的时间-频率分析。即Gabor变换可以达到时频局部化的目的:它能够在整体上提供信号的全部信息而又能提供在任一局部时间内信号变化剧烈程度的信息。简言之,可以同时提供时域和频域局部化的信息。
② 窗口的宽高关系
经理论推导可以得出:高斯窗函数条件下的窗口宽度与高度,且积为一固定值。
矩形时间――频率窗:宽为,高。
由此,可以看出Gabor变换的局限性:时间频率的宽度对所有频率是固定不变的。实际要求是:窗口的大小应随频率而变化,频率高窗口应愈小,这才符合实际问题中的高频信号的分辨率应比低频信号的分辨率要低。
3) 离散Gabor变换的一般求法
① 首先选取核函数
可根据实际需要选取适当的核函数。如,如高斯窗函数;
则其对偶函数为
② 离散Gabor变换的表达式
是的对偶函数,二者之间有如下双正交关系。
4) Gabor变换的解析理论
Gabor变换的解析理论就是由g(t)求对偶函数的方法。
定义g(t)的Zak变换为
可以证明对偶函数可由下式求出:
有了对偶函数可以使计算更为简洁方便。
5) 适用条件
① 临界采样Gabor展开要求条件:TΩ=2π;
② 过采样展开要求条件:TΩ≤2π;
当TΩ>2π时,欠采样Gabor展开,已证明会导致数值上的不稳定。
① 暂态信号检测
如果对信号波形有一定的先验知识且可以据此选取合适的基函数,可以用Gabor变换对信号作精确的检测统计计量。
② 图象分析与压缩
二维Gabor变换可以应用到图象分析与压缩中。
3. 二维Gabor滤波器
用Gabor 函数形成的二维Gabor 滤波器具有在空间域和频率域同时取得最优局部化的特性,因此能够很好地描述对应于空间频率(尺度)、空间位置及方向选择性的局部结构信息。Gabor滤波器的频率和方向表示接近人类视觉系统对于频率和方向的表示,并且它们常备用于纹理表示和描述。在图像处理领域,Gabor滤波器是一个用于边缘检测的线性滤波器。,在空域,一个2维的Gabor滤波器是一个正弦平面波和高斯核函数的乘积。Gabor滤波器是自相似的,也就是说,所有Gabor滤波器都可以从一个母小波经过膨胀和旋转产生。实际应用中,Gabor滤波器可以在频域的不同尺度,不同方向上提取相关特征。
空域来看:是高斯核函数调制正弦平面波
s(x,y)是复杂的正弦函数,相当于载波;w(x,y)是2维高斯函数包迹。
(u0,v0)定义了正弦平面波的时域频率,在极坐标中可用f和Θ来表示。
a,b 为x和y方向的椭圆高斯的方差
K=1/ab 为高斯包迹的参数
r 为角度旋转的下标
Θ为旋转角度
(x0,y0)为函数峰值,也是接受域的中心
f(x,y) f(x',y')
Gabor滤波器的傅里叶变换:峰值响应在复正弦的空域频率(u0,v0)
Gabor滤波器示意图,3种角度5种方向:
生成2维Gabor滤波器的matlab 代码:
Opencv实现:
★emouse 思·睿博客文章★原创文章转载请注明:
本文根据博客 ,博客整理。
参考知识库
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:680815次
积分:15165
积分:15165
排名:第500名
转载:302篇
评论:22条
(17)(127)(159)(189)(317)(382)(479)(217)(348)(477)(286)(113)(8)(1)(72)(11)(10)(21)(11)
----------coding----------
----------MLCV----------
----------IT笔试面试----------
----------大数据云计算----------
----------Math----------基于Gabor特征提取+神经网络的表情识别_图文_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
基于Gabor特征提取+神经网络的表情识别
上传于||暂无简介
阅读已结束,如果下载本文需要使用2下载券
想免费下载本文?
定制HR最喜欢的简历
下载文档到电脑,查找使用更方便
还剩32页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢gabor滤波器有什么优缺点
Gabor滤波器具有两个优越性:一方面满足”测不准原理”所确定的有效持续时间和有效频率带宽乘积的下限,这意味着它可以同时在时域和频域获得最佳的局部化;另一方面 Gabor滤波器是带通的,与人类视觉接收场模型相吻合缺点是:计算量过大
为您推荐:
扫描下载二维码}

我要回帖

更多关于 gabor滤波器 维基百科 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信