区域生长:预先定义一个区域,将像素或者子区域聚合成更大的区域过程,
定义边的权重,所有的边中,截断的边的权重最小的值。
K-means要求事先分多少类
K-means一定最后收敛。
集成学习:
HOG梯度直方图
区域生长:预先定义一个区域,将像素或者子区域聚合成更大的区域过程,
定义边的权重,所有的边中,截断的边的权重最小的值。
K-means要求事先分多少类
K-means一定最后收敛。
集成学习:
HOG梯度直方图
图像特征与描述:
颜色特征;量化颜色直方图,用于RGB、HSV颜色空间。优点:计算高效,劣势:量化问题、稀疏。
聚类颜色直方图;适用于颜色空间:Lab等颜色空间,Lab空间用数字化方法,描述人的视觉感受。使用聚类算法对所有像素点颜色向量进行聚类。单元由聚类中心代表。
边缘:尤其灰度值变化的区域。
一阶导数的极值即为边缘。还有可能因为噪声点产生起伏。
边缘提取:先进行高斯去噪(平滑)再使用一阶导数获取极值。导数对噪声敏感
定义斜着的边缘为:两个不同的方向分别求导数(梯度),然后组合起来即为边缘。
连立起来,形成一个点的梯度,每个点都有梯度。颜色越是平滑,梯度的幅值就越小,反之就越大。
青色为横 红色为纵向。
高斯分布的方差决定了特征提取到的边缘的尺度。
基于不同的特征点的描述子:
先找到特征点,在不同的方向、角度,不同的光照条件下观察一个物体。
特征点:不同视角的图片之间的对应的一个映射关系。稳定局部特征点:可重复性、显著性、抗图片变换。兴趣点、关键点:图片配准/拼接。
Harris脚点:一种显著点,在任何方向上移动小观察窗,导致大的像素变动。
FAST角点:
无多尺度和方向信息。
集合特征:斑点。
拉普拉斯梯度:
一阶导极值点-二阶导零点。
梯度、边缘通过寻找二阶导接近0
一阶导极值为梯度或边缘。
斑点:二阶导极值点为斑点。
局部特征:SIFT
可以获得轮廓。高斯金字塔是在传统金字塔的基础上,对每一层用不同的参数做高斯模糊。是的每一层金字塔有多张高斯模糊图像,这样一组图像是一个octave。
由下至上,越来越模糊。找不同尺度的特征。小图上找大特征、大图找小特征。
相邻的两层差一个方差。
在同一个octave进行相减。方差不同带来的不同尺度的边缘。极值点:比相邻两层的临近极值点都要大,才能成为极值点。
找到主方向解决旋转不变性。
对每个方向做直方图统计。
Haar-like: 边缘特征、线性特征、中心特征和对角线特征,这些特征组合成特征模板。
局部特征:SURF对SIFT中的运算进行了简化。将不稳定的特征点去掉。
特征点到达某个极大值或极小值,该特征点正定。
Harr模板套在原图上,根据原图表现判断当前该点是否为关键特征点。
SIFT图像尺度本身在变,SURF图像的模板在变。
SURF大的特征与小的特征不一定能万全镇找出来。
ORB特征描述:SIFT和SURF计算复杂,实时性差。ORB基于FAST角点的特征点检测与BRIEF特征描述技术。ORB速度相较于两者更快。
patch:方块。点对随机寻找的。
选定一个起始点和一个终止点。进行连线,值大为1,值小为0。
LBP(局部二值模式)不是先找特征点,每个像素点都与周围点进行比较,并将这种关系成为一种描述信息。
LBP特征具有灰度不变性,和旋转不变性。
不同大小的Gabor可以识别出不同大小的纹理。
颜色空间RGB,Red通道,Green通道,Blue通道。
CMYK颜色空间、HSV空间:人类视觉概念,画家配色。
最精确的颜色定义:CIE-XYZ颜色空间。
主流的颜色空间:RGB颜色空间,三通道彩色图片,图片转化为3维矩阵。
图像预处理:图像增强的目标,改善图像的视觉效果,突出对人或机器分析有意义的信息。
点运算,直方图对图像数据、特征分布的一种统计,灰度、颜色,梯度、边缘、形状纹理。
直方图:对数据空间(bin)进行量化。
直方图均衡化:利用图像直方图对对比度进行调整的方法。增强图像的局部对比度,均衡化后,亮度可以更好的在直方图上分布。
直方图均衡化实际上是对图像进行非线性拉伸。
重新分配各个灰度单位中的像素点数量,是一定灰度范围像素点数量的值大致相等。
自适应直方图均衡(AHE)移动模板在原始图像按指定步长滑动。每次移动后,滑到的区域进行直方图均衡。映射结果赋值给模板区域内所有点,每个店会又多次赋值,最终取值为这些取值的平均值。
CLAHE:自适应会放大均匀区域的噪音。
图像分块,先计算直方图,顶部放到底部进行垫高。
形态学运算:开运算与闭运算。
滤波、卷积每个图片位置(x,y)上进行基于邻域的函数计算。
卷积的范围一定会缩小的。边界填充(padding)获得同尺寸输出的情况下,卷积核越大,补充越多。补零,边界复制,镜像,块复制。允许padding卷积前后图像尺寸可保持不变。
平滑均值滤波/卷积:无法取出噪声并且破坏图像细节,试图向变得模糊。
平滑中值滤波/卷积:卷积区域内像素值从从小到大排序,取中间值作为卷积输出。
平滑高斯滤波/卷积:奇数尺寸,模拟人眼,关注中心区域,有效去除高斯噪声。
高斯金字塔:一个两维的卷积可拆分为两个相同的一维卷积。列卷积和行卷积。可以降低计算量同时也达到大的卷积核的效果。
梯度Prewitt滤波/卷积:
锐化:先给一个卷积,再减去平均的区域,凸显细节区域。
高斯金字塔:图像金字塔话,先进行图像平滑,再进行降采样,根据降采样率,得到一系列尺寸逐渐减小的图像。
存在斜杠表明原图出现明暗明暗变化。
傅里叶变换的不足,傅里叶变换假设信号平稳,实际上信号多数为不平稳的。缺乏时间和频率的定位功能,对于非平稳信号的局限性,在时间和频率分辨率上的局限性。
对画的窗口要求很高。窗口太窄:频率分辨率差,窗口太宽,时间分辨率差。