图像识别中的一些重要模型 #

Date: 2015/6/12

记录一下论文中提到的一些重要概念，以备查。more

SIFTSIFT特征 (Scale-invariant feature transform，尺度不变特征转换)于1999年提出，2004年完善，是一种计算机视觉的算法，用来侦测与描述影像中的局部性特征，它在空间尺度中寻找极值点，并提取出其位置、尺度、旋转不变量。一个比较好的sift库是Rob Hess维护的http://blogs.oregonstate.edu/hess/code/sift/SIFT的特点就是比较慢。对密集物体的检测，可以使用Dense SIFT。对行为变化不大的物体检测，可以使用PCA-SIFT降维处理。

SIFTSIFT特征 (Scale-invariant feature transform，尺度不变特征转换)于1999年提出，2004年完善，是一种计算机视觉的算法，用来侦测与描述影像中的局部性特征，它在空间尺度中寻找极值点，并提取出其位置、尺度、旋转不变量。
一个比较好的sift库是Rob Hess维护的 http://blogs.oregonstate.edu/hess/code/sift/ http://blogs.oregonstate.edu/hess/code/sift/
SIFT的特点就是比较慢。对密集物体的检测，可以使用Dense SIFT。对行为变化不大的物体检测，可以使用PCA-SIFT降维处理。- HOGHOG特征是利用方向梯度建立直方图，用于检测对象（特别是人）。它得到的描述子保持了几何和光学转化不变性，但是尺度不变性和旋转不变性没那么强，所以在行人检测中起到了较大的作用。并且计算简单，效率较高。

HOGHOG特征是利用方向梯度建立直方图，用于检测对象（特别是人）。它得到的描述子保持了几何和光学转化不变性，但是尺度不变性和旋转不变性没那么强，所以在行人检测中起到了较大的作用。并且计算简单，效率较高。- HMAXHMAX模型 1999年Riesenhuber, M. & Poggio, T提出了一个5层object recognition模型，其理念是模仿人的认知，由点到线到面逐级抽象，还原高级模型。还可以解析图片中的轮廓。包含S1 (Gabor Filter) Layers、C1 (Local Invariance) Layers、S2 (Intermediate Feature) Layers、C2 (Global Invariance) Layers以及最终的VTU Layer层。

HMAXHMAX模型 1999年Riesenhuber, M. & Poggio, T提出了一个5层object recognition模型，其理念是模仿人的认知，由点到线到面逐级抽象，还原高级模型。还可以解析图片中的轮廓。包含S1 (Gabor Filter) Layers、C1 (Local Invariance) Layers、S2 (Intermediate Feature) Layers、C2 (Global Invariance) Layers以及最终的VTU Layer层。- LabelMe一个在线的物体轮廓标注平台，有开源代码可以用。网址：http://labelme.csail.mit.edu/

LabelMe一个在线的物体轮廓标注平台，有开源代码可以用。网址： http://labelme.csail.mit.edu/ http://labelme.csail.mit.edu/

git clone https://github.com/CSAILVision/LabelMeAnnotationTool.git

git clone https://github.com/CSAILVision/LabelMeAnnotationTool.git Categories: 图像处理, 图像识别