论文学习1-PCANet.A Simple Deep Learning Baseline for Image Classification

结构

PCANet结构

  1. 在每张图片中选取patch,对patch去除均值。

  2. 对这个图片中的patch,进行PCA滤波。

  3. 同样再进行一轮PCA滤波。

  4. 输出层:对第二层得到图像进行二值化哈希编码,编码位数与第二层的滤波器个数相同。

    公式为:

     img

      把原来的图像映射成,0-255,此处img一般设置成 8, 函数 H 是一个阶跃函数。img, 表示第二层的滤波器个数。

      对于第一层的每个输出矩阵,将其分为 B 块,计算统计每个块的直方图信息,然后在将各个块的直方图特征进行级联,最终得到块扩展直方图特征:

      img

      在进行直方图分块时同样可以采用重叠分块和非重叠分块模式,需要视情况而定。实验表明非重叠分块适用于人脸识别,重叠分块模式使用于手写数字识别、文本识别、目标识别等等。此外直方图特征还为 PCANet 提取到的特征添加了一些变换上的稳定性(例如尺度不变形)。

Powered by Hexo and Hexo-theme-hiker

Copyright © 2019 - 2024 My Wonderland All Rights Reserved.

UV : | PV :