论文学习1-PCANet.A Simple Deep Learning Baseline for Image Classification

2022-09-23 PCANet PV:

结构

PCANet结构

在每张图片中选取patch，对patch去除均值。
对这个图片中的patch，进行PCA滤波。
同样再进行一轮PCA滤波。
输出层：对第二层得到图像进行二值化哈希编码，编码位数与第二层的滤波器个数相同。

公式为：

　

　　把原来的图像映射成，0-255，此处一般设置成 8, 函数 H 是一个阶跃函数。, 表示第二层的滤波器个数。

　　对于第一层的每个输出矩阵，将其分为 B 块，计算统计每个块的直方图信息，然后在将各个块的直方图特征进行级联，最终得到块扩展直方图特征：

　　

　　在进行直方图分块时同样可以采用重叠分块和非重叠分块模式，需要视情况而定。实验表明非重叠分块适用于人脸识别，重叠分块模式使用于手写数字识别、文本识别、目标识别等等。此外直方图特征还为 PCANet 提取到的特征添加了一些变换上的稳定性（例如尺度不变形）。