结构
在每张图片中选取patch,对patch去除均值。
对这个图片中的patch,进行PCA滤波。
同样再进行一轮PCA滤波。
输出层:对第二层得到图像进行二值化哈希编码,编码位数与第二层的滤波器个数相同。
公式为:
把原来的图像映射成,0-255,此处一般设置成 8, 函数 H 是一个阶跃函数。, 表示第二层的滤波器个数。
对于第一层的每个输出矩阵,将其分为 B 块,计算统计每个块的直方图信息,然后在将各个块的直方图特征进行级联,最终得到块扩展直方图特征:
在进行直方图分块时同样可以采用重叠分块和非重叠分块模式,需要视情况而定。实验表明非重叠分块适用于人脸识别,重叠分块模式使用于手写数字识别、文本识别、目标识别等等。此外直方图特征还为 PCANet 提取到的特征添加了一些变换上的稳定性(例如尺度不变形)。