インテル® DAAL 2018 デベロッパー・ガイド
ピラミッドの高さが L ∈ N のフォワード 2 次元空間ピラミッドプーリング層は、入力テンソル X の非線形ダウンサンプリング形式です。ライブラリーは、4 次元の入力テンソル X ∈ Rn1 x n2 x n3 x n4 をサポートします。2 次元空間ピラミッドプーリングは、次元 k1 および k2 で入力テンソルデータを (2l)2 サブテンソル/ビン、l ∈ {0, ..., L-1} に分割して、各サブテンソルの結果を計算します。計算は、選択したプーリング手法 (最大、平均、または確率的) に応じて行われます。空間ピラミッドプーリング層は、異なるカーネルサイズ、ストライド、およびパディングで、プーリングを L 回適用します。
ライブラリーは、複数の空間ピラミッドプーリング層を提供します。
空間ピラミッド最大プーリング
空間ピラミッド平均プーリング
空間ピラミッド確率的プーリング
次の説明は、上記の各層に適用されます。
X ∈ Rn1 x n2 x n3 x n4 を入力データのテンソル、k1 および k2 をカーネルを適用する次元とします。一般性を失うことなく、k1 および k2 がテンソル X の最後の 2 つの次元であるとします。各レベル l ∈ {0, ..., L-1} およびビン数 b = 2l について、層は次のパラメーターで 2 次元プーリングを適用します。
カーネルサイズ
ストライド si = mi
パディング
次元 n' に沿って平らなレイアウトでは、層の結果は 2 次元のテンソル Y ∈ Rn1 x n' で表されます。ここで、。
次の図は、ピラミッドの高さが L = 2 のフォワード空間ピラミッド最大プーリング層の動作を示しています。