インテル® DAAL 2018 デベロッパー・ガイド
フォワード 3 次元最大プーリング層は、入力テンソル X ∈ Rn1 x n2 x ... x np の非線形ダウンサンプリング形式です。3 次元最大プーリングは、次元 k1、k2、および k3 で入力テンソルデータを 3 次元サブテンソルに分割して、各サブテンソルの最大の数値を含む要素を選択し、最大の要素で各サブテンソルを置換して入力テンソルを出力テンソルに変換します。詳細は、「フォワード 3 次元最大プーリング層」を参照してください。
バックワード 3 次元最大プーリング層は、前の層で計算された入力勾配 G ∈ Rl1 x ... x lp を後方へ伝播します。バックワード層は、フォワード計算ステップのサブテンソルからポーリングされた最大値に対応する勾配の要素のみ次の層に伝播します。
以下の項目を指定します。
前の層で計算された勾配を含む p 次元のテンソル G ∈ Rl1 x ... x lp
カーネルを適用する次元 k1、k2、および k3
カーネルサイズ m1、m2、および m3: ここで p1、p2、および p3 はパディング
次のような値テンソル Z = (zi1...ip) ∈ Rn1 x ... x np を計算します。
s1、s2、および s3 はストライド
m1 > s1、m2 > s2、または m3 > s3 (これらの条件が同時に満たされる場合を含む) でオーバーラップしているサブテンソルが入力テンソル X の同じ位置にある同じ最大値で表される場合、この位置の勾配値 z はそれぞれの位置の入力勾配 g の合計です。この動作は 2 次元最大プーリングの動作に似ています。そのため、図は「バックワード 2 次元最大プーリング層」を参照してください。