インテル® C++ コンパイラー 17.0 デベロッパー・ガイドおよびリファレンス

access_by

メモリーレイアウトへのアクセス方法を制御する列挙型です。
#include <sdlt/access_by.h>

構文

enum access_by
{
    access_by_struct,
    access_by_stride
};

説明

access_by_struct は、構造体メンバーアクセスを介してデータにアクセスします。 入れ子の構造体は、入れ子構造に従って構造体メンバーにアクセスします。 例えば、2 つの Point3d オブジェクト (とデータメンバー x、y、z) を含む軸平行バウンディング・ボックス (AABB) は、次のように論理的に展開されます。

AABB local;
local = accessor.mData[i];

access_by_stride は、プリミティブのサイズを考慮したストライドで、ビルトイン型へのポインターを介してデータにアクセスします。 2 つの Point3d オブジェクト (とデータメンバー x、y、z) を含む軸平行バウンディング・ボックス (AABB) は、次のように論理的に展開されます。

AABB local;
local.topLeft.x = *(accessor.mData + offsetof(AABB,topLeft) + offset(Point3d,x) + (sizeof(AABB)*i));
local.topLeft.y = *(accessor.mData + offsetof(AABB,topLeft) + offset(Point3d,y) + (sizeof(AABB)*i));
local.topLeft.z = *(accessor.mData + offsetof(AABB,topLeft) + offset(Point3d,z) + (sizeof(AABB)*i));
local.topRight.x = *(accessor.mData + offsetof(AABB,topRight) + offset(Point3d,x) + (sizeof(AABB)*i));
local.topRight.y = *(accessor.mData + offsetof(AABB,topRight) + offset(Point3d,y) + (sizeof(AABB)*i));
local.topRight.z = *(accessor.mData + offsetof(AABB,topRight) + offset(Point3d,z) + (sizeof(AABB)*i));

ベクトル化の際に、コンパイラーは幅の広いロードを実行し、シャッフル/挿入命令を使用してデータを SIMD レジスターに移動できるため、access_by_struc はより良いコードを生成できることがあります。 ただし、プリミティブの複雑さによっては、特にプリミティブに入れ子の構造が含まれる場合など、ベクトル化に失敗することがあります。

一方、access_by_stride は、配列ポインターとストライドによる単純なデータアクセスのため、常にベクトル化されます。 コンパイラーは、複雑さではなく、配列ポインターによるストライドアクセスのみを認識するため、どのような複雑さのプリミティブにも対応できます。

access_by_struct のほうが、特に SIMD ループ以外でより良いコードを生成できる可能性があるため、最適な選択肢と言えるでしょう。 ただし、ベクトル化で問題が生じた場合は、access_by_stride により問題が軽減されるかどうか試してみると良いでしょう。

どちらを選択するかは開発者次第ですが、明示的に選択する必要があります。