インテル® Fortran コンパイラー 18.0 デベロッパー・ガイドおよびリファレンス

シングルバイトとマルチバイトの文字セットの理解 (Windows*)

ASCII 文字セットは、0 ~ 127 の文字と、128 ~ 255 の拡張セットを定義しています。ヨーロッパ言語を含むいくつかの代替シングルバイト文字セットは、0 ~ 127 の文字には ASCII と同じ文字を定義し、128 ~ 255 の文字には ASCII とは異なる文字を定義しています。この拡張を利用すれば、8 ビットの表現で、ほとんどのヨーロッパ言語に必要な文字を十分に定義することができます。しかし、日本語の漢字などの一部の言語では、1 バイトですべての文字を定義することができません。これらの言語では、マルチバイト・コーディングが必要となります。

マルチバイト文字セットは、シングルバイトとダブルバイトの両方の文字から構成されています。マルチバイト文字列には、シングルバイト文字とダブルバイト文字の混在したものを含めることができます。2 バイト文字はリード (先頭) バイトとトレール (続く) バイトで構成されます。一部のマルチバイト文字セットでは、リードバイトとトレールバイトが重複することがあるため、それがリードバイトなのかトレールバイトなのかを文脈から判断する必要があります。