記事インデックス

このページでは、漢字コードに関する説明をします。

文字が小さくて見づらいときには、上部の「フォントサイズ」の「大きく」をクリックすると、文字が大きくなります。

 


はじめに

1バイトの文字コードである ASCII だけで事が足りる英語(米語?)と違い、「漢字・かな・カタカナ (特に大量の文字がある漢字)」を扱う日本語は、1バイトで表現できる最大の数である256種類では全くコードが足りな いために、マルチバイト文字として文字コードを扱う必要があります。そして、日本語の文字コード形式は、JIS、いわゆるシフト JIS、EUC およびホストコンピューター等で使われている各メーカー固有コードなどが存在し、メーカーや OS が異なるコンピュータ間でデータ等を交換するためには各々の文字コードを変換しなければなりません。

このページは、後輩が漢字コードの変換をする必要に迫られて、わたしのところに相談にきた際に、それぞれの文字コード、そしてその文字コード間の関係がどのようになっているのかを説明するための資料として作成を始めたものです。そのため、必ずしも厳密でない説明をしているところもあったりします。この資料はあくまで取っ掛かりとして読み、概要の理解ができたところで、規格書や更に詳しい説明がしてある資料を読むようにしてください。

なお、ページの最後にこのページを記述する際に参考にした資料の一覧を「参考文献」として掲載しています。