テキストファイルを扱っていると、「文字コード」という用語は、よく聞くが、そもそも「文字コード」とは、どういう意味なのだろうか?
今回は、文字コードについて紹介したい。
「文字コード」って何?
文字コードは、「メタキャラクタ」とも呼び、英語の「character code」の訳語で、その意味は、以下のとおり。
Character Code
Alternatively referred to as the character set, charset, and character encoding, a character code describes a specific encoding for characters as defined in the code page.
(文字コード (“character set”、”charset”、”character encoding” とも呼ばれる):
文字コードとは、コードページで定義されている、特定の文字エンコーディング (文字符号化=データの他の形式への変換) のことである)引用元: Computer Hope
つまり、文字コードは、文字、アルファベット、記号に割り当てられた2進数のコードこと。つまり、コンピューターが理解できるのは、2進数なので、文字、アルファベット、記号も2進数で表す「文字コード」が必要。
文字コードの種類は?
文字コードの種類は、以下のとおり。
文字コード | 読み方 | 説明 |
ASCII | アスキー | ASCIで定めた7ビットの文字コード体系 |
EBCDIC | エビシディック | IBMが開発した8ビットの文字コード体系 |
JISコード | ジスコード | JISで定めた文字コード体系 |
シフトJISコード | シフトジスコード | JIS漢字コードを変換したもの |
EUC | イーユーシー | 拡張UNIXコード。 |
Unicode | ユニコード | 日本語や中国語に似た文字を同一コードに割り当てた文字コード体系 |
まとめ
いかがでしたでしょうか。今回は、文字コードついて紹介しました。
コメント