【正規表現の基本】文字コードとは、どういう意味?

正規表現
スポンサーリンク

テキストファイルを扱っていると、「文字コード」という用語は、よく聞くが、そもそも「文字コード」とは、どういう意味なのだろうか?

今回は、文字コードについて紹介したい。

「文字コード」って何?

文字コードは、「メタキャラクタ」とも呼び、英語の「character code」の訳語で、その意味は、以下のとおり。

Character Code
Alternatively referred to as the character set, charset, and character encoding, a character code describes a specific encoding for characters as defined in the code page.
(文字コード (“character set”、”charset”、”character encoding” とも呼ばれる):
文字コードとは、コードページで定義されている、特定の文字エンコーディング (文字符号化=データの他の形式への変換) のことである
)

引用元: Computer Hope

つまり、文字コードは、文字、アルファベット、記号に割り当てられた2進のコードこと。つまり、コンピューターが理解できるのは、2進数なので、文字、アルファベット、記号も2進数で表す「文字コード」が必要。

 

文字コードの種類は?

文字コードの種類は、以下のとおり。

文字コード 読み方 説明
ASCII アスキー ASCIで定めた7ビットの文字コード体系
EBCDIC エビシディック IBMが開発した8ビットの文字コード体系
JISコード ジスコード JISで定めた文字コード体系
シフトJISコード シフトジスコード JIS漢字コードを変換したもの
EUC イーユーシー 拡張UNIXコード。
Unicode ユニコード 日本語や中国語に似た文字を同一コードに割り当てた文字コード体系

まとめ

いかがでしたでしょうか。今回は、文字コードついて紹介しました。

コメント

タイトルとURLをコピーしました