Windowsで使われる文字コード一覧とその用途まとめ

文字化けやファイルの互換性トラブルの原因としてよく挙がる「文字コード」。

特にWindowsでは、独自の文字コード体系が使われています。

文字コードでよくある困りごと

CSVファイルを開くと日本語が文字化けする
ウェブサイトからダウンロードしたファイルが読めない
メール添付ファイルの文字が正しく表示されない
プログラムで作成したファイルが他の環境で開けない

これらの問題は、文字コードの不一致が原因となることが大半です。しかし、文字コードの基本を理解することで、これらのトラブルを予防・解決できます。

この記事で身につく知識

Windows環境で使われる主要な文字コードの特徴
文字コードの確認と変換方法
文字化け問題の診断と解決手順

文字コードの基本概念

文字コードとは何か

文字コードの定義

文字コードとは、コンピューターが文字を数値で表現するための約束事（規則）です。
同じ文字でも、異なる文字コードでは異なる数値で表現されます。

なぜ複数の文字コードが存在するのか

歴史的経緯：各国・地域で独自に発展
技術的制約：メモリ容量や処理速度の限界
用途の違い：メール、ウェブ、OS、プログラミングなど
互換性の確保：既存システムとの連携

文字化けが起こる仕組み

ファイルをAという文字コードで作成
別のアプリケーションがBという文字コードで読み込み
数値の解釈が違うため、意図しない文字が表示される

Windows文字コードの歴史

発展の経緯

1980年代：ASCII中心の時代
1990年代：Shift_JISの普及
2000年代：Unicodeの登場
2010年代以降：UTF-8の標準化

現在の状況 Windows 10/11では、従来のShift_JISに加えて、UTF-8サポートが大幅に強化されています。

Windowsで使われる主要文字コード詳細解説

Shift_JIS（CP932）

基本情報

正式名称：Shift Japanese Industrial Standards
コードページ：CP932（Windows-31J）
開発：Microsoft（IBM Shift_JISの拡張）

特徴と仕組み

可変長文字コード（1バイトまたは2バイト）
ASCII文字：1バイト（0x00-0x7F）
日本語文字：2バイト（0x81-0x9F, 0xE0-0xFC）
半角カナ：1バイト（0xA1-0xDF）

用途と利用場面

日本語Windowsの標準文字コード
古い日本語アプリケーション
CSVファイル（Excel標準）
レガシーシステム

メリット・デメリット

メリット：

Windows環境での高い互換性
既存システムとの親和性
ファイルサイズが比較的小さい

デメリット：

日本語専用で国際化に不向き
「表」「能」などの特定文字で問題発生（ダメ文字問題）
クロスプラットフォーム対応が困難

UTF-8

基本情報

正式名称：8-bit Unicode Transformation Format
コードページ：CP65001
開発：Unicode Consortium

特徴と仕組み

可変長文字コード（1-4バイト）
ASCII互換：英数字は1バイト
日本語：通常3バイト
世界中のすべての文字を表現可能

BOMの有無

BOM付きUTF-8：ファイル先頭にEF BB BFを配置
BOMなしUTF-8：BOMを含まない純粋なUTF-8

用途と利用場面

ウェブページ（HTML、CSS、JavaScript）
プログラムソースコード
現代的なアプリケーション
クロスプラットフォーム環境

メリット・デメリット

メリット：

世界標準で高い互換性
ASCII完全互換
国際化対応が容易
将来性が高い

デメリット：

日本語文字がShift_JISより大きい
古いアプリケーションで対応不十分
BOMの有無で互換性問題

UTF-16（Unicode）

基本情報

正式名称：16-bit Unicode Transformation Format
コードページ：1200（LE）、1201（BE）
エンディアン：Little Endian（LE）、Big Endian（BE）

特徴と仕組み

基本的に2バイト、一部4バイト
BOM（Byte Order Mark）で順序を判定
WindowsはLittle Endianが標準

用途と利用場面

Windows内部処理（Win32 API）
Microsoft Office文書
.NETアプリケーション
レジストリ

EUC-JP

基本情報

正式名称：Extended Unix Code for Japanese
開発：AT&T（Unix系システム用）

特徴と仕組み

可変長文字コード（1-3バイト）
Unix/Linux系で広く使用
Windows標準では対応していない

用途と利用場面

Unix/Linuxサーバー
古いウェブシステム
サーバー間データ交換

ISO-2022-JP

基本情報

正式名称：Japanese Character Encoding for Internet Messages
別名：JIS、JISコード

特徴と仕組み

エスケープシーケンスで文字セットを切り替え
7ビット環境での日本語表現
電子メール用に設計

用途と利用場面

電子メール（古い形式）
ニュースグループ
一部のレガシーシステム

ASCII

基本情報

正式名称：American Standard Code for Information Interchange
コードページ：20127

特徴と仕組み

7ビット文字コード（128文字）
英数字、記号、制御文字
すべての文字コードの基礎

用途と利用場面

プログラミング言語
設定ファイル
ログファイル
システム間通信

文字コードの確認と変換方法

Windows標準ツールでの確認・変換

メモ帳を使った方法

確認手順

ファイルをメモ帳で開く
文字化けの有無で現在の文字コードを推測
「名前を付けて保存」で「エンコード」を確認

変換手順

ファイルをメモ帳で開く
「名前を付けて保存」をクリック
「エンコード」ドロップダウンから選択：
- ANSI（システム既定 = Shift_JIS）
- UTF-8（BOM付き）
- UTF-8（BOMなし）※Windows 11で対応
- Unicode（UTF-16 LE）
- Unicode big endian（UTF-16 BE）

PowerShellを使った高度な方法

文字コード確認コマンド

# ファイルのBOMを確認
Get-Content -Path "sample.txt" -TotalCount 1 -Encoding Byte

変換コマンド例

# Shift_JISからUTF-8への変換
Get-Content -Path "input.txt" -Encoding Default | 
Set-Content -Path "output.txt" -Encoding UTF8

# UTF-8からShift_JISへの変換
Get-Content -Path "input.txt" -Encoding UTF8 | 
Set-Content -Path "output.txt" -Encoding Default

一括変換スクリプト

# フォルダ内のすべてのtxtファイルをUTF-8に変換
Get-ChildItem "*.txt" | ForEach-Object {
    $content = Get-Content $_.FullName -Encoding Default
    Set-Content -Path $_.FullName -Value $content -Encoding UTF8
}

サードパーティツールの活用

文字コード検出・変換ツール

Notepad++

高精度な文字コード自動検出
豊富な文字コード対応
一括変換機能

EmEditor

日本語環境に最適化
大容量ファイル対応
マクロによる自動化

コマンドラインツール

iconv（Windows Subsystem for Linux）

# Shift_JISからUTF-8への変換
iconv -f SHIFT_JIS -t UTF-8 input.txt > output.txt

nkf（Network Kanji Filter）

# Shift_JISからUTF-8への変換
nkf -w input.txt > output.txt

文字化け問題の診断と解決

一般的な文字化けパターンと原因

パターン1：日本語が「？」や「□」になる

原因：文字コードが全く対応していない
解決法：適切な文字コードで再度開く

パターン2：「縺昴≧」のような文字になる

原因：UTF-8をShift_JISで読んでいる
解決法：UTF-8として開き直す

パターン3：「そう」が「そう」になる

原因：Shift_JISをUTF-8で読んでいる
解決法：Shift_JISとして開き直す

パターン4：「・ｽ・ｽ・ｽ」のような文字

原因：EUC-JPをShift_JISで読んでいる
解決法：EUC-JP対応ツールを使用

段階的な問題解決手順

ステップ1：問題の特定

文字化けしている文字の種類を確認
ファイルの作成元・送信元を確認
使用しているアプリケーションを確認

ステップ2：文字コードの推測

ファイルサイズから推測（日本語の場合）
- Shift_JIS：約2バイト/文字
- UTF-8：約3バイト/文字
- UTF-16：約2-4バイト/文字
BOMの有無を確認
作成環境を考慮（Windows/Mac/Linux）

ステップ3：変換と確認

推測した文字コードで開く
正しく表示されるかテスト
必要に応じて変換・保存

よくある問題シーンでの対処法

CSV文字化け問題

Excel標準：Shift_JIS（CP932）
Google Sheets：UTF-8 対処法：

Excelで開く前にUTF-8からShift_JISに変換
「データ」→「テキストから列へ」で文字コード指定

メール添付ファイル問題 古いメールソフト：ISO-2022-JP 現代のメールソフト：UTF-8 対処法：

送信者に文字コード確認
複数の文字コードで試行

ウェブからのダウンロードファイル ウェブサイト：通常UTF-8 対処法：

ブラウザの文字コード設定確認
ダウンロード後に文字コード変換

業務での実践的な使い分け

用途別推奨文字コード

一般的なビジネス文書

推奨：UTF-8（BOMなし）
理由：将来性、互換性、国際化対応

Excel用CSVファイル

推奨：Shift_JIS（CP932）
理由：Excel標準、日本語Windowsとの親和性

プログラムソースコード

推奨：UTF-8（BOMなし）
理由：開発ツール標準、Git互換性

システム間データ交換

推奨：UTF-8（BOMなし）
理由：クロスプラットフォーム、API標準

古いシステムとの連携

推奨：Shift_JIS（CP932）
理由：レガシーシステム互換性

文字コード選択の判断基準

技術的要因

対象システムの対応状況
ファイルサイズの制約
処理速度の要求

業務的要因

関係者のスキルレベル
既存データとの互換性
将来の拡張性

組織的要因

社内標準の有無
取引先との取り決め
セキュリティポリシー

トラブル予防とベストプラクティス

文字コード管理の基本ルール

ファイル作成時の注意点

用途に応じた文字コードを意識的に選択
ファイル名に文字コード情報を含める（例：data_utf8.csv）
README等でドキュメント化

チーム作業での統一

プロジェクト開始時に文字コード標準を決定
使用ツールの文字コード設定を統一
定期的な設定確認とメンテナンス

データ交換時の配慮

送信前に受信側の環境を確認
文字コード情報を明記
変換ツールの使用方法を共有

開発環境での設定最適化

Visual Studio Code

{
    "files.encoding": "utf8",
    "files.autoGuessEncoding": true
}

Git設定

git config --global core.autocrlf false
git config --global core.safecrlf true

PowerShell設定

# UTF-8を既定に設定（PowerShell 6以降）
$PSDefaultParameterValues['*:Encoding'] = 'utf8'

技術動向

Windows 11での変更点

UTF-8サポート強化

システム既定ロケールでUTF-8を選択可能
従来のShift_JIS依存からの脱却
アプリケーション互換性の向上

設定方法

「設定」→「時刻と言語」→「言語と地域」
「管理用の言語設定」
「システムロケール」で「UTF-8」を選択

まとめ：効果的な文字コード運用

重要ポイントの復習

基本知識

Shift_JIS：日本語Windows標準、レガシー互換性
UTF-8：世界標準、将来性、クロスプラットフォーム
UTF-16：Windows内部、Office文書

実践的スキル

メモ帳・PowerShellでの確認・変換
文字化けパターンの診断
業務用途での適切な選択

トラブル対応

段階的な問題解決アプローチ
予防策とベストプラクティス
チーム・組織での標準化

文字コードの基本概念

文字コードとは何か

Windows文字コードの歴史

Windowsで使われる主要文字コード詳細解説

Shift_JIS（CP932）

UTF-8

UTF-16（Unicode）

EUC-JP

ISO-2022-JP

ASCII

文字コードの確認と変換方法

Windows標準ツールでの確認・変換

確認手順

変換手順

PowerShellを使った高度な方法

サードパーティツールの活用

文字化け問題の診断と解決

一般的な文字化けパターンと原因

段階的な問題解決手順

よくある問題シーンでの対処法

業務での実践的な使い分け

用途別推奨文字コード

文字コード選択の判断基準

トラブル予防とベストプラクティス

文字コード管理の基本ルール

開発環境での設定最適化

技術動向

Windows 11での変更点

まとめ：効果的な文字コード運用

重要ポイントの復習

Youtube

カテゴリー別人気記事