Windowsで文字コードを確認する方法｜ファイルの文字化けを防ぐコツも解説

テキストファイルを開いたときに、文字が「？？？」や意味不明な記号になってしまった経験はありませんか？

これはほとんどの場合、文字コード（文字を数字に置き換えるルール）が原因です。

WindowsではShift-JISやUTF-8など複数の文字コードが使われるため、確認や変更が必要になることがあります。

この記事では、Windowsでファイルの文字コードをかんたんに確認する方法や、文字化けを防ぐコツをわかりやすく紹介します。

文字コードとは？基本を理解しよう

文字コードの基本概念

文字コードとは

文字コード（Character Encoding） 文字や記号をコンピューター上で数字として扱うためのルールのことです。コンピューターは0と1の数字しか理解できないので、文字を数字に置き換える必要があります。

身近な例で理解する

暗号に例えると

「A=1、B=2、C=3」というルール
「HELLO」を「8-5-12-12-15」として保存
同じルールを知っていれば正しく読める
違うルールで読むと意味不明になる

言語の翻訳に例えると

日本語の「こんにちは」
英語では「Hello」
中国語では「你好」
同じ意味でも表現方法が違う

なぜ複数の文字コードが存在するの？

歴史的な背景

1960年代：アメリカでASCII（英語のみ）が開発
1980年代：各国が自国語対応の文字コードを開発
日本：Shift-JIS、EUC-JP
中国：GB2312、Big5
韓国：EUC-KR

現在の状況

インターネット普及でUTF-8が世界標準に
古いシステムでは旧来の文字コードが残存
混在により文字化け問題が発生

主要な文字コードの種類

Shift-JIS（シフトJIS）

特徴

Windows日本語版で長年使用されてきた標準
日本語（ひらがな、カタカナ、漢字）に特化
1バイト文字と2バイト文字の組み合わせ

使用場面

従来のWindowsアプリケーション：
- メモ帳（従来）
- Excel（古いバージョン）
- 業務システム（レガシー）

ファイル形式：
- CSV（古い形式）
- テキストファイル（従来）

メリット・デメリット

メリット：
- 日本語の表示効率が良い
- 古いシステムとの互換性

デメリット：
- 日本語以外の文字に制限
- 文字化けリスクが高い

UTF-8（Unicode）

特徴

世界中の文字を1つの体系で表現
インターネット標準
可変長文字コード（1〜4バイト）

使用場面

Webサイト：
- HTML、CSS、JavaScript
- サーバーサイドプログラム
- API通信

プログラミング：
- ソースコードファイル
- 設定ファイル
- ログファイル

メリット・デメリット

メリット：
- 世界中の文字に対応
- 文字化けリスクが低い
- 将来性がある

デメリット：
- 日本語の場合、ファイルサイズがやや大きい
- 古いシステムとの互換性問題

UTF-16

特徴

Unicodeの別の表現方法
Windows内部処理で使用
固定長2バイト（一部4バイト）

使用場面

Windows内部：
- レジストリ
- Windows API
- .NETアプリケーション

その他の文字コード

EUC-JP

Unix/Linux系で使用
現在は使用頻度低下

ISO-2022-JP

日本語メールで使用
7bitエンコーディング

Windowsで文字コードを確認する方法

メモ帳（Notepad）での確認

基本的な確認手順

ステップ1：ファイルを開く

メモ帳を起動
「ファイル」→「開く」
対象ファイルを選択
文字化けしている場合は「エンコード」を変更して再試行

ステップ2：エンコードの確認

「ファイル」→「名前を付けて保存」をクリック
保存ダイアログが開く
下部の「エンコード」項目を確認
現在の文字コードが表示される

メモ帳で表示される文字コード名

表示される項目

ANSI → Shift-JIS（日本語Windows）
UTF-8 → UTF-8（BOMなし）
UTF-8 BOM付き → UTF-8（BOMあり）
Unicode → UTF-16（Little Endian）
Unicode Big Endian → UTF-16（Big Endian）

文字化けしている場合の対処

エンコードを変更して開き直し

メモ帳でファイル→開く
ファイルを選択（まだ開かない）
「エンコード」を「自動選択」以外に変更
「開く」をクリック
正しく表示されるまで別のエンコードを試す

高機能テキストエディタでの確認

サクラエディタでの確認

インストールと基本操作

公式サイトからサクラエディタをダウンロード
インストール後、ファイルを開く
ステータスバー（画面下部）を確認
文字コードが自動表示される

表示される情報

ステータスバーの表示例：
SJIS → Shift-JIS
UTF-8N → UTF-8（BOMなし）
UTF-8 → UTF-8（BOMあり）
UTF-16LE → UTF-16（Little Endian）

文字コード変換機能

ファイル→文字コード指定保存
希望する文字コードを選択
保存先を指定して保存

秀丸エディタでの確認

文字コードの表示

ファイル情報でエンコードを確認
ステータス行での常時表示
自動判定精度が高い

Visual Studio Codeでの確認

表示方法

VS Codeでファイルを開く
画面右下のステータスバーを確認
文字コードが表示される（例：UTF-8、Shift-JIS）

文字コード変更

ステータスバーの文字コード部分をクリック
「エンコード経由で再度開く」または「エンコード経由で保存」を選択
希望する文字コードを選択

コマンドラインでの確認

PowerShellでの文字コード確認

ファイルの文字コード推定

# ファイルの最初の数バイトを確認（BOM検出）
Get-Content -Path "ファイル名.txt" -Encoding Byte -TotalCount 4

# 結果例：
# 239 187 191 → UTF-8 BOM
# 255 254 → UTF-16 LE BOM
# 254 255 → UTF-16 BE BOM

現在のコンソール文字コード確認

# 現在のコードページ確認
chcp

# 結果例：
# Active code page: 65001 → UTF-8
# Active code page: 932 → Shift-JIS

コマンドプロンプトでの操作

基本的な確認コマンド

chcp

文字コード変更

chcp 65001    rem UTF-8に変更
chcp 932      rem Shift-JISに変更

ファイル属性での確認

ファイルプロパティでの情報

基本情報の確認

ファイルを右クリック
「プロパティ」を選択
「全般」タブでファイルサイズを確認

サイズからの推測

同じ内容でもUTF-8とShift-JISではサイズが異なる
日本語が多い場合、UTF-8の方が大きくなる傾向

Hexエディタでの詳細確認

バイナリレベルでの確認

HxD、Stirlingなどのバイナリエディタを使用
ファイルの先頭バイトを確認
BOM（Byte Order Mark）の有無を判定

BOMパターン

UTF-8 BOM: EF BB BF
UTF-16 LE BOM: FF FE
UTF-16 BE BOM: FE FF
UTF-32 LE BOM: FF FE 00 00

文字化けの原因と対処法

文字化けが起こる仕組み

基本的なメカニズム

エンコードとデコードの不一致

作成時：UTF-8でエンコード
保存：UTF-8として保存
開く時：Shift-JISとしてデコード
結果：文字化け発生

よくある文字化けパターン

UTF-8 → Shift-JIS誤認識

正：こんにちは
誤：縺薙ｓ縺ｫ縺｡縺ｯ

Shift-JIS → UTF-8誤認識

正：こんにちは
誤：こんにちは（一部文字が欠ける）

文字化けの修復方法

エディタでの修復

ステップ1：正しい文字コードで再度開く

ファイルを閉じる
「ファイルを開く」で別の文字コードを指定
正しく表示されるまで試行

ステップ2：正しい文字コードで保存

正しく表示された状態で「名前を付けて保存」
適切な文字コード（通常はUTF-8）を選択
保存実行

プログラムでの一括修復

PowerShellスクリプト例

# Shift-JISファイルをUTF-8に変換
$content = Get-Content -Path "input.txt" -Encoding Default
$content | Out-File -FilePath "output.txt" -Encoding UTF8

予防策と対処法

文字コード統一の重要性

プロジェクト単位での統一

開発チーム内でのルール決め
エディタの設定統一
ファイル保存時の確認習慣

推奨される統一方針

Webプロジェクト：
- HTML、CSS、JavaScript → UTF-8（BOMなし）
- サーバーサイド → UTF-8（BOMなし）

デスクトップアプリ：
- ソースコード → UTF-8（BOMなし）
- 設定ファイル → UTF-8（BOMなし）
- ユーザーデータ → UTF-8（BOMあり可）

エディタの設定

VS Codeの推奨設定

{
  "files.encoding": "utf8",
  "files.autoGuessEncoding": true,
  "files.insertFinalNewline": true
}

サクラエディタの推奨設定

デフォルト文字コード：UTF-8
自動判定：有効
BOM設定：用途に応じて

実用的な活用シーン

Web開発での文字コード管理

HTMLファイルの文字コード指定

HTMLでの宣言

<!DOCTYPE html>
<html lang="ja">
<head>
    <meta charset="UTF-8">
    <title>ページタイトル</title>
</head>

サーバーでの設定

# .htaccess
AddDefaultCharset UTF-8

CSSファイルでの文字コード

CSS内での宣言

@charset "UTF-8";

/* 日本語コメントも安全 */
.example {
    content: "こんにちは";
}

データファイルの管理

CSVファイルの文字コード

Excelでの注意点

Excel（古いバージョン）はShift-JISを期待
UTF-8 BOM付きであればExcelでも開ける
Google SpreadsheetはUTF-8推奨

適切な保存方法

Excel向け：UTF-8 BOM付きまたはShift-JIS
プログラム処理向け：UTF-8 BOMなし
多言語データ：UTF-8 BOMなし

ログファイルの管理

システムログの文字コード

Windows Event Log：UTF-16
Apache/Nginx：UTF-8
アプリケーションログ：設定による

国際化対応

多言語サイトでの考慮事項

文字コードの選択

必ずUTF-8を使用
BOMは基本的に不要
データベースもUTF-8に統一

フォントの考慮

多言語対応フォントの使用
フォールバック設定
表示確認の徹底

トラブルシューティング

よくある問題と解決法

問題1：メモ帳で保存するとファイルサイズが変わる

原因文字コードが変更されている

解決法

確認手順：
1. 保存前の文字コードを確認
2. 「名前を付けて保存」で同じ文字コードを選択
3. ファイルサイズの変化を確認

問題2：コマンドプロンプトで日本語が文字化け

原因コンソールの文字コード設定

解決法

# UTF-8に変更
chcp 65001

# フォントも変更（コンソールプロパティから）
フォント → MS Gothic または Consolas

問題3：Webブラウザで文字化け

原因

HTML内の文字コード宣言不備
サーバーの文字コード設定不備

解決法

<!-- HTMLに正しく宣言 -->
<meta charset="UTF-8">

# サーバー設定
AddDefaultCharset UTF-8

高度なトラブル対応

文字コード自動判定の限界

判定が困難なケース

ASCII範囲内のみの文字
短いテキスト
複数の文字コードで有効な文字列

対処法

ファイル作成時の記録保持
命名規則での文字コード表示
自動変換スクリプトの活用

データベースの文字コード問題

MySQLでの注意点

-- データベース作成時
CREATE DATABASE mydb CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;

-- テーブル作成時
CREATE TABLE mytable (
    id INT,
    content TEXT CHARACTER SET utf8mb4
);

文字化け修復

-- 文字コード確認
SHOW VARIABLES LIKE 'character%';

-- 接続時の文字コード指定
SET NAMES utf8mb4;

まとめ

Windowsでの文字コード確認と管理は、文字化けトラブルを防ぐために欠かせないスキルです。

文字コード確認の方法

メモ帳：最も手軽、保存ダイアログで確認
高機能エディタ：自動判定機能、ステータス表示
コマンドライン：スクリプト処理、BOM確認
専用ツール：バイナリレベルでの詳細確認

文字化け予防のポイント

UTF-8への統一：将来性と互換性を考慮
BOMの適切な選択：用途に応じた使い分け
エディタ設定の統一：チーム開発での一貫性
定期的な確認習慣：問題の早期発見

実用的な活用場面

Web開発でのHTML/CSS管理
データファイル（CSV、ログ）の処理
国際化対応での多言語サポート
システム間でのデータ連携

トラブル対応のコツ

原因の特定：どこで文字化けが発生するか
段階的な対処：ファイル→エディタ→システム
予防的対策：統一ルールの策定と遵守

文字コードとは？基本を理解しよう

文字コードの基本概念

文字コードとは

身近な例で理解する

なぜ複数の文字コードが存在するの？

主要な文字コードの種類

Shift-JIS（シフトJIS）

UTF-8（Unicode）

UTF-16

その他の文字コード

Windowsで文字コードを確認する方法

メモ帳（Notepad）での確認

基本的な確認手順

メモ帳で表示される文字コード名

文字化けしている場合の対処

高機能テキストエディタでの確認

サクラエディタでの確認

秀丸エディタでの確認

Visual Studio Codeでの確認

コマンドラインでの確認

PowerShellでの文字コード確認

コマンドプロンプトでの操作

ファイル属性での確認

ファイルプロパティでの情報

Hexエディタでの詳細確認

文字化けの原因と対処法

文字化けが起こる仕組み

基本的なメカニズム

よくある文字化けパターン

文字化けの修復方法

エディタでの修復

プログラムでの一括修復

予防策と対処法

文字コード統一の重要性

エディタの設定

実用的な活用シーン

Web開発での文字コード管理

HTMLファイルの文字コード指定

CSSファイルでの文字コード

データファイルの管理

CSVファイルの文字コード

ログファイルの管理

国際化対応

多言語サイトでの考慮事項

トラブルシューティング

よくある問題と解決法

問題1：メモ帳で保存するとファイルサイズが変わる

問題2：コマンドプロンプトで日本語が文字化け

問題3：Webブラウザで文字化け

高度なトラブル対応

文字コード自動判定の限界

データベースの文字コード問題

まとめ

Youtube

カテゴリー別人気記事