CentOSターミナルの文字コード完全ガイド｜文字化けを解決しよう

CentOSのターミナルで作業していて、日本語が変な記号に化けていたり、ファイルの内容が読めなかったりした経験はありませんか？

それは「文字コード」の設定が合っていないことが原因です。

文字コードって難しそうに聞こえますが、きちんと理解すれば誰でも対処できます。この記事では、CentOSのターミナルにおける文字コードの基本から、設定方法、トラブル解決まで分かりやすく解説していきます。

文字化けから解放されて、快適なサーバー管理を実現しましょう！

文字コードって何？基礎知識から理解しよう
CentOSの文字コード設定を確認する
1. 現在の設定を調べる方法
文字コードを変更する方法
1. 一時的に変更する（セッション中のみ）
2. 恒久的に変更する（ログイン時に自動設定）
文字化けしたファイルを正しく表示する
viエディタでの文字コード設定
1. vi（vim）で開くときの文字コード指定
2. viで編集中に文字コードを変更
よくあるトラブルと解決法
スクリプトでの文字コード対処
1. シェルスクリプトの先頭に記述する
2. スクリプト内でファイル変換を自動化
文字コードに関するベストプラクティス
1. 統一が基本
2. ドキュメント化する
よくある質問
まとめ：文字コードを制して快適なCentOS環境を

文字コードって何？基礎知識から理解しよう

コンピュータが文字を扱う仕組み

コンピュータは本来、数字しか理解できません。

「あ」という文字を表示するためには、「この数字は『あ』として表示しよう」というルールが必要なんです。このルールのことを「文字コード」と呼びます。

主な文字コードの種類

UTF-8（ユーティーエフエイト）

世界中のあらゆる言語を扱える、現在最も普及している文字コードです。

英語、日本語、中国語、絵文字まで、1つの文字コードですべて表現できます。CentOSでも標準的に使われていますね。

EUC-JP（イーユーシージェーピー）

日本語を扱うために作られた文字コードの一つ。

以前はLinuxシステムでよく使われていましたが、最近ではUTF-8に移行が進んでいます。

Shift_JIS（シフトジス）

Windowsで長年使われてきた日本語用の文字コード。

WindowsとLinuxの間でファイルをやり取りするときに、この違いが原因で文字化けすることがあります。

なぜ文字化けが起こるの？

ファイルが「UTF-8」で書かれているのに、ターミナルが「EUC-JP」で読もうとすると、文字化けが発生します。

例えるなら、英語で書かれた本をフランス語の辞書で訳そうとするようなもの。正しく読めるはずがありませんよね。

CentOSの文字コード設定を確認する

現在の設定を調べる方法

localeコマンドで確認

ターミナルで以下のコマンドを入力してみましょう。

locale

すると、こんな感じの情報が表示されます。

LANG=ja_JP.UTF-8
LC_CTYPE="ja_JP.UTF-8"
LC_NUMERIC="ja_JP.UTF-8"
LC_TIME="ja_JP.UTF-8"
（以下省略）

この「LANG」の部分が、現在のターミナルで使われている文字コードです。

各項目の意味を知ろう

LANG：全体的な言語設定
LC_CTYPE：文字の分類方法
LC_NUMERIC：数値の表示形式
LC_TIME：日付や時刻の表示形式
LC_MESSAGES：システムメッセージの言語

通常は、これらすべてが同じ設定になっていることが多いですね。

環境変数を直接確認する

もっとシンプルに確認したい場合は、こちらのコマンドを使います。

echo $LANG

現在設定されている言語と文字コードがすぐに表示されますよ。

文字コードを変更する方法

一時的に変更する（セッション中のみ）

今使っているターミナルだけで文字コードを変えたい場合の方法です。

UTF-8に変更する場合

export LANG=ja_JP.UTF-8

EUC-JPに変更する場合

export LANG=ja_JP.eucJP

英語環境（UTF-8）に変更する場合

export LANG=en_US.UTF-8

この方法は、ターミナルを閉じたり、ログアウトしたりすると元に戻ります。

恒久的に変更する（ログイン時に自動設定）

毎回設定するのは面倒なので、永続的に変更しましょう。

ユーザー個別に設定する方法

ホームディレクトリにある「.bash_profile」または「.bashrc」ファイルに追記します。

vi ~/.bash_profile

ファイルの最後に以下を追加します。

export LANG=ja_JP.UTF-8

保存して閉じたら、設定を反映させます。

source ~/.bash_profile

システム全体で設定する方法（CentOS 7以降）

管理者権限で、システム全体の設定を変更できます。

sudo localectl set-locale LANG=ja_JP.UTF-8

設定を確認するには、こちらのコマンド。

localectl status

再ログインすると、新しい設定が有効になります。

CentOS 6以前の場合

システム設定ファイルを直接編集します。

sudo vi /etc/sysconfig/i18n

以下の内容を記述します。

LANG="ja_JP.UTF-8"

保存後、再ログインで設定が反映されますよ。

文字化けしたファイルを正しく表示する

ファイルの文字コードを確認する

まず、ファイルがどの文字コードで書かれているか調べましょう。

fileコマンドを使う

file -i ファイル名

例えば、こんな結果が表示されます。

test.txt: text/plain; charset=utf-8

この「charset=」の後ろが、ファイルの文字コードです。

nkfコマンドを使う

より詳細に調べたい場合は、nkfコマンドが便利。

まずインストールします。

sudo yum install nkf

文字コードを確認します。

nkf -g ファイル名

文字化けファイルを読む方法

iconv（アイコンヴ）コマンドで変換表示

ファイル自体は変更せず、画面表示だけ変換する方法です。

iconv -f EUC-JP -t UTF-8 ファイル名

「-f」は変換元（from）、「-t」は変換先（to）を指定します。

nkfコマンドで変換表示

nkf -w ファイル名

オプションの意味：

-w：UTF-8で出力
-e：EUC-JPで出力
-s：Shift_JISで出力

ファイルの文字コードを変換して保存

iconvで変換して保存

iconv -f EUC-JP -t UTF-8 元ファイル名 > 新ファイル名

元のファイルを直接書き換えたい場合は、少し工夫が必要です。

iconv -f EUC-JP -t UTF-8 ファイル名 -o ファイル名.tmp
mv ファイル名.tmp ファイル名

nkfで変換して保存

nkfは上書き保存が簡単にできます。

nkf -w --overwrite ファイル名

これでファイルがUTF-8に変換されて保存されますよ。

viエディタでの文字コード設定

vi（vim）で開くときの文字コード指定

特定の文字コードでファイルを開く

vi -c "e ++enc=euc-jp" ファイル名

「++enc=」の後ろに文字コードを指定します。

vimの設定ファイルで指定する

毎回コマンドを打つのが面倒なら、設定ファイルに書いておきましょう。

vi ~/.vimrc

以下を追加します。

set encoding=utf-8
set fileencodings=utf-8,euc-jp,sjis,cp932

「fileencodings」には、自動判別する文字コードを順番に並べます。

viで編集中に文字コードを変更

現在の文字コードを確認

viで開いている状態で、コマンドモードに入って以下を入力。

:set fileencoding?

現在の文字コードが表示されます。

文字コードを変更して保存

:set fileencoding=utf-8
:wq

これで、UTF-8として保存されますよ。

よくあるトラブルと解決法

日本語が「?」や「■」で表示される

原因：ターミナルソフトの設定

CentOSの設定は正しくても、接続しているターミナルソフト（TeraTermやPuTTYなど）の文字コード設定が違う可能性があります。

解決法：ターミナルソフトの文字コードを確認

TeraTerm：設定 → 端末 → 文字コード、を「UTF-8」に変更
PuTTY：Window → Translation → Received data、を「UTF-8」に設定

「ロケールを設定できません」というエラー

原因：指定したロケールがインストールされていない

システムに該当する言語パッケージが入っていないことが原因です。

解決法：必要なロケールをインストール

CentOS 7以降の場合：

sudo yum install glibc-langpack-ja

インストール可能なロケール一覧を確認：

locale -a

SSH接続すると文字化けする

原因：ローカルとリモートの文字コード不一致

接続元のパソコンと、CentOSサーバーの文字コード設定が違う場合があります。

解決法：SSH接続時に文字コードを指定

.ssh/configファイルに以下を追記します。

Host *
    SendEnv LANG LC_*

または、接続時に環境変数を指定します。

ssh -o SendEnv=LANG ユーザー名@サーバーアドレス

スクリプトでの文字コード対処

シェルスクリプトの先頭に記述する

スクリプトファイルの最初に、文字コードを明示しておくと安心です。

#!/bin/bash
# -*- coding: utf-8 -*-

export LANG=ja_JP.UTF-8

これで、スクリプト実行時の文字コードが固定されます。

スクリプト内でファイル変換を自動化

複数のファイルを一括変換したい場合のスクリプト例です。

#!/bin/bash

for file in *.txt
do
    nkf -w --overwrite "$file"
    echo "$file を UTF-8 に変換しました"
done

このスクリプトを実行すると、すべての.txtファイルがUTF-8に変換されます。

文字コードに関するベストプラクティス

統一が基本

新規ファイルは常にUTF-8で作成

特別な理由がない限り、UTF-8を使うのが現代の標準です。

他のシステムとのやり取りもスムーズになりますよ。

既存システムの文字コードを確認してから作業

古いシステムを扱う場合は、まず現在の文字コードを確認しましょう。

いきなり変更すると、既存のデータが壊れる可能性があります。

ドキュメント化する

プロジェクトで使用する文字コードを明記

README.mdなどに、「このプロジェクトではUTF-8を使用」と書いておくと、チームメンバーが混乱しません。

設定手順を記録する

サーバーの文字コード設定手順を記録しておくと、新しいサーバーを立てるときに役立ちます。

よくある質問

Q1. UTF-8とUTF-8Nの違いは？

UTF-8Nは、BOM（バイトオーダーマーク）という特殊な印がないUTF-8のことです。

Linuxでは通常BOMなしのUTF-8を使うので、実質的にUTF-8とUTF-8Nは同じと考えて問題ありません。

Q2. 改行コードも関係ある？

はい、文字コードと同様に重要です。

Linux/Unix：LF（ラインフィード）
Windows：CR+LF（キャリッジリターン＋ラインフィード）

改行コードが違うと、見た目がおかしくなることがあります。

Q3. データベースの文字コードも合わせる必要がある？

必要です。

MySQLやPostgreSQLなどを使う場合、データベースの文字コードもUTF-8に統一しておくと、トラブルが減りますよ。

Q4. メールの文字化けも同じ原因？

そうです。

メール送信時の文字コード設定が、受信側と合っていないと文字化けします。メール送信プログラムでUTF-8を指定しましょう。

Q5. 古いファイルを一括変換しても大丈夫？

バックアップを取ってから実行してください。

変換に失敗すると、データが壊れる可能性があります。必ず元のファイルを保存しておきましょう。

まとめ：文字コードを制して快適なCentOS環境を

CentOSのターミナルにおける文字コードについて、重要なポイントをまとめます。

基本の確認方法

localeコマンドで現在の設定を確認
echo $LANGで簡単チェック
file -iでファイルの文字コードを調べる

設定変更の方法

一時的：export LANG=ja_JP.UTF-8
恒久的：.bash_profileに記述
システム全体：localectl set-locale

ファイル変換のツール

iconv：標準的な変換コマンド
nkf：日本語特化で便利
どちらも上書き保存が可能

トラブル対処

ターミナルソフトの文字コード設定を確認
必要なロケールパッケージをインストール
SSH接続時の環境変数を設定

ベストプラクティス

新規ファイルはUTF-8で統一
ドキュメントに文字コードを明記
変更前は必ずバックアップ

文字コードの理解は、サーバー管理の基本スキルの一つです。この記事を参考に、文字化けのない快適なCentOS環境を構築してくださいね！