中央値とは何か?──平均値だけでは見えないデータの真実

数学

「平均値を見ても、なんだか実感とずれている気がする…」

そんな経験はありませんか?そんなときに注目すべきなのが中央値(ちゅうおうち)です。

この記事では、中央値の意味や計算方法、実際の使い方について、身近な例を使ってわかりやすく説明します。

統計やデータ分析の基礎として、日常生活でも役立つ知識をお伝えします。

スポンサーリンク

中央値とは何か?

中央値の基本的な意味

中央値とは、データを小さい順に並べたときの真ん中にある値のことです。

英語では「メディアン(Median)」と呼ばれます。

たとえば、5人の身長データがあるとします: 150cm、160cm、165cm、170cm、180cm

この場合、真ん中の3番目にある「165cm」が中央値になります。

中央値の特徴とメリット

中央値には以下のような特徴があります:

外れ値に強い

極端に大きい値や小さい値があっても、中央値はほとんど変わりません。

これを「ロバスト性」と呼びます。

データの分布を表現

全体の半分が中央値より小さく、残りの半分が中央値より大きいという性質があります。

直感的にわかりやすい

「真ん中の値」という概念は、数学が苦手な人でも理解しやすいものです。

平均値との違いを理解しよう

平均値(算術平均)は、すべての数値を足して個数で割ったものです。

一方、中央値は順序だけを重視します。

例:年収のデータ

  • A社員:300万円
  • B社員:400万円
  • C社員:500万円
  • D社員:600万円
  • E社員:3000万円(社長)

平均値の計算 (300 + 400 + 500 + 600 + 3000)÷ 5 = 960万円

中央値の計算 真ん中の値:500万円

この例では、社長の高い年収が平均値を大きく押し上げています。

しかし、中央値は500万円で、一般的な社員の年収により近い値を示しています。

上記のデータは社長が外れ値となり、平均値に大きな影響を与えている。

上記のデータを見て、平均値は960万円と言われても「え?高すぎない?」となるように、平均値にはこうした弱点があるのです。

中央値の計算方法

データの個数が奇数の場合

手順

  1. データを小さい順に並び替える
  2. 真ん中の位置にある値を見つける

例:テストの点数(7人分) 元のデータ:85点、92点、78点、88点、95点、82点、90点

  • ステップ1:
    並び替え 78点、82点、85点、88点、90点、92点、95点
  • ステップ2:
    真ん中を特定 7個のデータなので、4番目(真ん中)が中央値
    答え:88点

データの個数が偶数の場合

手順

  1. データを小さい順に並び替える
  2. 真ん中の2つの値を見つける
  3. その2つの平均を計算する

例:月の支出額(6ヶ月分) 元のデータ:12万円、8万円、15万円、10万円、11万円、9万円

ステップ1:並び替え 8万円、9万円、10万円11万円、12万円、15万円

ステップ2:真ん中の2つを特定 6個のデータなので、3番目と4番目が対象 10万円と11万円

ステップ3:平均を計算 (10 + 11)÷ 2 = 10.5万円 答え:10.5万円

計算時の注意点

  • 必ず並び替えを行う 元のデータの順序のまま計算すると、間違った結果になります。
  • 同じ値がある場合 同じ数値が複数あっても、それぞれを1つのデータとして数えます。
  • 小数点の扱い 偶数個のデータで中央値を求めるとき、小数点が出ることがあります。これは正常な結果です。

中央値が活躍する場面

収入や家計の統計

なぜ平均値だけでは不十分? 一部の高所得者が平均を大きく引き上げてしまうため、一般的な収入水準がわからなくなります。

中央値の活用例

  • 世帯年収の中央値:約430万円(2019年厚生労働省調査)
  • 家賃相場の中央値:地域の実情をより正確に反映

学校のテスト分析

成績の分布を把握 平均点だけでは、クラス全体の学力分布がわかりません。

中央値を併用することで、より詳しい分析が可能になります。

例:数学のテスト結果

  • 平均点:72点
  • 中央値:68点

この場合、高得点の生徒が平均を押し上げており、多くの生徒は平均より低い点数だったことがわかります。

不動産や物価の調査

  • マンション価格の分析 超高級マンションが平均価格を押し上げても、中央値なら一般的な価格帯を知ることができます。
  • 生活費の実態調査 極端に高い支出や低い支出の影響を受けにくく、標準的な生活費を把握できます。

アンケート調査やマーケティング

  • 顧客満足度の分析 極端に低い評価や高い評価の影響を除いて、一般的な顧客の声を聞くことができます。
  • 商品価格の設定 ターゲット層の購買力を正確に把握し、適切な価格設定に活用できます。

平均値と中央値の使い分け

平均値が適している場面

  • データが正規分布に近い場合 値が中心付近に集まっており、極端な外れ値がない状況では、平均値が有効です。
  • 総量を知りたい場合 売上総額や人口総数など、全体の合計値が重要な分析では平均値を使います。

中央値が適している場合

  • 外れ値が存在する場合 極端に大きい値や小さい値がデータに含まれているときは、中央値の方が実態を表します。
  • 分布が偏っている場合 データが一方向に偏って分布している場合、中央値の方が代表値として適切です。

両方を併用する効果

データの特性を理解 平均値と中央値を比較することで、データの分布の形や外れ値の存在を推測できます。

  • 平均値 > 中央値:高い値に偏った分布
  • 平均値 ≈ 中央値:バランスの取れた分布
  • 平均値 < 中央値:低い値に偏った分布

まとめ:データの真実を見抜く力を身につけよう

中央値は、極端な値の影響を避けて、データの真ん中の状況を把握するための重要な統計指標です。

中央値を活用するメリット

  • 外れ値に惑わされない分析ができる
  • 一般的な水準や標準的な状況がわかる
  • より現実に即した判断材料になる

日常生活での活用

  • ニュースで見る統計データの理解
  • 家計管理や投資判断
  • 仕事でのデータ分析や報告

コメント

タイトルとURLをコピーしました