テストの勉強時間と点数の関係を調べたら、こんなデータが集まったとします。
- 1時間勉強した人:50点
- 2時間勉強した人:65点
- 3時間勉強した人:70点
- 4時間勉強した人:85点
このデータを見て「勉強時間が長いほど点数が高い」のは分かります。 でも、「5時間勉強したら何点取れそう?」と聞かれたら、どう答えますか?
こんなとき活躍するのが「回帰直線」です。
バラバラに散らばったデータの真ん中を通る「最もそれらしい直線」を引いて、未来を予測したり、関係性を数値化したりできるんです。
今回は、回帰直線の意味から求め方、さらには実際の活用例まで、すべて分かりやすく解説します!
回帰直線の基本を理解しよう

回帰直線を一言で説明すると
回帰直線とは「データの散らばりを最もよく表す一本の直線」のことです。
もっと詳しく言うと:
- 複数のデータ点の傾向を表す代表的な直線
- データから予測をするための基準線
- 2つの変数の関係を数式で表したもの
グラフに点をたくさん打って、その真ん中あたりを通る線を引く。 これが回帰直線のイメージです。
なぜ「回帰」という名前?
実は面白い由来があります。
19世紀、イギリスの学者ガルトンが親子の身長を研究していました。 すると「背の高い親の子は親より低く、背の低い親の子は親より高い傾向がある」ことを発見。
つまり、極端な値は平均に「回帰(戻る)」する傾向があったんです。 この研究から「回帰」という名前がつきました。
今では「戻る」という意味は薄れて、単に「関係を表す直線」という意味で使われています。
回帰直線で分かること
回帰直線から読み取れる情報:
1. 関係の強さ
- 点が直線に近い → 強い関係
- 点がバラバラ → 弱い関係
2. 関係の向き
- 右上がり → 正の相関(片方が増えると、もう片方も増える)
- 右下がり → 負の相関(片方が増えると、もう片方は減る)
3. 予測値
- 直線の式から、知らない値を予測できる
回帰直線の見方と意味
散布図から始めよう
回帰直線を理解するには、まず散布図を知る必要があります。
散布図とは:
- 2つのデータの関係を点で表したグラフ
- 横軸(x軸):原因となる変数(説明変数)
- 縦軸(y軸):結果となる変数(目的変数)
例:勉強時間と点数
- 横軸:勉強時間
- 縦軸:テストの点数
- 各生徒のデータを点で表示
回帰直線の式
回帰直線は次の式で表されます:
y = ax + b
ここで:
- y:予測したい値(目的変数)
- x:分かっている値(説明変数)
- a:傾き(xが1増えたときyがどれだけ変わるか)
- b:切片(x=0のときのyの値)
例:y = 15x + 35
- 勉強時間が1時間増えると、点数は15点上がる
- 勉強時間0でも35点(基礎点)
最小二乗法の考え方
回帰直線はどうやって「最もよい」直線を決めるのでしょうか?
答えは「最小二乗法」という方法です。
仕組み:
- 各データ点から直線までの縦の距離を測る
- その距離を2乗する(プラスマイナスを消すため)
- すべての2乗した距離を足す
- この合計が最小になる直線を選ぶ
つまり、すべての点からの「ズレ」が最も小さくなる線なんです。
具体例で理解する回帰直線

例1:アイスクリームの売上と気温
あるお店で1週間のデータを集めました:
気温(℃) | 売上(個) |
---|---|
20 | 50 |
22 | 55 |
25 | 70 |
28 | 85 |
30 | 95 |
32 | 100 |
35 | 115 |
このデータから回帰直線を引くと: 売上 = 3.5 × 気温 – 20
意味:
- 気温が1℃上がると、売上は3.5個増える
- 気温が33℃なら:3.5 × 33 – 20 = 95.5個売れそう
例2:身長と体重の関係
クラス30人のデータから:
回帰直線:体重 = 0.9 × 身長 – 90
意味:
- 身長が1cm高いと、体重は0.9kg重い傾向
- 身長170cmの人の予測体重:0.9 × 170 – 90 = 63kg
ただし、これは「平均的な傾向」で、個人差は当然あります。
例3:広告費と売上高
ある会社の月別データ:
回帰直線:売上高 = 2.5 × 広告費 + 100(単位:万円)
意味:
- 広告費を1万円増やすと、売上は2.5万円増える見込み
- 広告費0でも100万円の売上(固定客の存在)
経営判断に使える重要な情報ですね。
回帰直線の求め方(簡単な方法)
手計算で求める場合
完璧な計算は複雑ですが、概算なら簡単にできます。
簡易的な方法:
- データを散布図にする
- 点の真ん中あたりに定規を当てる
- なるべく多くの点の近くを通るように調整
- その直線の式を読み取る
これで大まかな回帰直線が分かります。
電卓を使う場合
関数電卓なら回帰直線を計算できます。
手順:
- 統計モードに切り替え
- xとyのデータを入力
- 「回帰計算」または「LR」ボタン
- 傾きaと切片bが表示される
エクセルを使う場合
最も実用的な方法です。
手順:
- データを2列に入力
- 散布図を作成
- グラフ上で右クリック
- 「近似曲線の追加」を選択
- 「線形」を選んで「数式を表示」にチェック
これで回帰直線と式が表示されます!
回帰直線の注意点と限界
注意点1:相関と因果は違う
回帰直線があっても、因果関係があるとは限りません。
例:アイスの売上と水難事故
- 両方とも夏に増える → 正の相関
- でも、アイスが事故を起こすわけではない
見せかけの相関に注意しましょう。
注意点2:外挿の危険性
データの範囲外の予測は危険です。
例:気温20〜35℃のデータで作った式
- 気温40℃の予測 → まあまあ信頼できる
- 気温60℃の予測 → 全く信頼できない
常識的な範囲で使いましょう。
注意点3:外れ値の影響
1つの極端なデータが直線を大きく変えることがあります。
例:テストの点数
- 普通の生徒:勉強時間に比例
- 体調不良の生徒:10時間勉強しても30点
外れ値は除いて計算することもあります。
注意点4:直線とは限らない
すべての関係が直線になるわけではありません。
曲線の関係の例:
- 薬の量と効果(適量を超えると逆効果)
- 練習時間と成績(疲労で逆に下がる)
データの形をよく見て判断しましょう。
回帰直線の活用例

ビジネスでの活用
売上予測
- 過去のデータから将来の売上を予測
- 在庫管理や人員配置に活用
価格設定
- 価格と販売数の関係から最適価格を決定
- 利益を最大化する価格戦略
品質管理
- 製造条件と品質の関係を分析
- 不良品を減らす条件を発見
学習での活用
成績予測
- 模試の点数から本番の点数を予測
- 勉強計画の立案に活用
効率的な学習法の発見
- 各教科の勉強時間と成績の関係
- 時間配分の最適化
スポーツでの活用
トレーニング効果の測定
- 練習量とパフォーマンスの関係
- 効率的な練習メニューの作成
選手の将来性予測
- 年齢と記録の関係から成長を予測
- スカウティングに活用
相関係数との関係
相関係数とは
相関係数(r)は、回帰直線のフィット度を表す数値です。
値の意味:
- r = 1:完全な正の相関(すべての点が直線上)
- r = 0.7〜0.9:強い正の相関
- r = 0.4〜0.7:中程度の正の相関
- r = 0:相関なし
- r = -1:完全な負の相関
決定係数(R²)
相関係数を2乗した値で、説明力を表します。
例:r = 0.8 なら R² = 0.64 → データの変動の64%を説明できる
R² が0.5以上なら、まあまあ良い回帰直線と言えます。
練習問題にチャレンジ
問題1:回帰直線の意味
次の回帰直線の意味を説明せよ:
睡眠時間と集中力の関係:y = -10x + 90
答え:
- 睡眠時間が1時間減ると、集中力は10ポイント下がる
- 負の相関(睡眠不足は集中力を下げる)
問題2:予測値を求める
スマホ使用時間と成績の回帰直線: 成績 = -5x + 85
スマホを3時間使う生徒の予測成績は?
答え:-5 × 3 + 85 = 70点
問題3:どちらが良い回帰?
A:相関係数 0.9 のデータ B:相関係数 0.3 のデータ
どちらの回帰直線が信頼できる?
答え:A(0.9の方が1に近く、強い相関)
よくある質問
Q:回帰直線は必ず引けるの?
A:計算上は引けますが、意味があるとは限りません。
相関係数が0に近い場合、回帰直線を引いても予測には使えません。 まず散布図を見て、関係がありそうか確認しましょう。
Q:曲がった関係はどうする?
A:曲線回帰という方法があります。
2次関数や指数関数など、曲線でフィットさせる方法もあります。 ただし、高校以上の内容になります。
Q:複数の要因がある場合は?
A:重回帰分析という方法を使います。
例:成績 = a × 勉強時間 + b × 睡眠時間 + c
これも発展的な内容です。
まとめ:回帰直線でデータの声を聞く
回帰直線について、たくさん学んできましたね。
押さえておきたいポイント:
- 回帰直線 = データの傾向を表す最適な直線
- y = ax + b の形で表される
- 最小二乗法で「最もズレが小さい」線を選ぶ
- 予測や関係性の把握に使える
回帰直線の使い方:
- データを散布図にする
- 関係がありそうか確認
- 回帰直線を引く(計算またはソフト使用)
- 式から予測や分析を行う
注意点:
- 相関と因果関係は別物
- データ範囲外の予測は危険
- 外れ値に注意
回帰直線は、バラバラなデータから規則性を見つける強力なツールです。 テストの成績予測から、ビジネスの売上分析まで、幅広く活用されています。
まずは身近なデータで散布図を描いて、関係を探してみてください。 意外な発見があるかもしれませんよ!
コメント