ヤコビ行列とは?多変数関数の微分を行列で表す

数学

微積分を学んでいると、「ヤコビ行列」や「ヤコビアン」という言葉に出会います。特に、多変数関数の微分や座標変換を扱うとき、ヤコビ行列は欠かせない道具になります。

でも、「ヤコビ行列って何?」「なぜ行列の形にするの?」と疑問に思ったことはありませんか?

この記事では、ヤコビ行列の定義から幾何学的な意味、具体的な計算方法、そして重積分での応用まで、丁寧に解説していきます。

スポンサーリンク

ヤコビ行列を理解する前に:1変数から多変数へ

ヤコビ行列を理解するには、まず1変数関数の微分から始めるのが分かりやすいです。

1変数関数の微分

関数 $y = f(x)$ の微分係数 $f'(x)$ は、$x$ のわずかな変化に対する $y$ の変化率を表します。

$$\frac{dy}{dx} = f'(x)$$

これは「$x$ が微小量 $dx$ だけ変化すると、$y$ は $f'(x) \cdot dx$ だけ変化する」という意味ですね。

多変数ベクトル値関数への拡張

では、入力も出力も複数ある場合はどうなるでしょうか?

たとえば、2変数を入力として、2つの値を出力する関数を考えてみましょう。

$$\begin{cases}
u = f(x, y) \
v = g(x, y)
\end{cases}$$

このとき、$(x, y)$ が微小量 $(dx, dy)$ だけ変化したら、$(u, v)$ はどれだけ変化するでしょうか?

この問いに答えるのが、ヤコビ行列なんです。

ヤコビ行列の定義

ヤコビ行列は、多変数ベクトル値関数のすべての1階偏微分を並べた行列です。

基本的な定義

関数 $\mathbf{f}: \mathbb{R}^n \rightarrow \mathbb{R}^m$ が、

$$\mathbf{f}(x_1, x_2, \ldots, x_n) = \begin{pmatrix} f_1(x_1, \ldots, x_n) \ f_2(x_1, \ldots, x_n) \ \vdots \ f_m(x_1, \ldots, x_n) \end{pmatrix}$$

と表されるとき、点 $\mathbf{a}$ におけるヤコビ行列(Jacobian matrix)は次のように定義されます。

$$J_{\mathbf{f}}(\mathbf{a}) = \begin{pmatrix}
\frac{\partial f_1}{\partial x_1} & \frac{\partial f_1}{\partial x_2} & \cdots & \frac{\partial f_1}{\partial x_n} \
\frac{\partial f_2}{\partial x_1} & \frac{\partial f_2}{\partial x_2} & \cdots & \frac{\partial f_2}{\partial x_n} \
\vdots & \vdots & \ddots & \vdots \
\frac{\partial f_m}{\partial x_1} & \frac{\partial f_m}{\partial x_2} & \cdots & \frac{\partial f_m}{\partial x_n}
\end{pmatrix}$$

行列の大きさ

ヤコビ行列は $m \times n$ 行列です。

  • $m$:出力の次元(関数の個数)
  • $n$:入力の次元(変数の個数)

記号

ヤコビ行列は次のような記号で表されます。

$$J_{\mathbf{f}}, \quad D\mathbf{f}, \quad \frac{\partial \mathbf{f}}{\partial \mathbf{x}}, \quad \frac{\partial(f_1, \ldots, f_m)}{\partial(x_1, \ldots, x_n)}$$

具体例で理解する

抽象的な定義だけだと分かりにくいので、具体例を見てみましょう。

例1:2変数2関数の場合

$$\begin{cases}
u = x^2 + y \
v = xy
\end{cases}$$

各関数を各変数で偏微分します。

$$\frac{\partial u}{\partial x} = 2x, \quad \frac{\partial u}{\partial y} = 1$$

$$\frac{\partial v}{\partial x} = y, \quad \frac{\partial v}{\partial y} = x$$

したがって、ヤコビ行列は

$$J = \begin{pmatrix}
\frac{\partial u}{\partial x} & \frac{\partial u}{\partial y} \
\frac{\partial v}{\partial x} & \frac{\partial v}{\partial y}
\end{pmatrix} = \begin{pmatrix}
2x & 1 \
y & x
\end{pmatrix}$$

点 $(1, 2)$ でのヤコビ行列は

$$J(1, 2) = \begin{pmatrix}
2 & 1 \
2 & 1
\end{pmatrix}$$

例2:極座標変換

極座標 $(r, \theta)$ から直交座標 $(x, y)$ への変換は、

$$\begin{cases}
x = r \cos \theta \
y = r \sin \theta
\end{cases}$$

各偏微分を計算すると、

$$\frac{\partial x}{\partial r} = \cos \theta, \quad \frac{\partial x}{\partial \theta} = -r \sin \theta$$

$$\frac{\partial y}{\partial r} = \sin \theta, \quad \frac{\partial y}{\partial \theta} = r \cos \theta$$

ヤコビ行列は

$$J = \begin{pmatrix}
\cos \theta & -r \sin \theta \
\sin \theta & r \cos \theta
\end{pmatrix}$$

例3:3次元極座標変換(球座標)

球座標 $(r, \theta, \phi)$ から直交座標 $(x, y, z)$ への変換は、

$$\begin{cases}
x = r \sin \theta \cos \phi \
y = r \sin \theta \sin \phi \
z = r \cos \theta
\end{cases}$$

ヤコビ行列は $3 \times 3$ 行列になります。

$$J = \begin{pmatrix}
\sin \theta \cos \phi & r \cos \theta \cos \phi & -r \sin \theta \sin \phi \
\sin \theta \sin \phi & r \cos \theta \sin \phi & r \sin \theta \cos \phi \
\cos \theta & -r \sin \theta & 0
\end{pmatrix}$$

ヤコビ行列式(ヤコビアン)とは

ヤコビ行列が正方行列($m = n$)のとき、その行列式をヤコビ行列式またはヤコビアン(Jacobian determinant)と呼びます。

定義

$$\det(J) = |J| = \begin{vmatrix}
\frac{\partial f_1}{\partial x_1} & \cdots & \frac{\partial f_1}{\partial x_n} \
\vdots & \ddots & \vdots \
\frac{\partial f_n}{\partial x_1} & \cdots & \frac{\partial f_n}{\partial x_n}
\end{vmatrix}$$

用語の注意

日本語では「ヤコビアン」というと、通常はヤコビ行列式(行列式の値)を指します。英語では Jacobian が行列と行列式の両方を指すこともあるので、文脈で判断する必要があります。

極座標のヤコビアン

例2の極座標変換のヤコビ行列式を計算してみましょう。

$$|J| = \begin{vmatrix}
\cos \theta & -r \sin \theta \
\sin \theta & r \cos \theta
\end{vmatrix}$$

$$= \cos \theta \cdot r \cos \theta – (-r \sin \theta) \cdot \sin \theta$$

$$= r \cos^2 \theta + r \sin^2 \theta = r$$

したがって、2次元極座標のヤコビアンは $r$ です。

これが、2重積分で極座標変換するとき $dx\,dy = r\,dr\,d\theta$ となる理由です!

球座標のヤコビアン

例3の球座標変換のヤコビ行列式を計算すると(計算は省略しますが)、

$$|J| = r^2 \sin \theta$$

これが、3重積分で球座標変換するとき $dx\,dy\,dz = r^2 \sin \theta \,dr\,d\theta\,d\phi$ となる理由です。

ヤコビ行列の幾何学的意味

ヤコビ行列には重要な幾何学的意味があります。

1. 局所的な線形変換

ヤコビ行列は、関数による変換を点の近くで線形近似したものです。

関数 $\mathbf{f}$ が点 $\mathbf{a}$ で全微分可能なら、

$$\mathbf{f}(\mathbf{a} + d\mathbf{x}) \approx \mathbf{f}(\mathbf{a}) + J_{\mathbf{f}}(\mathbf{a}) \cdot d\mathbf{x}$$

つまり、ヤコビ行列は微小な変化に対する線形変換を表しています。

2. 伸び縮みと回転

ヤコビ行列は、座標変換によって空間がどのように「伸び縮み」したり「回転」したりするかを記述します。

たとえば、極座標変換のヤコビ行列

$$J = \begin{pmatrix}
\cos \theta & -r \sin \theta \
\sin \theta & r \cos \theta
\end{pmatrix}$$

は、回転と拡大縮小の組み合わせを表しています。

3. 面積・体積の拡大率

ヤコビアン(行列式)の絶対値は、座標変換による面積や体積の拡大率を表します。

2次元の場合、微小長方形 $dx \times dy$ が変換されると、その面積は

$$dA’ = |J| \cdot dx \, dy$$

になります。

これが、重積分で変数変換するときにヤコビアンが現れる理由です。

全微分との関係

ヤコビ行列は、全微分と密接に関係しています。

スカラー値関数の場合

関数 $f: \mathbb{R}^n \rightarrow \mathbb{R}$ のヤコビ行列は $1 \times n$ 行列、つまり行ベクトルです。

$$J_f = \begin{pmatrix}
\frac{\partial f}{\partial x_1} & \frac{\partial f}{\partial x_2} & \cdots & \frac{\partial f}{\partial x_n}
\end{pmatrix}$$

これは勾配ベクトル $\nabla f$ の転置です。

$$J_f = (\nabla f)^T$$

全微分は

$$df = \frac{\partial f}{\partial x_1} dx_1 + \cdots + \frac{\partial f}{\partial x_n} dx_n = J_f \cdot d\mathbf{x}$$

と表せます。

ベクトル値関数の場合

ベクトル値関数 $\mathbf{f}: \mathbb{R}^n \rightarrow \mathbb{R}^m$ の全微分は、

$$d\mathbf{f} = J_{\mathbf{f}} \cdot d\mathbf{x}$$

$$\begin{pmatrix} df_1 \ df_2 \ \vdots \ df_m \end{pmatrix} = \begin{pmatrix}
\frac{\partial f_1}{\partial x_1} & \cdots & \frac{\partial f_1}{\partial x_n} \
\vdots & \ddots & \vdots \
\frac{\partial f_m}{\partial x_1} & \cdots & \frac{\partial f_m}{\partial x_n}
\end{pmatrix} \begin{pmatrix} dx_1 \ dx_2 \ \vdots \ dx_n \end{pmatrix}$$

つまり、ヤコビ行列は全微分係数そのものなんです。

重積分での変数変換とヤコビアン

ヤコビアンの最も重要な応用の一つが、重積分の変数変換です。

2重積分の変数変換公式

領域 $D$ 上での2重積分を、変数変換 $x = x(u, v)$、$y = y(u, v)$ によって $D’$ 上の積分に変換するとき、

$$\iint_D f(x, y) \, dx \, dy = \iint_{D’} f(x(u, v), y(u, v)) \left| \frac{\partial(x, y)}{\partial(u, v)} \right| du \, dv$$

ここで $\left| \frac{\partial(x, y)}{\partial(u, v)} \right|$ がヤコビアンの絶対値です。

なぜ絶対値なのか?

積分では面積が問題なので、向きの反転(符号の反転)は気にせず、面積の拡大率だけが必要です。そのため、ヤコビアンの絶対値を使います。

具体例:極座標での2重積分

円盤 $x^2 + y^2 \leq 1$ 上で $f(x, y) = 1$ を積分する場合、

$$\iint_{x^2 + y^2 \leq 1} 1 \, dx \, dy$$

極座標変換 $x = r \cos \theta$、$y = r \sin \theta$ を使うと、

$$= \int_0^{2\pi} \int_0^1 1 \cdot r \, dr \, d\theta$$

ここで「$r$」がヤコビアンです。

$$= \int_0^{2\pi} \left[ \frac{r^2}{2} \right]_0^1 d\theta = \int_0^{2\pi} \frac{1}{2} d\theta = \pi$$

これは単位円の面積ですね。

3重積分の場合

3重積分でも同様に、

$$\iiint_D f(x, y, z) \, dx \, dy \, dz = \iiint_{D’} f(\mathbf{x}(\mathbf{u})) \left| \frac{\partial(x, y, z)}{\partial(u, v, w)} \right| du \, dv \, dw$$

球座標を使うときは、ヤコビアン $r^2 \sin \theta$ を掛けます。

ヤコビ行列の計算手順

実際にヤコビ行列を計算する手順をまとめます。

手順

  1. 関数を確認:入力変数と出力関数を明確にする
  2. 偏微分を計算:各出力関数を各入力変数で偏微分
  3. 行列に配置:偏微分を適切な位置に配置
  • 行:出力関数ごと
  • 列:入力変数ごと
  1. 行列式を計算(必要な場合):正方行列ならヤコビアンを求める

練習問題

次の変換のヤコビ行列とヤコビアンを求めてみましょう。

$$\begin{cases}
u = x^2 – y^2 \
v = 2xy
\end{cases}$$

解答

偏微分を計算します。

$$\frac{\partial u}{\partial x} = 2x, \quad \frac{\partial u}{\partial y} = -2y$$

$$\frac{\partial v}{\partial x} = 2y, \quad \frac{\partial v}{\partial y} = 2x$$

ヤコビ行列は

$$J = \begin{pmatrix}
2x & -2y \
2y & 2x
\end{pmatrix}$$

ヤコビアンは

$$|J| = \begin{vmatrix}
2x & -2y \
2y & 2x
\end{vmatrix} = 2x \cdot 2x – (-2y) \cdot 2y = 4x^2 + 4y^2 = 4(x^2 + y^2)$$

ヤコビアンの重要な性質

性質1:逆変換のヤコビアン

変換 $\mathbf{y} = \mathbf{f}(\mathbf{x})$ のヤコビアンと、その逆変換 $\mathbf{x} = \mathbf{f}^{-1}(\mathbf{y})$ のヤコビアンには次の関係があります。

$$\frac{\partial(x_1, \ldots, x_n)}{\partial(y_1, \ldots, y_n)} = \frac{1}{\frac{\partial(y_1, \ldots, y_n)}{\partial(x_1, \ldots, x_n)}}$$

つまり、逆変換のヤコビアンは、元のヤコビアンの逆数です。

これは、行列の逆行列の行列式が元の行列式の逆数になることから導かれます。

性質2:合成写像のヤコビアン(連鎖律)

変換 $\mathbf{z} = \mathbf{g}(\mathbf{y})$ と $\mathbf{y} = \mathbf{f}(\mathbf{x})$ の合成写像 $\mathbf{z} = \mathbf{g}(\mathbf{f}(\mathbf{x}))$ のヤコビ行列は、

$$J_{\mathbf{g} \circ \mathbf{f}} = J_{\mathbf{g}} \cdot J_{\mathbf{f}}$$

これは連鎖律の行列版です。

性質3:特異点の判定

ヤコビアンが0になる点を特異点または臨界点といいます。

$$|J(\mathbf{a})| = 0$$

特異点では、変換が局所的に可逆でなくなります。逆関数定理によれば、ヤコビアンが0でなければ、その点の近くで逆変換が存在します。

実用的な応用

ヤコビ行列は理論だけでなく、多くの実用的な場面で使われます。

応用1:最適化問題

多変数関数の最小値を求めるニュートン法では、ヤコビ行列が使われます。

勾配がゼロになる点を探すとき、

$$\nabla f(\mathbf{x}{n+1}) = \nabla f(\mathbf{x}_n) + J{\nabla f}(\mathbf{x}n) \cdot (\mathbf{x}{n+1} – \mathbf{x}_n)$$

ここで $J_{\nabla f}$ はヘッセ行列(2階偏微分の行列)になります。

応用2:機械学習

ニューラルネットワークの学習では、誤差逆伝播法(バックプロパゲーション)でヤコビ行列が本質的な役割を果たします。

各層の出力に対する損失関数の勾配を計算するとき、ヤコビ行列を使って逆向きに伝播させます。

応用3:物理学

流体力学では、速度場の変換を記述するのにヤコビ行列が使われます。

座標系を変えるとき、運動方程式の形を保つためにヤコビアンが必要です。

応用4:確率論

確率変数の変数変換では、確率密度関数の変換にヤコビアンが現れます。

確率変数 $\mathbf{X}$ が確率密度関数 $f_X$ を持ち、$\mathbf{Y} = \mathbf{g}(\mathbf{X})$ のとき、

$$f_Y(\mathbf{y}) = f_X(\mathbf{g}^{-1}(\mathbf{y})) \cdot \left| \frac{\partial \mathbf{g}^{-1}}{\partial \mathbf{y}} \right|$$

まとめ:ヤコビ行列を使いこなそう

ヤコビ行列は、多変数関数の微分を統一的に扱うための強力な道具です。

この記事のポイント

  • ヤコビ行列は、多変数ベクトル値関数の1階偏微分を並べた行列
  • $m \times n$ 行列で、$m$ は出力の次元、$n$ は入力の次元
  • 正方行列の場合、その行列式をヤコビ行列式(ヤコビアン)という
  • ヤコビ行列は全微分係数を行列で表したもの
  • 幾何学的には、局所的な線形変換、伸び縮み、回転を表す
  • ヤコビアンは座標変換による面積・体積の拡大率を表す
  • 重積分の変数変換で $|J|$ が現れる理由が理解できる
  • 極座標変換のヤコビアンは $r$、球座標では $r^2 \sin \theta$

実用上のポイント

  1. 計算方法:各関数を各変数で偏微分して、行列に並べる
  2. 行列の配置:行は出力関数ごと、列は入力変数ごと
  3. 変数変換:$dx\,dy = |J| \, du\,dv$ という形で使う
  4. 特異点:$|J| = 0$ となる点では変換が可逆でない

ヤコビ行列を理解することで、多変数の微積分、座標変換、最適化問題などが見通しよくなります。数学、物理学、工学、機械学習など、さまざまな分野でヤコビ行列は基礎となる道具です。

実際の問題に取り組むときは、まず関数の形を明確にし、偏微分を丁寧に計算し、それを行列に並べる、という手順を踏むと良いでしょう。

コメント

タイトルとURLをコピーしました