logo

선형변환의 행렬표현 📂선형대수

선형변환의 행렬표현

정의1

V,WV, W유한차원 벡터공간이라고 하자. β={v1,,vn}\beta = \left\{ \mathbf{v}_{1}, \dots, \mathbf{v}_{n} \right\}γ={w1,,wm}\gamma = \left\{ \mathbf{w}_{1}, \dots, \mathbf{w}_{m} \right\}을 각각 VVWW순서기저라고 하자. T:VWT : V \to W선형변환 이라고 하자. 그러면 기저 표현의 유일성에 의해, 다음을 만족하는 스칼라 aija_{ij}가 유일하게 존재한다.

T(vj)=i=1maijwi=a1jw1++amjwm for 1jn T(\mathbf{v}_{j}) = \sum_{i=1}^{m}a_{ij}\mathbf{w}_{i} = a_{1j}\mathbf{w}_{1} + \cdots + a_{mj}\mathbf{w}_{m} \quad \text{ for } 1 \le j \le n

이때 Aij=aijA_{ij} = a_{ij}로 정의되는 m×nm \times n 행렬 AA순서 기저 β\betaγ\gamma에 대한 TT의 행렬 표현matrix representation for TT relative to the basis β\beta and γ\gamma라고 하며, [T]γ,β[T]_{\gamma, \beta} 혹은 [T]βγ[T]_{\beta}^{\gamma}라고 표기한다.

설명

모든 선형변환은 행렬로 표현할 수 있고 반대로 행렬에 대응되는 선형변환이 존재하여, 선형변환이나 선형변환의 행렬 표현이나 본질적으로 같다. 선형대수학에서 행렬을 배우는 이유 중 하나가 이것이다. 정의로부터 이러한 행렬 표현은 기저의 상image을 이용해 찾을 수 있다.

V=WV=W이고 β=γ\beta=\gamma이면 간단히 다음과 같이 표기한다.

[T]β=[T]γ,β [T]_{\beta} = [T]_{\gamma, \beta}

성질

V,WV, W를 순서기저 β,γ\beta, \gamma가 주어진 유한차원 벡터공간이라고 하자. 그리고 T,U:VWT, U : V \to W라고 하자. 그러면 다음이 성립한다.

  • [T+U]βγ=[T]βγ+[U]βγ[T + U]_{\beta}^{\gamma} = [T]_{\beta}^{\gamma} + [U]_{\beta}^{\gamma}

  • [aT]βγ=a[T]βγ[aT]_{\beta}^{\gamma} = a[T]_{\beta}^{\gamma}

TT와 이의 역변환 T1T^{-1}에 대해 다음이 성립한다.\\[0.6em]

  • TT가 가역인 것은 [T]βγ[T]_{\beta}^{\gamma}가 가역인 것과 동치이다. 더하여 [T1]βγ=([T]βγ)1[T^{-1}]_{\beta}^{\gamma} = ([T]_{\beta}^{\gamma})^{-1}이다.

V,W,ZV, W, Z를 유한차원 벡터공간, α,β,γ\alpha, \beta, \gamma를 각각의 순서기저라고 하자. 그리고 T:VWT : V \to W, U:WZU : W \to Z를 선형변환이라고 하자. 그러면 다음이 성립한다.\\[0.6em]

  • [UT]αγ=[U]βγ[T]αβ[UT]_{\alpha}^{\gamma} = [U]_{\beta}^{\gamma}[T]_{\alpha}^{\beta}

행렬 찾기1

VV의 기저를 β\beta, WW의 기저를 γ\gamma이라고 하자. 그리고 xV\mathbf{x} \in V좌표벡터[x]β[\mathbf{x}]_{\beta}, T(x)WT(\mathbf{x})\in W의 좌표벡터를 [T(x)]γ[T(\mathbf{x})]_{\gamma}라고 하자.

슬라이드1.PNG

그러면 우리의 목표는 Rn\mathbb{R}^{n}벡터 [x]β[\mathbf{x}]_{\beta}를 행렬곱에 의해 Rm\mathbb{R}^{m}벡터 [T(x)]γ[T(\mathbf{x})]_{\gamma}로 만드는 m×nm \times n 행렬 AA를 찾는 것이다. AA를 찾으면 주어진 TT에 따라 구체적으로 T(x)T(\mathbf{x})를 계산하지 않고도 행렬곱을 계산하는 것으로 선형변환 TT를 수행할 수 있다.

A[x]β=[T(x)]γ \begin{equation} A[\mathbf{x}]_{\beta} = [T(\mathbf{x})]_{\gamma} \end{equation}

두 기저를 구체적으로 β={v1,,vn}\beta = \left\{ \mathbf{v}_{1}, \dots, \mathbf{v}_{n} \right\}, γ={w1,,wm}\gamma = \left\{ \mathbf{w}_{1}, \dots, \mathbf{w}_{m} \right\}이라고 하자. 그러면 각각의 vi\mathbf{v}_{i}에 대해서 (1)(1)이 성립해야하므로 다음을 얻는다.

A[v1]β=[T(v1)]γ,A[v2]β=[T(v2)]γ,,A[vn]β=[T(vn)]γ \begin{equation} A[\mathbf{v}_{1}]_{\beta} = [T(\mathbf{v}_{1})]_{\gamma},\quad A[\mathbf{v}_{2}]_{\beta} = [T(\mathbf{v}_{2})]_{\gamma},\quad \dots,\quad A[\mathbf{v}_{n}]_{\beta} = [T(\mathbf{v}_{n})]_{\gamma} \end{equation}

행렬 AA를 다음과 같다고 하자.

A=[a11a12a1na21a22a2nam1am2amn] A = \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{bmatrix}

[vi]β[\mathbf{v}_{i}]_{\beta}들은 다음과 같다.

[v1]β=[100],[v2]β=[010],,[vn]β=[001] [\mathbf{v}_{1}]_{\beta} = \begin{bmatrix} 1 \\ 0 \\ \vdots \\ 0 \end{bmatrix}, \quad [\mathbf{v}_{2}]_{\beta} = \begin{bmatrix} 0 \\ 1 \\ \vdots \\ 0 \end{bmatrix}, \quad \dots,\quad [\mathbf{v}_{n}]_{\beta} = \begin{bmatrix} 0 \\ 0 \\ \vdots \\ 1 \end{bmatrix}

따라서 다음을 얻는다.

A[v1]β=[a11a12a1na21a22a2nam1am2amn][100]=[a11a21am1]A[v2]β=[a11a12a1na21a22a2nam1am2amn][010]=[a12a22am2]A[vn]β=[a11a12a1na21a22a2nam1am2amn][100]=[a1na2namn] \begin{align*} A[\mathbf{v}_{1}]_{\beta} = \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{bmatrix} \begin{bmatrix} 1 \\ 0 \\ \vdots \\ 0 \end{bmatrix} &= \begin{bmatrix} a_{11} \\ a_{21} \\ \vdots \\ a_{m1} \end{bmatrix} \\[3em] A[\mathbf{v}_{2}]_{\beta} = \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{bmatrix} \begin{bmatrix} 0 \\ 1 \\ \vdots \\ 0 \end{bmatrix} &= \begin{bmatrix} a_{12} \\ a_{22} \\ \vdots \\ a_{m2} \end{bmatrix} \\[1em] &\vdots \\[1em] A[\mathbf{v}_{n}]_{\beta} = \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{bmatrix} \begin{bmatrix} 1 \\ 0 \\ \vdots \\ 0 \end{bmatrix} &= \begin{bmatrix} a_{1n} \\ a_{2n} \\ \vdots \\ a_{mn} \end{bmatrix} \end{align*}

그러면 (2)(2)에 의해 다음을 얻는다.

[T(v1)]γ=[a11a21am1],[T(v2)]γ=[a12a22am2],,[T(vn)]γ=[a1na2namn] [T(\mathbf{v}_{1})]_{\gamma} = \begin{bmatrix} a_{11} \\ a_{21} \\ \vdots \\ a_{m1} \end{bmatrix},\quad [T(\mathbf{v}_{2})]_{\gamma} = \begin{bmatrix} a_{12} \\ a_{22} \\ \vdots \\ a_{m2} \end{bmatrix},\quad \dots,\quad [T(\mathbf{v}_{n})]_{\gamma} = \begin{bmatrix} a_{1n} \\ a_{2n} \\ \vdots \\ a_{mn} \end{bmatrix}

그러므로 행렬 AAjj번째 열은 [T(vj)]γ[T(\mathbf{v}_{j})]_{\gamma}다.

A=[[T(v1)]γ[T(v2)]γ[T(vn)]γ] A = \begin{bmatrix} [T(\mathbf{v}_{1})]_{\gamma} & [T(\mathbf{v}_{2})]_{\gamma} & \cdots & [T(\mathbf{v}_{n})]_{\gamma}\end{bmatrix}

따라서 다음의 식이 성립한다.

[T]γ,β[x]β=[T(x)]γ=[T]βγ[x]β [T]_{\gamma, \beta} [\mathbf{x}]_{\beta} = [T(\mathbf{x})]_{\gamma} = [T]_{\beta}^{\gamma}[\mathbf{x}]_{\beta}

이는 직관적으로 인접한(혹은 아랫첨자에서 중복되는) 2개의 β\beta를 상쇄시키고, x\mathbf{x}TT에 대입시킨 것으로 볼 수 있다.


  1. Stephen H. Friedberg, Linear Algebra (4th Edition, 2002), p80-81 ↩︎ ↩︎