E,AHRSS

행렬

last modified: 2016-01-09 03:59:27 Contributors


Contents

1. 여럿이 줄지어 가는 것
2. 수학의 matrix
2.1. 행렬의 연산
2.2. 특수한 행렬
2.3. 더 보기

1. 여럿이 줄지어 가는 것

한자로는 行列이라고 쓰는데, 수학의 행렬과 한자는 같다. 가족관계에서 쓰이는 항렬도 한자는 동일. 기차놀이와는 관련이 있…을까?

2. 수학의 matrix


1개 이상의 수나 식을 사각형의 배열로 나열한 것. 가로를 행(row), 세로를 열(column)이라고 부른다. 서 케일리윌리엄 로원 해밀턴이 발명했다. 역사적으로 본다면 행렬은 연립 일차 방정식의 풀이를 어떻게 하면 될까라고 고민한데서 시작했다. 서 케일리가 연구하던 중에 $ ad - bc $ 의 값에 따라 연립 방정식의 해가 다르게 나오는 것을 보고 얘네가 해의 존재 여부(궁극적으로는 행렬의 가역 여부)를 판별한다는 관점에서 determinant라고 부른 데서 행렬식이 탄생했고, 윌리엄 로원 해밀턴이 '야, 그러면 연립 방정식의 계수랑 변수를 따로 떼어내서 쓰면 어떨까?'라는 생각에서 행렬이 탄생했다. 즉 역사적으로 보면 행렬식이 행렬보다 먼저 탄생했다.

사실 그 존재가치는 함수 내지는 사상(寫像, map)을 표현하기 위한 도구라는 데 있다. 모든 선형 변환(일차 변환)은 행렬로 표현할 수 있고 그 역도 성립한다. 즉, 행렬은 선형 변환과 같다. 이를 선형대수학의 기본정리라고 한다. 행렬의 곱셈을 덧셈이나 뺄셈처럼 안 하고 복잡하게 정의해 놓은 이유도 여기 있다. 참고로 정확히 말하면 차원이 nF-벡터공간에서 차원이 mF-벡터공간으로 가는 선형변환의 집합과 F 위의 (n×m) 행렬의 집합이 F-대수(algebra)로서 동형(isomorphic)인 것인데, 선형대수학 수준에서는 증명은 다 하면서도 어물쩡 넘긴다.

독립변수 1개, 종속변수 1개인 일반적인 일변수함수는 행렬 개념을 쓰지 않고도 수로 직관적으로 설명할 수 있지만, 정의역이나 공역의 차원이 둘 이상이 되기 시작하면 그 때부터는 수가 아니라 행렬로 함수를 표현해야 한다(행렬로 연립방정식을 풀어 본 사람이라면 감이 올 것이다. 이게 정의역이 두 개 이상인 함수의 맛보기). 예컨대 정의역이 2차원이고 공역이 3차원인 함수(=대응)를 표현하는 행렬은 3×2 행렬이다. 중/고급 수학의 핵심 개념. 고등학교에서 배우는 행렬은 끽해야 덧셈, 뺄셈, 곱셈 같은 연산만 하는데다가, 역행렬이나 연립방정식 풀 2차 정사각행렬까지만 해서 정말 쉬운 개념으로 알기 쉽다. 하지만 착각이다. 대학에서 행렬을 새로 배우면 행렬이 얼마나 심오하고 어려운 개념인지 알 수 있다. 쉽게 말하면 고등수학의 기본. 그러나 현재 교육과정에선 행렬이 아예 삭제되어버렸다 대신 집합을 다시 배워야 하지.

계산 노가다가 행 하나, 열 하나 더해질 때마다 무지막지하게 늘어난다.[1]덧셈, 뺄셈, 곱셈은 쉬울 줄 알았지? 그러니까 행렬 계산되는 공학계산기를 사용해야 합니다.

$\mathbf{x} = \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_m \end{bmatrix} , \mathbf{x} = \begin{bmatrix} x_1 x_2 \dots x_m \end{bmatrix} $

하나의 열로만 구성되면 열벡터, 하나의 행으로만 구성되면 행벡터라고 한다. 보통 책에는 조판이 귀찮아서 열벡터는 행벡터를 transpose[2]를 이용해 나타내는 경우가 있다. 행과 열 모두가 둘 이상이면 텐서가 된다.

보통 이과 학생들은 대학에서 선형대수학을 배우면서[3] 이를 다시 만나게 되며, 이걸 배우면서 고등학교 때 배운 행렬은 그야말로 수박 겉 핥기, 아니 그림의 수박핥기라는 것을 알게 된다. 일단 미지수가 2개 이상인 방정식이나, 둘 이상의 변수로 정의되는 함수를 표현하려면 행렬이 필수적이다. 물론 수학과 학생들은 이런 '행렬 활용법'에 가까운 공대 선형대수 이상의 원론적인 개념으로 행렬에 대해 접근하게 된다.

책의 앞부분에 있어 수학 좀 공부하려는 학생들에게는 매우 친숙한 부분이다.선생님보다 더 날아다니는 과목일지도 이전 교육과정에만 해당하는 사항이긴 하지만 그에 비해 통계와 확률은 책의 구성상 뒷부분에 있다 보니 배우는 시기가 종업식 시기와 맞물려 소홀히 공부하기가 일쑤. 그러나 뒷부분에 있다고 대충 공부했다간 수능을 망친다. 명심하자. 수능은 학교에서 배우는 범위 전부 나오고, 대부분의 고등학교에서는 중간고사나 기말고사보다는 수능을 더 중요시 한다는 걸. 대부분의 선생님들의 실적도 학생들의 어느 대학에 얼마나 들어갔는지에 따라 실적이 달라지는데 아직 대한민국은 대입에 수능이 강한 영향력을 갖는다. 이 말의 의미는 선생님들도 확률과 통계부분 또한 열심히 가르친다는 것이다. 충고하건대 수학은 어느 한 부분만 열심히 공부할 수 있는 과목이 아니다.

행렬은 다음 두 형태 중 하나를 골라서 그린다.
$\begin{bmatrix} x_{11} \quad x_{12} \\ x_{21} \quad x_{22} \end{bmatrix} = \begin{pmatrix} x_{11} \quad x_{12} \\ x_{21} \quad x_{22} \end{pmatrix} $
어느 쪽이든 상관없지만 고등학교 과정에서는 후자, 대학교 이상의 과정에서는 전자가 애용되는 듯.

2.1. 행렬의 연산

행렬의 연산은 다음과 같다.

  • 덧셈, 뺄셈
    대응하는 원소끼리 더하고 뺀다. 행렬의 크기가 서로 같은 경우에만 할 수 있다.
    $ \begin{bmatrix} x_{11} \quad x_{12} \\ x_{21} \quad x_{22} \end{bmatrix} \pm \begin{bmatrix} y_{11} \quad y_{12} \\ y_{21} \quad y_{22} \end{bmatrix} = \begin{bmatrix} x_{11} \pm y_{11} \quad x_{12} \pm y_{12} \\ x_{21} \pm y_{21} \quad x_{22} \pm y_{22} \end{bmatrix} $
  • 상수배
    마찬가지로 모든 원소에 해당 상수를 곱해 주면 된다.
    $ n \begin{bmatrix} x_{11} \quad x_{12} \\ x_{21} \quad x_{22} \end{bmatrix} = \begin{bmatrix} nx_{11} \quad nx_{12} \\ nx_{21} \quad nx_{22} \end{bmatrix} $
  • 곱셈
    역시 ‘크기가 맞는’ 경우에만 할 수 있는데, 행렬의 곱셈에서 ‘크기가 맞다’는 것은 앞 행렬의 열의 수(=한 행이 몇 개의 숫자로 되어 있는지)와 뒤 행렬의 행의 수(=한 열이 몇 개의 숫자로 되어 있는지)가 같다는 것이다. 아래 곱셈의 정의를 보면 명확할 것이다. 곱셈 결과 나오는 행렬의 크기는 (앞 행렬의 의 수)×(뒤 행렬의 의 수)가 된다. 즉, 앞 행렬이 m×n 크기이고 뒤 행렬이 n×r 크기인 경우 곱은 m×r 크기의 행렬이 된다.
    행렬의 곱셈을 각 성분 관점에서 보면 곱셈과 덧셈이 아울러 이루어지는데, 이 과정에서 앞 행렬의 행과 뒤 행렬의 열이 대응되는 특성이 있기 때문에 일반적으로 교환법칙이 성립하지 않는다.
    $ \begin{bmatrix} x_{11} \quad x_{12} \\ x_{21} \quad x_{22} \end{bmatrix} \begin{bmatrix} y_{11} \quad y_{12} \\ y_{21} \quad y_{22} \end{bmatrix} = \begin{bmatrix} x_{11}y_{11} + x_{12}y_{21} \quad x_{11}y_{12}+x_{12}y_{22} \\ x_{21}y_{11} + x_{22}y_{21} \quad x_{21}y_{12}+x_{22}y_{22} \end{bmatrix} $
    $ \neq \begin{bmatrix} y_{11} \quad y_{12} \\ y_{21} \quad y_{22} \end{bmatrix} \begin{bmatrix} x_{11} \quad x_{12} \\ x_{21} \quad x_{22} \end{bmatrix} = \begin{bmatrix} x_{11}y_{11} + x_{21}y_{12} \quad x_{12}y_{11} + x_{22}y_{12} \\ x_{11}y_{21} + x_{21}y_{22} \quad x_{12}y_{21}+x_{22}y_{22} \end{bmatrix} $

2.2. 특수한 행렬

  • 영행렬(zero matrix)
    모든 성분이 0인 행렬로, O로 적는다. 덧셈의 항등원(즉 A+O = O+A = A)이므로, 행렬환#s-3이나 행렬벡터공간의 영원이 된다. 크기가 맞는 임의의 행렬과 곱하면 영행렬이 된다.[4]
    $ \begin{bmatrix} 0 \quad 0 \\ 0 \quad 0 \end{bmatrix} \begin{bmatrix} x_{11} \quad x_{12} \\ x_{21} \quad x_{22} \end{bmatrix} = \begin{bmatrix} x_{11} \quad x_{12} \\ x_{21} \quad x_{22} \end{bmatrix} \begin{bmatrix} 0 \quad 0 \\ 0 \quad 0 \end{bmatrix} = \begin{bmatrix} 0 \quad 0 \\ 0 \quad 0 \end{bmatrix} $
  • 전치행렬(transpose)
    행렬 내의 원소를 \ 축을 기준으로 서로 위치를 바꾼 것. 즉 m×n 행렬의 전치행렬은 n×m 행렬이 된다. 텐서곱 연산의 필수요소다.
    $ \begin{bmatrix} x_{11} \quad x_{12} \\ x_{21} \quad x_{22} \end{bmatrix}^{T} = \begin{bmatrix} x_{11} \quad x_{21} \\ x_{12} \quad x_{22} \end{bmatrix} $
  • 제곱근행렬(Square root matrix)
    수의 제곱근처럼, 행렬도 제곱근을 정의할 수 있다. 그런데 행렬의 특성상 제곱근이 되는 행렬이 엄청나게 많다. 2×2단위행렬도 아래와 같이 제곱근행렬이 8개나 된다. 다른 행렬의 제곱근은 다 적기에는 여백이 없어서 굳이 언급하지 않겠다(...)
    $ \sqrt{\begin{bmatrix} 1 \quad 0 \\ 0 \quad 1 \end{bmatrix}} = {1 \over h} {\begin{bmatrix} b \quad a \\ a \quad -b \end{bmatrix}}, {1 \over h} {\begin{bmatrix} -b \quad -a \\ -a \quad b \end{bmatrix}}, {1 \over h} {\begin{bmatrix} -b \quad a \\ a \quad b \end{bmatrix}}, {1 \over h} {\begin{bmatrix} b \quad -a \\ -a \quad -b \end{bmatrix}}, \begin{bmatrix} 1 \quad 0 \\ 0 \quad 1 \end{bmatrix}, \begin{bmatrix} 1 \quad 0 \\ 0 \quad -1 \end{bmatrix}, \begin{bmatrix} -1 \quad 0 \\ 0 \quad 1 \end{bmatrix}, \begin{bmatrix} -1 \quad 0 \\ 0 \quad -1 \end{bmatrix} $
    여기서 $ a, b, h $ 는 피타고라스의 정리( $ a^2 + b^2 = h^2 $ )를 만족하는 자연수이다.

아래 내용은 정사각행렬에 관한 것이다. 정사각행렬을 모두 모으면 을 이룬다. 환에 관한 자세한 내용은 항목 참조.

  • 단위행렬(identity matrix)
    주대각선은 모두 1이고 나머지 성분은 모두 0인 행렬로, I 또는 E로 적는다. 단위행렬을 곱하여도 행렬에는 변화가 없다(즉 A I = A, I B = B[5]). 따라서 행렬환의 단위원, 즉 곱셈의 항등원이 된다.
    $ E = I = \begin{bmatrix} 1 \quad 0 \\ 0 \quad 1 \end{bmatrix}, \begin{bmatrix} 1 \quad 0 \quad 0 \\ 0 \quad 1 \quad 0 \\ 0 \quad 0 \quad 1 \end{bmatrix}, \begin{bmatrix} 1 \quad 0 \quad 0 \quad 0 \\ 0 \quad 1 \quad 0 \quad 0 \\ 0 \quad 0 \quad 1 \quad 0 \\ 0 \quad 0 \quad 0 \quad 1 \end{bmatrix} ... $
    한편, 기본행렬(elementary matrix)과 단위행렬과 다르다. 기본행렬은 단위행렬에 기초행 연산을 한 번 적용한 행렬로서, 기본행렬을 왼쪽에 곱하는 것은 대응하는 기초행 연산을 한 것과 동일한 결과가 된다.
  • 역행렬(inverse matrix)
    어떤 행렬의 곱셈에 대한 역원을 역행렬이라 한다. 모든 행렬이 역행렬을 갖는 것은 아니어서, 역행렬이 존재하는 행렬을 가역행렬(invertible matrix)이라고 한다. 즉, 가역행렬만이 역행렬을 갖는다.
    그렇다면 주어진 행렬이 언제 가역이 되는지가 문제이다. 아래 식에 따라 판별식(2×2 행렬의 경우에는 $ x_{11}x_{22} - x_{12}x_{21} $ , 3×3 행렬의 경우에는 $ x_{11}x_{22}x_{33} - x_{11}x_{23}x_{32} - x_{12}x_{21}x_{33} + x_{12}x_{23}x_{31} + x_{13}x_{21}x_{32} - x_{13}x_{22}x_{31} $ )이 0이 아니면 가역이 됨을 알 수 있다. 크기가 이보다 큰 행렬에서도 (전술했듯) 마찬가지로 판별식만 보면 알 수 있다. 일반적으로 R이 1을 갖는 가환환일 때, R 위의 정사각행렬이 가역인 것과 그 판별식이 가역인 것은 동치이다(!). 문제는 일반적인 n×n 행렬의 판별식을 어떻게 정의하느냐 하는 것이고, 이것이 학부 선형대수학의 전반부 대부분을 차지하는 내용이다.
    $ \begin{bmatrix} x_{11} \quad x_{12} \\ x_{21} \quad x_{22} \end{bmatrix}^{-1} = \frac{1}{x_{11}x_{22} - x_{12}x_{21}} \begin{bmatrix} x_{22} \quad -x_{12} \\ -x_{21} \quad x_{11} \end{bmatrix} $
    2×2행렬의 역행렬

    $ \begin{bmatrix} x_{11} \quad x_{12} \quad x_{13} \\ x_{21} \quad x_{22} \quad x_{23} \\ x_{31} \quad x_{32} \quad x_{33} \end{bmatrix}^{-1} = {1 \over x_{11}x_{22}x_{33} - x_{11}x_{23}x_{32} - x_{12}x_{21}x_{33} + x_{12}x_{23}x_{31} + x_{13}x_{21}x_{32} - x_{13}x_{22}x_{31}} \begin{bmatrix} x_{22}x_{33} - x_{23}x_{32} \quad x_{13}x_{32} - x_{12}x_{33} \quad x_{12}x_{23} - x_{13}x_{22} \\ x_{23}x_{31} - x_{21}x_{33} \quad x_{11}x_{33} - x_{13}x_{31} \quad x_{13}x_{21} - x_{11}x_{23} \\ x_{21}x_{32} - x_{22}x_{31} \quad x_{12}x_{31} - x_{11}x_{32} \quad x_{11}x_{22} - x_{12}x_{21} \end{bmatrix} $
    3×3행렬의 역행렬

2.3. 더 보기

----
  • [1] 예를 들어 행렬식을 구하는 경우, 3차 정사각행렬은 2차의 3배의 계산을, 4차 정사각행렬은 3차의 4배의 계산을 필요로 한다. 5차 정도 되면 맨손으로는 도저히 못 푼다.
  • [2] \ 방향을 축으로 해서 원소의 위치를 서로 바꿔치기하는 것
  • [3] 이공계에서 선형대수학은 정말 활용도가 높은 과목이기에 몇몇 특수한 학과가 아닌 이상 전부 이를 배우게 된다.
  • [4] 새로운 영행렬은 물론 크기가 달라질 수 있다.
  • [5] 여기서 AB는 크기만 맞으면 되지 정사각행렬일 필요가 없다는 데 유의하여야 한다.

Category