(!) {선형대수} 고유값과 고유벡터

아 근데 좀 맘에 안들어서 고쳐야 되는...

by mashed moshirakano

Aug 31. 2023

목차

머신러닝에서 고유값이 중요한 이유

고유값과 고유벡터의 정의

특성방정식

행렬식과의 관계

고유값 분해

대각화

머신러닝에서 고유값이 중요한 이유

고유값을 통해, 어떤 행렬 변환을 하나의 스칼라배로 나타낼 수 있다는 점이 가장 중요한 포인트이다. 즉, 행렬변환을 적은 데이터 양으로 나타내면서도 그 연산의 결과는 동일하게 얻을 수 있다는 것이다. 행렬을 하나의 스칼라값으로 압축하는 과정에서 해당 행렬의 가장 essential characteristic을 얻을 수 있기 때문에, 이 특징이 머신러닝에서 주요하게 도입되고 있는 것이다.

적용가능한 예시는 다음과 같다.

Dimensionality Reduction (e.g. PCA)

Linear Transformations 의 해석 (행렬을 늘리거나 압축시키기, 어떤 방향으로 얼만큼의 크기가 변형되었는지 등)

Spectral Clustering

Graph-based Learning (라플라시안 행렬을 통해 그래프 구조상에서의 연결성을 포착)

Neural Networks (신경망의 가중치 행렬을 분석- stability, convergence, and generalization properties)

고유값과 고유벡터의 정의

선형 변환의 고유벡터; eigenvector는 그 선형 변환이 일어난 후에도 방향이 변하지 않는, 0이 아닌 벡터이다. 고유 벡터의 길이가 변하는 배수를 선형 변환의 그 고유 벡터에 대응하는 고유값; eigenvalue이라고 한다. 선형 변환은 대개 고유 벡터와 그 고윳값만으로 완전히 설명할 수 있다 (wikipedia)

특성방정식

https://gosamy.tistory.com/355

특성다항식(Characteristic polynomial)

고유값 문제를 해결하기 위해서는 꼭 특성다항식을 풀 수 있어야 합니다. 그런데 특성다항식이 왜 0이 되어야 하는지, 곧 행렬식이 왜 0이 되어야 하는지를 이해하기 위해서는 행렬의 가역성 또

https://gosamy.tistory.com/355

위의 블로그가 잘 나와있네.

행렬식과의 관계

들어가기전에

행렬식(determinant)이란, 어떤 정사각 행렬을 스칼라값에 “mapping”하는 연산(함수)으로 생각할 수 있다. 정사각 행렬의 행렬식의 절댓값은 그 행렬이 나타내는 선형변환이 부피를 확대시키는 양을 나타내고, 행렬식의 부호는 방향 보존여부를 나타낸다 (wikipedia) 또한 matrix가 invertible인지(역행렬이 존재하는지)를 알 수 있다.

행렬식과 고유값 간의 관계

행렬식과 고유값 사이에는 다음의 성질이 성립한다.

임의의 행렬 A에 대해, det(A)는 A의 모든 고유값의 곱과 같다. 이에 대한 전개는 stackexchange에서 달린 답변을 그저 가져와본다. 위에서 배운 특성 방정식을 n차 다항식으로 전개한 뒤, lambda에 0을 대입하여 정리하면 얻을 수 있다.

stackexchange

고유값의 또 다른 성질로는, 모든 고유값의 합은 trace(대각합)과 같다.

데이터사이언스 스쿨-고유값 분해

선형 변환의 부피

앞서, 행렬식이 선형변환의 부피의 증감 정도를 나타낸다고 했다. 고유값을 통해 이에 대한 인사이트를 얻을 수 있다. 먼저, 평행사변형의 넓이 = absinx 라는 공식을 떠올려보자.

만약, 이 평행사변형을 이루는 두 변 a, b가 늘어나면 어떻게 될까? 예를 들어 a는 2배, b는 3배 늘어난다면, 늘어난 평행사변형의 넓이는 (2a)*(3b)sinx = 6absinx 가 될 것이다.

고유값은 고유 벡터를 얼마나 늘리느냐를 의미한다고 했다. 그리고 위의 평행사변형의 넓이의 증감 예시처럼, 부피가 얼마나 커지는 지 알려면 그 부피를 이루는 벡터들이 얼마나 늘어났는지를 알면 된다. 결국, 모든 고유 벡터들이 각각 늘어난 정도를 곱해주면, 전체 부피가 늘어난 정도를 알 수 있다. 정확하게는, |모든 고유값의 곱|(=행렬식)은, 선형변환의 부피변화를 정량화한 값을 나타낸다.

자, 행렬식이 선형변환의 부피변화를 정량화한 값이라면, 우리는 행렬식을 (선형변환 후의 부피) / (선형변환 전의 부피) 로도 나타낼 수 있을 것이다. 이를 통해, 행렬식 값에 따른 부피 변화를 아래의 4가지 경우로 나눠서 해석해볼 수 있다.

(1) |det(X)| = 0이면, X는 적어도 한개 이상의 차원에서 "공간을 뭉개버리기" 때문에, 그 결과 전체 부피도 아예 0이 되어버린다. 모든 고유값 중 적어도 한개 이상의 고유값이 0이 되었기 때문에, "공간이 뭉개졌다"고 표현했다.

(2) 0 < |det(X)| < 1이면, (X에) 곱해지는 임의의 텐서의 부피를 수축시킨다.

(3) |det(X)| = 1 이면, 곱해지는 임의의 텐서의 부피를 완벽하게 보존한다.

(4) |det(X)| > 1 이면, 곱해지는 임의의 텐서의 부피를 확장시킨다.

아래의 조악한 필기를 통해, |det(X)|=0일 때 행렬 곱 전후의 텐서의 부피가 동일한 예시를 살펴보자.

행렬 곱 이후의 벡터들은 원래의 기저 벡터들의 span 위에 움직이고 있다. 이를 통해, 두 기저벡터들이 고유벡터임을 알 수 있다. 그리고 위의 고유벡터들의 고유값은 각각 -0.5, 2이다.

행렬 곱 이후, 두 벡터가 이루는 사각형의 모양은 매우 달라졌지만, 그 크기(1)는 동일한 것을 볼 수 있다 (앞서, 우리는 |det(X)| = 1임을 확인했기 때문에, 행렬곱에 의해 곱해지는 텐서의 부피가 보존될 것이라는 것을 알 수 있었다)

singular matrix

정방행렬 A의 역행렬이 존재하지 않을 때, 행렬 A가 singular하다고 한다. 즉, det(X) = 0 이면, 역행렬을 가질 수 없기 때문에 X는 singular matrix가 된다. 따라서, singular matrix는 다음의 특성도 가지게 된다.

X의 열벡터들이 linearly dependent하다.

해가 없거나, 무한히 많은 경우

고유값이 최소한 하나라도 0이다.

선형변환의 방향

유튜브에서 봤는데, 출처를 잃어버렸다..ㅠ

고유값 분해

고유값 분해(eigen decomposition)는 고유값과 고유벡터로부터 유도되는 고유값 행렬과 고유벡터 행렬에 의해 분해될수있는 행렬의 표현이다. 선형대수학에서 , 고유값 분해 또는 고유 분해(때때로 스펙트럼 분해)는 매트릭스(행렬)를 정형화된 형태로 분해함으로써 행렬이 고유값 및 고유 벡터로 표현된다. 대각화 가능 행렬만이 인수분해될 수 있다 (wikipedia)