En la diagonalización se invierten los papeles, esta vez no son las matrices las que se usan como herramienta para estudiar espacios vectoriales y aplicaciones lineales, sino que son las aplicaciones lineales las que nos ayudan a resolver un problema cuyo enunciado es puramente matricial, que tiene múltiples aplicaciones en diversos campos:
El problema de la diagonalización
Dada una matriz cuadrada $A$, encontrar una matriz $D$ semejante a $A$ que sea diagonal.
Recordemos que dos matrices cuadradas $A$ y $D$ son semejantes si $D=P^{-1}AP$, para cierta matriz $P$ regular y que, según hemos visto, ésto es equivalente a que sean las matrices asociadas al mismo
endomorfismo respecto de distintas bases.
Dada $A \in {\mathfrak M}_n({\mathbb{K}})$, podemos considerar que $A$ es la
matriz asociada a un endomorfismo $f$ de ${\mathbb{K}}^n$ respecto de
la base canónica $B$ de ${\mathbb{K}}^n$.
Si $D=P^{-1}AP$ para una matriz regular $P$, entonces $D$ será la matriz
asociada a $f$ respecto de una nueva base $\overline{B}$ de ${\mathbb{K}}^n$ de forma que la
matriz del cambio de base de $\overline{B}$ a $B$ sea $P$, esto es:
Así pues, nuestro problema inicial se ha traducido en encontrar una base para la cual la matriz asociada a $f$ sea diagonal, veamos como ha de ser una tal base:
Si $\overline{B}=\{u_1, \dots ,u_n\}$, entonces la matriz asociada a $f$ respecto de $\overline{B}$ es la matriz cuyas columnas son las coordenadas respecto de $\overline{B}$ de los vectores $f(u_1), \dots , f(u_n)$ y por tanto para que ${\mathfrak M}_{\overline{B}}(f)$ sea la matriz diagonal:
$$
\begin{pmatrix}
\lambda_1 & 0 & \dots & 0 \\
0 & \lambda_2 & \dots & 0 \\
\vdots & \vdots & \ddots& \vdots \\
0 & 0 &\dots & \lambda _n
\end{pmatrix}
$$
ha de ser:
$$
\begin{array}{c}
f(u_1)=(\lambda_1,0, \dots ,0)_{\overline{B}}= \lambda_1 u_1 \\
f(u_2)=(0, \lambda_2, \dots ,0)_{\overline{B}}= \lambda_2 u_2 \\
\dots \\
f(u_n)=(0, 0, \dots ,\lambda_n)_{\overline{B}}= \lambda_n u_n \\
\end{array}
$$
Es decir, los vectores que formen parte de $\overline{B}$ han de cumplir que su imagen sea multiplo escalar de ellos. Los vectores con esta propiedad reciben el nombre de autovectores:
El vector $v \in {\mathbb{K}}^n$ es autovector de $f$ si existe $\lambda \in {\mathbb{K}}$ de forma que $f(v)=\lambda · v$.
El conjunto de todos los autovectores para un cierto $\lambda$:
$$V_{\lambda}=\{ v \in {\mathbb{K}}^n | f(v)=\lambda · v\}=\{ v \in {\mathbb{K}}^n | (f-\lambda·I)(v)\} =Ker(f-\lambda I)$$
es un subespacio que recibe el nombre de subespacio propio asociado a $\lambda$. Por supuesto, puede que sea el subespacio cero y de hecho lo será para casi todos los posibles valores de $\lambda$.
$\lambda \in {\mathbb{K}}$ es un autovalor de $f$ si existe un vector no nulo $v$ de forma que $f(v)=\lambda · v$, es decir, si $V_{\lambda} \neq 0$.
Pero puesto que $V_{\lambda}=Ker(f-\lambda I)$ tenemos que $dim(V_{\lambda})=n -rg(A-\lambda I)$
y por tanto:
$$ \lambda\; \hbox{ es autovalor de } A \Longleftrightarrow V_{\lambda} \neq 0 \Longleftrightarrow
rg(A-\lambda I) \neq n \Longleftrightarrow det(A-\lambda I)=0 $$
Podemos considerar $p(\lambda)= det(A-\lambda I)$ como polinomio en $\lambda$ (de grado $n$) y entonces, los autovalores de $A$ serán las raíces de éste polinomio, que se llama polinomio carácterístico de $A$.
ya que su ecuación matricial respecto de la base canónica es:
$$
\left(
\begin{array}{c}
y_1 \\ y_2 \\ y_3
\end{array}\right)
=\left(
\begin{array}{ccc}
3 & 1 & 1 \\
1 & 3 & 1 \\
1 & 1 & 3
\end{array}\right)
·
\left(
\begin{array}{c}
x_1 \\ x_2 \\ x_3
\end{array}\right)
$$
El vector $u=(1,-1,0)$ es un autovector de $A$ para el autovalor $\lambda =2$, ya que
$$
\left(
\begin{array}{ccc}
3 & 1 & 1 \\
1 & 3 & 1 \\
1 & 1 & 3
\end{array}\right)
·
\left(
\begin{array}{r}
1 \\ -1 \\ 0
\end{array}\right)
=
\left(
\begin{array}{r}
2 \\ -2 \\ 0
\end{array}\right)
= 2·
\left(
\begin{array}{r}
1 \\ -1 \\ 0
\end{array}\right)
$$
El vector $u=(1,1,0)$ no es un autovector de $A$, ya que
$$
\left(
\begin{array}{ccc}
3 & 1 & 1 \\
1 & 3 & 1 \\
1 & 1 & 3
\end{array}\right)
·
\left(
\begin{array}{r}
1 \\ 1 \\ 0
\end{array}\right)
=
\left(
\begin{array}{r}
4 \\ 4 \\ 2
\end{array}\right)
\neq \lambda ·
\left(
\begin{array}{r}
1 \\ 1 \\ 0
\end{array}\right); \;\;
\forall \lambda
$$
El número $1$ no es autovalor de $A$ puesto que sistema de ecuaciones dado por:
$$
\left(
\begin{array}{ccc}
3 & 1 & 1 \\
1 & 3 & 1 \\
1 & 1 & 3
\end{array}\right)
·
\left(
\begin{array}{r}
x_1 \\ x_2 \\ x_3
\end{array}\right)
=
1 ·
\left(
\begin{array}{r}
x_1 \\ x_2 \\ x_3
\end{array}\right)
$$
no tiene solución no trivial. De hecho es compatible determinado con única solución $x_1=0, x_2=0, x_3=0$, ya que la matriz de coeficientes del sistema es:
$$
A- 1· I =
\left(
\begin{array}{ccc}
2 & 1 & 1 \\
1 & 2 & 1 \\
1 & 1 & 2
\end{array}\right)
$$
que tiene rango $3$.
El número $5$ si es autovalor de $A$ puesto que sistema de ecuaciones dado por:
$$
\left(
\begin{array}{ccc}
3 & 1 & 1 \\
1 & 3 & 1 \\
1 & 1 & 3
\end{array}\right)
·
\left(
\begin{array}{r}
x_1 \\ x_2 \\ x_3
\end{array}\right)
=
5 ·
\left(
\begin{array}{r}
x_1 \\ x_2 \\ x_3
\end{array}\right)
$$
es compatible indeterminado, ya que la matriz de coeficientes del sistema es:
$$
A - 5· I
=
\left(
\begin{array}{ccc}
-2 & 1 & 1 \\
1 & -2 & 1 \\
1 & 1 & -2
\end{array}\right)
$$
que tiene rango $2$.
El polinomio característico de esta matriz es:
$$
p(\lambda)= det(A-\lambda I)=
\left|
\begin{array}{ccc}
3-\lambda & 1 & 1 \\
1 & 3-\lambda & 1 \\
1 & 1 & 3-\lambda
\end{array}\right|
=
-\lambda ^3 +9 \lambda ^2 - 24 \lambda +20
=
(2-\lambda)^2 (5-\lambda)
$$
Los autovalores de esta matriz son las raices de su polinomio característico, es decir $2$ y $5$.
Caracterización de las matrices diagonalizables
Para que una matriz $A$ cuadrada de orden $n$ sea diagonalizable, necesitamos que se pueda obtener una base de $\mathbb{K}^n$ formada por vectores propios de $A$. Nos podemos encontrar con dos posibles obstrucciones:
1. Que $p(\lambda)$ tenga raíces que no están en el cuerpo, que es probable si si se toma el cuerpo de los reales y no es problema en el caso del cuerpo de los complejos)
2. Que no haya suficientes vectores propios linealmente independientes para formar una base.
Llamaremos multiplicidad algebraica ($\alpha_i$) de un autovalor $\lambda _i$ a su multiplicidad como raíz del polinomio característico, y multiplicidad geométrica a la dimensión de su subespacio propio:
$$
d_i=dim (V_{\lambda_i})= n -rg(A-\lambda_i·I)
$$
El teorema que caracteriza qué matrices son diagonalizables es el siguiente
$A$ es diagonalizable en el cuerpo $\mathbb{K}$ si, y sólo si:
Todas las raíces $\lambda_1, \dots , \lambda_k$ de $p(\lambda)$ están en $\mathbb{K}$.
Para cada $i$, las multiplicidades algebraica y geométrica coinciden: $\alpha_i=d_i$.
Nótese que:
La primera condición se verifica automáticamente en el caso en que $\mathbb{K}=\mathbb{C}$.
En general se verifica que $1\leq d_i \leq \alpha_i$, con lo cual para autovalores simples se tiene que $\alpha_i$=1 implica que $d_i=1$.
El teorema espectral prueba que toda matriz simétrica es diagonalizable.