Inhalt

16.1 Das charakteristische Polynom

Sei \(K\) ein Körper. Sei \(V\) ein endlichdimensionaler \(K\)-Vektorraum und \(f\colon V\to V\) ein Endomorphismus von \(V\). Wir haben in der Linearen Algebra 1 den Begriff des Eigenwerts definiert und gesehen, dass \(\lambda \in K\) genau dann ein Eigenwert von \(f\) ist, wenn \(\det (f-\lambda \, \operatorname{id}_V) = 0\) gilt, oder äquivalent, wenn \(\det (\lambda \, \operatorname{id}_V-f) = 0\) gilt. Man kann also alle Eigenwerte von \(f\) finden, indem man alle \(\lambda \) findet, für die \(\det (\lambda \, \operatorname{id}_V-f) = 0\) ist; das führt auf eine polynomiale Gleichung für \(\lambda \), in der \(\lambda ^n\) und (in der Regel) kleinere Potenzen von \(\lambda \) auftreten. Mit der neu eingeführten Sprache der Polynomringe und des Einsetzungshomomorphismus können wir die Theorie der Teilbarkeit in Polynomringen und der eindeutigen Primfaktorzerlegung hier mit einigem Nutzen anwenden, und wir machen daher die folgende Definition. (Wir bevorzugen jetzt die Version mit \(\det (\lambda \, \operatorname{id}_V-f) = 0\), die vielleicht zunächst etwas unnatürlicher aussieht(?), aber den Vorteil hat, dass das im folgende definierte charakteristische Polynom von \(f\) normiert ist.)

Definition 16.1
  1. Sei \(n\ge 0\) und \(A\in M_{n}(K)\). Dann heißt das Polynom \(\operatorname{charpol}_A(X):=\det (XE_n-A)\in K[X]\) das charakteristische Polynom der Matrix \(A\).

  2. Sei \(f\colon V\rightarrow V\) ein Endomorphismus des endlichdimensionalen \(K\)-Vektorraums \(V\), \(\mathscr B\) eine Basis von \(V\), \(A = M_{\mathscr B}^{\mathscr B}(f)\). Dann ist \(\operatorname{charpol}_A(X)\) unabhängig von der Wahl der Basis \(\mathscr B\) und heißt das charakteristische Polynom des Endomorphismus \(f\). Wir bezeichnen dieses Polynom mit \(\operatorname{charpol}_f\in K[X]\).

Hier ist \(XE_n -A\) eine Matrix mit Einträgen im Polynomring \(K[X]\), also ein Element von \(M_n(K[X])\). Wie in Abschnitt 15.6 erklärt, ist die Determinante einer solchen Matrix durch die Leibniz-Formel definiert, wir können also das charakteristische Polynom der Matrix \(A\) schreiben als

\[ \operatorname{charpol}_A = \sum _{\sigma \in S_n}\operatorname{sgn}(\sigma )\prod _{i=1}^n (\delta _{i,\sigma (i)} X - a_{i,\sigma (i)}), \]

wobei wir

\[ \delta _{i,j} = \begin{cases} 1 & \text{wenn}\ i=j \\ 0 & \text{wenn}\ i\ne j \end{cases}\qquad \text{(Kronecker-delta)} \]

setzen. Für die Definition des charakteristischen Polynoms kann man also auf die Diskussion in Abschnitt 15.6 verzichten. Um die Aussage über die Unabhängigkeit in Teil (2) zu beweisen, die aus dem nächsten Lemma folgt (bzw. dazu äquivalent ist), benutzen wir aber Satz 15.72.

Das Lemma besagt, das zueinander konjugierte Matrizen dasselbe charakteristische Polynom haben. Insbesondere ist das charakteristische Polynom für alle darstellenden Matrizen eines Endomorphismus dasselbe (natürlich muss »oben und unten« dieselbe Basis verwendet werden).

Lemma 16.2

Seien \(K\) ein Körper, \(n\in \mathbb N\), \(A\in M_n(K)\) und \(S\in GL_n(K)\). Dann gilt

\[ \operatorname{charpol}_A = \operatorname{charpol}_{SAS^{-1}}. \]

Beweis

Wir können \(S\) und \(S^{-1}\) als Elemente von \(M_n(K[X])\) auffassen und haben dann nach Satz 15.72, dass

\[ \det (XE_n - SAS^{-1}) = \det (S(XE_n - A)S^{-1}) = \det (S) \det (XE_n-A)\det (S^{-1}) = \det (XE_n-A). \]

Das ist die Behauptung des Lemmas.

Beispiel 16.3

Wir berechnen das charakteristische Polynom in einigen konkreten Beispielen. Im Prinzip ist klar, was zu tun ist: Es ist eine Determinante auszurechnen, und dafür kann man die üblichen Verfahren benutzen.

  1. Sei

    \[ A = \begin{pmatrix} 1 & 0 & 2 \\ 2 & 1 & 0 \\ 0 & 1 & 1 \end{pmatrix} \in M_3(\mathbb Q). \]

    Es gilt

    \begin{align*} \operatorname{charpol}_A & = \det (XE_3-A) \\ & =\det \begin{pmatrix} X-1 & 0 & -2 \\ -2 & X-1 & 0 \\ 0 & -1 & X-1 \end{pmatrix} = (X-1)^3 - 2 \cdot 2 \\ & = X^3 - 3X^2 +3X -5, \end{align*}

    wobei zur Berechnung der Determinante nach der ersten Zeile entwickelt wurde.

  2. Sei \(K\) ein Körper und \(A = \begin{pmatrix} a & b \\ c & d \end{pmatrix}\in M_2(K)\). Dann gilt

    \[ \operatorname{charpol}_A = \det \begin{pmatrix} X-a & -b \\ -c & X-d \end{pmatrix} = (X-a)(X-d) - bc = X^2 - (a+d) X + (ad-bc). \]

    Der Absolutterm ist also \(\det (A)\), der Koeffizient von \(X\) ist \(-\operatorname{Spur}(A)\) (siehe auch unten).

  3. Seien \(K\) ein Körper, \(n\in \mathbb N\) und sei \(A = (a_{ij})_{i,j}\in M_n(K)\) eine obere Dreiecksmatrix. Dann ist auch \(XE_n-A\) eine obere Dreiecksmatrix und folglich gilt

    \[ \operatorname{charpol}_A = (X-a_{11})\cdot \cdots \cdot (X-a_{nn}). \]

Alle Aussagen über das charakteristische Polynom lassen zwei Fassungen zu, eine für Matrizen und eine analoge für Endomorphismen eines endlichdimensionalen Vektorraums. Die Übersetzung zwischen den beiden Sichtweisen ist einfach, so dass wir im folgenden meist nur eine der beiden Versionen explizit ausschreiben – je nachdem, wie der Beweis natürlicher ist.

Lemma 16.4

Sei \(A\in M_n(K)\). Dann gilt

\[ \operatorname{charpol}_A = X^n + a_{n-1}X^{n-1} + \cdots + a_1 X + a_0, \]

d.h. \(\operatorname{charpol}_A\) ist normiert vom Grad \(n\). Außerdem ist \(a_0 = \det (-A) = (-1)^n \det A\).

Beweis

Dass das charakteristische Polynom normiert vom Grad \(n\) ist, folgt aus der Definition und der Leibniz-Formel. Dass wir ein normiertes Polynom erhalten, ist der Grund, warum wir mit \(\det (XE_n-A)\) statt mit \(\det (A-XE_n)\) arbeiten (aber es gibt auch Quellen, die es anders machen).

Außerdem gilt \(a_0 = \operatorname{charpol}_A(0) = \det (0\cdot E_n - A) = (-1)^n\det (A)\). Beim mittleren Gleichheitszeichen benutzen wir Lemma 15.71 für den Einsetzungshomomorphismus \(K[X]\to K\), \(X\mapsto 0\).

Das folgende einfache Lemma ist mehrfach nützlich.

Lemma 16.5

Seien \(K\) ein Körper, \(V\) ein endlichdimensionaler \(K\)-Vektorraum und \(f\) ein Endomorphismus von \(V\). Sei \(U\subseteq V\) ein Untervektorraum mit \(f(U)\subseteq U\) und sei \(W\subseteq V\) ein Komplementärraum zu \(U\).

Sei \(g:=f_{|U}\) die Einschränkung von \(f\) auf \(U\), und sei \(h\) die Verkettung

\[ W \to V\xrightarrow {f} V\to W, \]

wobei links die Inklusion von \(W\) nach \(V\) und rechts die Projektion von \(V = U\oplus W\) auf \(W\) steht (also die Abbildung \(U\oplus W\to W\), \(u+w\mapsto w\) (\(u\in U\), \(w\in W\))).

Dann gilt

\[ \operatorname{charpol}_f = \operatorname{charpol}_g\cdot \operatorname{charpol}_h. \]

Beweis

Übung.

Wir haben die Definition des charakteristischen Polynoms damit motiviert, dass seine Nullstellen, bzw. äquivalent die Nullstellen der zugehörigen Polynomfunktion gerade die Eigenwerte der zugehörigen Matrix bzw. des zugehörigen Endomorphismus sind. Das halten wir noch einmal im folgenden Satz fest.

Satz 16.6

Seien \(K\) ein Körper, \(V\) ein endlichdimensionaler \(K\)-Vektorraum und \(f\colon V\to V\) ein Endomorphismus. Es bezeichne \(\operatorname{charpol}_f\) das charakteristische Polynom von \(f\). Ein Element \(\lambda \in K\) ist genau dann eine Nullstelle von \(\operatorname{charpol}_f\), wenn \(\lambda \) ein Eigenwert von \(f\) ist.

Wir können aber den Satz noch präzisieren.

Satz 16.7

Seien \(K\) ein Körper, \(V\) ein endlichdimensionaler \(K\)-Vektorraum und \(f\colon V\to V\) ein Endomorphismus. Es bezeichne \(\chi :=\operatorname{charpol}_f\) das charakteristische Polynom von \(f\).

  1. Sei \(\lambda \in K\). Es gilt \(\operatorname{mult}_\lambda (\chi ) {\gt} 0\) genau dann, wenn \(\lambda \) ein Eigenwert von \(f\) ist.

    In diesem Fall gilt

    \[ \dim V_\lambda (f) \le \operatorname{mult}_\lambda (\chi ). \]

    Man nennt \(\dim V_\lambda (f)\) auch die geometrische Vielfachheit und \(\operatorname{mult}_\lambda (\chi )\) die algebraische Vielfachheit des Eigenwerts \(\lambda \).

  2. Der Endomorphismus \(f\) ist genau dann diagonalisierbar, wenn \(\operatorname{charpol}_f\) vollständig in Linearfaktoren zerfällt und für alle Eigenwerte \(\lambda \) von \(f\) die Gleichheit \(\dim V_\lambda (f) = \operatorname{mult}_\lambda (\chi )\) gilt.

Beweis

zu (1). Dass \(\operatorname{mult}_\lambda (\chi ) {\gt} 0\) gilt, ist dazu äquivalent, dass \(\lambda \) eine Nullstelle von \(\chi \) ist, also dass \(\det (\lambda \operatorname{id}-f) = 0\) gilt. Wie oben besprochen, heißt das genau, dass \(\lambda \) ein Eigenwert von \(f\) ist.

Um die Abschätzung \(\dim V_\lambda (f) \le \operatorname{mult}_\lambda (\chi )\) zu zeigen, nutzen wir aus, dass wir \(\operatorname{charpol}_f\) als das charakteristische Polynom der darstellenden Matrix von \(f\) bezüglich einer Basis unserer Wahl berechnen können. Die Basis, die wir betrachten wollen, konstruieren wir, indem wir eine Basis von \(V_\lambda (f)\) zu einer Basis \(\mathscr B\) von \(V\) ergänzen. Dann sind die ersten \(r:=\dim (V_\lambda (f))\) Vektoren in dieser Basis Eigenvektoren von \(f\) zum Eigenwert \(\lambda \). Die Matrix \(M^\mathscr B_\mathscr B(f)\) hat also die Form \(\begin{pmatrix} \lambda E_r & B \\ 0 & D \end{pmatrix}\) (als Blockmatrix geschrieben). Es gilt dann \(\operatorname{charpol}_f = \operatorname{charpol}_{\lambda E_r}\cdot \operatorname{charpol}_D = (X-\lambda )^r \operatorname{charpol}_D\) (diese Rechnung kann man als einen Spezialfall von Lemma 16.5 betrachten), also \(\operatorname{mult}_\lambda (\chi ) \ge r\).

zu (2). Dass \(f\) diagonalisierbar ist, ist dazu äquivalent, dass die (direkte) Summe der Eigenräume von \(A\) gleich \(V\) ist, also dazu, dass die Summe der Dimensionen aller Eigenräume zu den verschiedenen Eigenwerten gleich \(n\) ist. Nun ist \(\deg (\chi ) = n\), und die Summe der Vielfachheiten der Nullstellen von \(\chi \) ist genau dann \(n\), wenn \(\chi \) vollständig in Linearfaktoren zerfällt. Das Kriterium folgt deswegen aus Teil (1).

Die Bedingung, dass das charakteristische Polynom eines Endomorphismus (bzw. einer Matrix) vollständig in Linearfaktoren zerfällt, hat (auch unabhängig von der Frage, ob die geometrischen und algebraischen Vielfachheiten der Eigenwerte übereinstimmen) eine natürliche Interpretation. Dazu machen wir die folgende Definition.

Definition 16.8

Eine Matrix \(A\in M_{n}(K)\) heißt trigonalisierbar, wenn \(A\) zu einer oberen Dreiecksmatrix konjugiert ist. Ein Endomorphismus von \(V\) heißt trigonalisierbar, wenn eine Basis \(\mathscr B\) von \(V\) existiert, so dass die beschreibende Matrix \(M^\mathscr B_\mathscr B(f)\) bezüglich dieser Basis eine obere Dreiecksmatrix ist.

Satz 16.9

Seien \(K\) ein Körper und \(V\) ein endlichdimensionaler \(K\)-Vektorraum. Ein Endomorphismus \(f\) von \(V\) ist genau dann trigonalisierbar, wenn sein charakteristisches Polynom vollständig in Linearfaktoren zerfällt.

Beweis

Das charakteristische Polynom einer oberen Dreiecksmatrix zerfällt offenbar vollständig in Linearfaktoren (Beispiel 16.3 (3)), also gilt das auch für trigonalisierbare Endomorphismen.

Um die Umkehrung zu zeigen, führen wir Induktion nach der Dimension \(n\) des Vektorraums \(V\). Im Fall \(n\le 1\) ist jede \((n\times n)\)-Matrix eine obere Dreiecksmatrix. Sei nun \(n {\gt} 1\) und sei \(f\) ein Endomorphismus, dessen charakteristisches Polynom vollständig in Linearfaktoren zerfällt. Dann besitzt das charakteristische Polynom eine Nullstelle \(\lambda \), also hat \(f\) einen Eigenvektor \(v\in V \setminus \{ 0\} \).

Wir setzen \(b_1 :=v\) und ergänzen diesen Vektor (der ja \(\ne 0\) ist, weil es sich um einen Eigenvektor handelt) zu einer Basis \(\mathscr B= (b_1, \dots , b_n)\). Aus Lemma 16.5, angewandt auf die Zerlegung \(V = U\oplus W\) mit \(U:= \langle b_1\rangle \) und \(W=\langle b_2,\dots , b_n\rangle \), folgt

\[ \operatorname{charpol}_f = (X-\lambda )\cdot \operatorname{charpol}_h, \]

wobei \(h\colon W\to W\) die in Lemma 16.5 beschriebene Abbildung ist.

Weil \(\operatorname{charpol}_f\) vollständig in Linearfaktoren zerfällt, folgt aus der Eindeutigkeit der Primfaktorzerlegung im Ring \(K[X]\), dass das auch für \(\operatorname{charpol}_h\) gilt. Nach Induktionsvoraussetzung existiert also eine Basis \(\mathscr C= (c_2, \dots , c_n)\) von \(W\), so dass \(M^\mathscr C_\mathscr C(g)\) eine obere Dreiecksmatrix ist. Die Matrix, die \(f\) bezüglich der Basis \((b_1, c_2, \dots , c_n)\) darstellt, hat die Form

\[ \begin{pmatrix} \lambda & \ast \\ 0 & M^\mathscr C_\mathscr C(h) \end{pmatrix} \]

und ist mithin eine obere Dreiecksmatrix. Also ist \(f\) trigonalisierbar.

16.1.1 Die Spur einer Matrix

Wir kommen noch einmal auf die Spur einer Matrix (oder eines Endomorphismus) zurück, siehe Abschnitt I.9.4. Für eine Matrix \(A = (a_{ij})_{i,j}\in M_n(K)\) haben wir

\[ \operatorname{Spur}(A) = \sum _{i=1}^n a_{ii} \in K \]

definiert. Die Spur von \(A\) ist also einfach die Summe der Diagonaleinträge. Wir haben gezeigt (Korollar I.9.37), dass zueinander konjugierte Matrizen dieselbe Spur haben, so dass wir die Spur eines Endomorphismus \(f\) als die Spur irgendeiner darstellenden Matrix von \(f\) bezüglich einer Basis des zugrundeliegenden Vektorraums definieren können. Das Ergebnis ist unabhängig von der Wahl der Basis.

Mithilfe des charakteristischen Polynoms erhalten wir einen neuen Beweis, dass zueinander konjugierte Matrizen dieselbe Spur haben, denn es gilt:

Lemma 16.10
  1. Sei \(A\in M_n(K)\), und schreibe \(\operatorname{charpol}_A = X^n + a_{n-1}X^{n-1} + \cdots + a_1 X + a_0\). Dann gilt \(\operatorname{Spur}(A) = -a_{n-1}\).

  2. Ist \(f\) ein Endomorphismus eines \(n\)-dimensionalen Vektorraums \(V\) mit \(\operatorname{charpol}_f = X^n + a_{n-1}X^{n-1} + \cdots + a_1 X + a_0\), so gilt \(\operatorname{Spur}(f) = -a_{n-1}\).

Beweis

zu (1). Die Behauptung folgt leicht aus der Definition des charakteristischen Polynoms als Determinante und aus der Leibniz-Formel. Ein Summand der Leibnizformel, etwa zu einer Permutation \(\sigma \in S_n\), kann nämlich nur dann einen Beitrag zum Koeffizienten von \(X^{n-1}\) liefern, wenn in dem zugehörigen Produkt mindestens \(n-1\) der Diagonaleinträge von \(X E_n-A\) auftreten, also \(\sigma (i)=i\) für alle bis auf höchstens ein \(i\) in \(\{ 1, \dots , n\} \) gilt. Dann muss aber \(\sigma = \operatorname{id}\) sein. Der zur Identität gehörige Summand ist \(\prod _{i=1}^n (X-a_{ii})\), und der Koeffizient von \(X^{n-1}\) in diesem Ausdruck ist \(-\sum _{i=1}^n a_{ii}\).

Teil (2) folgt nun, indem wir den ersten Teil auf eine darstellende Matrix von \(f\) anwenden.