Inhalt

17.1 Aussage und Eindeutigkeit

Matrizen in Jordanscher Normalform sind Block-Diagonalmatrizen, und die Blöcke auf der Diagonale sind besonders einfache obere Dreiecksmatrizen, die Jordan-Blöcke heißen und folgendermaßen definiert sind.

Definition 17.1

Seien \(K\) ein Körper, \(\lambda \in K\) und \(r\ge 1\). Dann heißt die Matrix

\[ J_{r,\lambda } = \begin{pmatrix} \lambda & 1 \\ & \lambda & 1 \\ & & \ddots & \ddots \\ & & & \lambda & 1 \\ & & & & \lambda \end{pmatrix} \quad \in M_r(K) \]

der Jordan-Block der Größe \(r\times r\) mit Diagonaleintrag \(\lambda \).

Es sind also alle Diagonaleinträge der Matrix gleich \(\lambda \), die Einträge auf der Nebendiagonalen direkt oberhalb der Diagonalen sind \(=1\), und alle anderen Einträge der Matrix sind \(=0\).

Da es sich bei dem Jordan-Block \(J_{r,\lambda }\) um eine obere Dreiecksmatrix handelt, ist klar, dass \(\lambda \) der einzige Eigenwert von \(J_{r,\lambda }\) ist.

Eine besondere Rolle spielen später die Jordan-Blöcke \(J_{r, 0}\) mit Diagonaleintrag \(0\). Wie man leicht nachrechnet (Sie sollten das tun!), gilt \(J_{r,0}^r = 0\) und \(J_{r,0}^i\ne 0\) für \(0\le i {\lt} r\). Alternativ lässt sich das leicht begründen, indem man den zu \(J_{r, 0}\) gehörigen Endomorphismus von \(K^r\) betrachtet.

Damit können wir definieren, was wir unter einer Matrix in Jordanscher Normalform verstehen wollen. Wir benutzen die Schreibweise \(\operatorname{diag}(A_1, \dots , A_r)\) um eine Block-Diagonalmatrix zu bezeichnen.

Definition 17.2

Seien \(K\) ein Körper und \(n\in \mathbb N\). Wir sagen, eine Matrix \(A\in M_{n}(K)\) habe Jordansche Normalform (JNF), falls \(r_1, \dots , r_k\ge 1\) und \(\lambda _1,\dots \lambda _k\in K\) existieren, so dass

\[ A = \operatorname{diag}(J_{r_1, \lambda _1}, \dots , J_{r_k, \lambda _k}) \]

ist.

Die \(\lambda _i\) müssen hier nicht paarweise verschieden sein, sondern derselbe Eigenwert kann in mehreren Blöcken auftreten, und es kann auch mehrere Blöcke derselben Größe zum selben oder zu unterschiedlichen Eigenwerten geben. Zum Beispiel hat jede Diagonalmatrix Jordansche Normalform – dann haben alle Blöcke die Größe \(1\times 1\).

Der Satz über die Jordansche Normalform besagt, dass jede trigonalisierbare Matrix konjugiert ist zu einer Matrix in Jordanscher Normalform, und dass letztere bis auf die Reihenfolge der Blöcke eindeutig bestimmt ist.

Theorem 17.3 Jordansche Normalform für Matrizen

Seien \(K\) ein Körper und \(n\in \mathbb N\). Sei \(A\in M_{n}(K)\) eine trigonalisierbare Matrix. Dann existieren \(S\in GL_n(K)\) und \(r_1, \dots , r_k\ge 1\), \(\lambda _1,\dots \lambda _k\in K\), so dass

\[ S A S^{-1} = \operatorname{diag}(J_{r_1, \lambda _1}, \dots , J_{r_k, \lambda _k}) \]

ist. Dabei ist die Zahl \(k\) eindeutig bestimmt (also unabhängig von \(S\)) und die Paare \((r_1,\lambda _1), \dots , (r_k, \lambda _k)\) sind eindeutig bestimmt bis auf ihre Reihenfolge.

Wie wir in Satz 16.9 gesehen haben, ist die Bedingung, dass \(A\) trigonalisierbar sei, dazu äquivalent, dass das charakteristische Polynom von \(A\) vollständig in Linearfaktoren zerfällt.

Es ist klar, dass die Reihenfolge, in der die Blöcke in der Matrix auftreten, nicht eindeutig bestimmt sind: Wenn sich zwei Block-Diagonalmatrizen \(A\) und \(B\) nur hinsichtlich der Reihenfolge unterscheiden, in der die Blöcke auf der Diagonalen stehen, aber die Blöcke ansonsten übereinstimmen, dann existiert eine Permutationsmatrix \(P\) mit \(B=PAP^{-1}\).

Mit dem Beweis dieses Theorems werden wir den überwiegenden Teil dieses Kapitels verbringen. Wir beginnen damit, einige Konsequenzen des Theorems zu beleuchten.

Satz 17.4

Seien \(K\) ein Körper, \(n\in \mathbb N\) und sei

\[ A = \operatorname{diag}(J_{r_1, \lambda _1}, \dots , J_{r_k, \lambda _k})\in M_n(K) \]

eine Matrix in Jordanscher Normalform über \(K\).

  1. Es gilt

    \[ \operatorname{charpol}_A = \prod _{i=1}^k (X-\lambda _i)^{r_i}. \]
  2. Wenn \(\mu _1, \dots , \mu _s\) die paarweise verschiedenen Eigenwerte von \(A\) und \(m_i\) die Größe des größten Jordan-Blocks zu \(\mu _i\) bezeichnen, dann ist

    \[ \operatorname{minpol}_A = \prod _{i=1}^s (X-\mu _i)^{m_i}. \]

Beweis

zu (1). Dies ist leicht zu sehen, da die einzelnen Jordan-Blöcke und damit auch jede Matrix in Jordanscher Normalform obere Dreiecksmatrizen sind.

zu (2). Weil für \(r {\gt} 0\) gilt, dass \(J_{r, 0}^r = 0\) ist, ist

\[ \prod _{i=1}^s (A-\mu _i E_{n})^{m_i} = 0, \]

also gilt \(\operatorname{minpol}_A \, |\, \prod _{i=1}^s (X-\mu _i)^{m_i}\).

Weil \(J_{r, 0}^{r-1}\ne 0\) ist, und für \(\lambda \ne 0\) alle Potenzen von \(J_{r, \lambda }\) von Null verschieden sind, folgt, dass kein echter Teiler dieses Produkts die Matrix \(A\) annulliert, und das impliziert die behauptete Gleichheit.

Wie üblich haben wir eine analoge Fassung für Endomorphismen endlichdimensionaler Vektorräume.

Theorem 17.5 Jordansche Normalform für Endomorphismen

Seien \(K\) ein Körper und \(V\) ein endlichdimensionaler \(K\)-Vektorraum. Sei \(f\) ein trigonalisierbarer Endomorphismus von \(V\).

Dann existieren eine Basis \(\mathscr B\) von \(V\) und \(r_1, \dots , r_k\ge 1\), \(\lambda _1,\dots \lambda _k\in K\), so dass

\[ M^\mathscr B_\mathscr B(f) = \operatorname{diag}(J_{r_1, \lambda _1}, \dots , J_{r_k, \lambda _k}) \]

ist. Dabei ist die Zahl \(k\) eindeutig bestimmt (also unabhängig von der Wahl von \(\mathscr B\)) und die Paare \((r_1,\lambda _1), \dots , (r_k, \lambda _k)\) sind eindeutig bestimmt bis auf ihre Reihenfolge.

Es wird nicht behauptet, dass die Basis \(\mathscr B\) im Satz eindeutig bestimmt sei (und schon das Beispiel der Identitätsabbildung \(\operatorname{id}_V\) zeigt, dass es im allgemeinen viele Möglichkeiten gibt, eine solche Basis zu wählen). Eine solche »Jordanbasis« \(\mathscr B\) zu berechnen ist (möglich, aber meistens) eine ziemlich aufwändige Rechnung. Siehe Ergänzung 17.24.

Der Beweis des Satzes über die Jordansche Normalform ist nicht einfach. Um die einzelnen Schritte zu verstehen, ist es vielleicht nützlich, sich zunächst klarzumachen, dass die behaupteten Aussagen für eine Matrix, die schon Jordansche Normalform hat, »offensichtlich« sind. In diesem Sinne arbeiten wir uns schrittweise vor und beweisen, dass jede trigonalisierbare gewisse Eigenschaften hat, die wir an einer Matrix in Jordanscher Normalform direkt ablesen können.

Etwas konkreter suchen wir (für einen gegebenen trigonalisierbaren Endomorphismus \(f\) eines endlichdimensionalen \(K\)-Vektorraums \(V\)) eine Basis \(\mathscr B\), so dass \(M^\mathscr B_\mathscr B(f)\) in Jordanscher Normalform ist.

  • Wenn wir die Basis \(\mathscr B\) entsprechend der Darstellung von \(M^\mathscr B_\mathscr B(f)\) als Block-Diagonalmatrix »zerlegen«, entspricht dem eine Zerlegung von \(V\) als direkte Summe \(f\)-invarianter Unterräume. Unser erstes Ziel wird sein, für gegebenes \(V\) und \(f\) die Existenz einer (im allgemeinen etwas gröberen) Zerlegung \(V=\bigoplus _i \tilde{V}_i\) zu zeigen, in der die verschiedenen Eigenwerte von \(f\) isoliert sind. Die einzelnen \(\tilde{V}_i\) sollen also \(f\)-invariante Unterräume sein, so dass wir für die Einschränkung \(f_{|\tilde{V}_i}\) eine darstellende Matrix finden, die eine obere Dreiecksmatrix ist und auf deren Diagonale überall derselbe Wert steht.

    Diese Zerlegung ist die Zerlegung in »verallgemeinerte Eigenräume«, siehe Abschnitt 17.2.

  • Nach diesem ersten Schritt ist es leicht, das Problem auf den Fall eines nilpotenten Endomorphismus (Definition 17.17) zu reduzieren, d.h. wir werden zeigen, dass es genügt, den Fall zu behandeln, dass \(f^m=0\) für ein \(m\in \mathbb N\) ist.

    Das ist damit gleichbedeutend, dass \(f\) durch eine obere Dreiecksmatrix beschrieben werden kann, auf deren Diagonale überall Nullen stehen.

    Es geht dann darum zu zeigen, dass man eine obere Dreiecksmatrix dieser Form immer konjugieren kann zu einer oberen Dreiecksmatrix, die überall Nullen hat mit den Einträgen direkt oberhalb der Diagonale als einziger Ausnahme. Dort dürfen Nullen oder Einsen stehen. Mit anderen Worten: Es ist dann zu zeigen, dass eine Basis \(b_1,\dots , b_n\) von \(V\) existiert, so dass jedes \(b_i\) entweder auf \(b_{i-1}\) oder auf \(0\) abgebildet wird. Dies ist eine relativ konkrete Fragestellung, die wir in Abschnitt 17.3 behandeln werden.

Die Jordansche Normalform ist ein mächtiges Werkzeug der linearen Algebra. Zum Beispiel erhalten wir aus dem Satz über die Jordansche Normalform zusammen mit Satz 17.4 einen neuen Beweis von Korollar 16.29 im trigonalisierbaren Fall:

Korollar 17.6

Seien \(K\) ein Körper und \(f\) ein trigonalisierbarer Endomorphismus eines endlichdimensionalen \(K\)-Vektorraums. Dann gilt: Der Endomorphismus \(f\) ist genau dann diagonalisierbar, wenn sein Minimalpolynom nur einfache Nullstellen hat.

Dementsprechend ist die Jordansche Normalform auch an vielen Stellen wichtig, wo Methoden der linearen Algebra zur Anwendung kommen. Ein konkretes Beispiel ist die Theorie der linearen Differentialgleichungen mit konstanten Koeffizienten, siehe Abschnitt 17.7.2 für einige weitere Bemerkungen und Verweise dazu.

Ergänzung 17.7

Man kann zeigen, dass zu jedem Körper \(K\) ein algebraisch abgeschlossener Erweiterungskörper \(\overline{K}\) existiert. Über diesem ist dann jede Matrix aus \(M_n(K)\) trigonalisierbar, besitzt also eine Jordansche Normalform. In dieser werden natürlich im allgemeinen Einträge aus \(\overline{K}\setminus K\) auftreten. Dennoch kann das sinnvoll sein, um Aussagen über Matrizen (oder Endomorphismen) über \(K\) zu beweisen.

Für \(\mathbb Q\) und \(\mathbb R\) kennen wir ja (wenn wir den Fundamentalsatz der Algebra verwenden) einen solchen Erweiterungskörper, nämlich den Körper der komplexen Zahlen.

17.1.1 Die duale Partition einer Partition

In diesem Abschnitt führen wir den Begriff der Partition einer natürlichen Zahl ein. Das ist ein einfacher und rein kombinatorischer Begriff, der nützlich ist, um die Eindeutigkeit der Jordanschen Normalform zu zeigen.

Definition 17.8

Ein Tupel \(r_1 \ge r_2 \ge r_3 \ge \cdots \) natürlicher Zahlen heißt Partition von \(n\in \mathbb N\), falls \(n = \sum _{i\ge 1} r_i\) ist. (Insbesondere dürfen nur endlich viele \(r_i\ne 0\) sein.)

Zu jeder Partition kann man die sogenannte duale Partition bilden.

Definition 17.9

Sei \(r_1 \ge r_2 \ge r_3 \ge \cdots \) eine Partition von \(n\). Dann ist auch \(s_1 \ge s_2 \ge \cdots \) mit

\[ s_i = \# \{ j;\ r_j \ge i \} \]

eine Partition von \(n\). Sie wird als die zu \((r_i)_i\) duale Partition bezeichnet.

Lemma 17.10

Sei \(r_1 \ge r_2 \ge r_3 \ge \cdots \) eine Partition von \(n\), \(s_1 \ge s_2 \ge \cdots \) ihre duale Partition. Dann ist \(r_1 \ge r_2 \ge r_3 \ge \cdots \) die duale Partition von \((s_i)_i\).

Beweis

Das ist eine einfache kombinatorische Überlegung, die wir, statt einen Beweis zu geben, nur an dem folgenden konkreten Beispiel illustrieren.

\begin{tikzpicture} [scale=.7] \draw [thick] (0,0) -- (5,0); \draw [thick] (0,-1) -- (5,-1); \draw [thick] (0,-2) -- (3,-2); \draw [thick] (0,-3) -- (3,-3); \draw [thick] (0,-4) -- (2,-4); \draw [thick] (0,0) -- (0,-4); \draw [thick] (1,0) -- (1,-4); \draw [thick] (2,0) -- (2,-4); \draw [thick] (3,0) -- (3,-3); \draw [thick] (4,0) -- (4,-1); \draw [thick] (5,0) -- (5,-1); \end{tikzpicture}
Die Partition \(13 = 5 + 3 + 3 + 2\) kann man durch das nebenstehende Diagramm veranschaulichen. In der ersten Reihe stehen \(5\) Kästchen, in der zweiten Reihe \(3\) Kästchen, usw. Insgesamt handelt es sich um \(13\) Kästchen, und in jeder Reihe sind höchstens so viele Kästchen wie in der Reihe darüber. Die duale Partition entspricht dann der Partition derselben Zahl \(13\), die durch das an der Diagonale von links oben nach rechts unten gespiegelte Diagramm beschrieben wird.

Das Diagramm rechts beschreibt die Partition \(13 = 4+4+3+1+1\). Das ist genau die zur obigen Partition duale Partition. In der Kombinatorik hat der Begriff der Partition eine große Bedeutung. Das Problem, für die Anzahl der Partitionen einer gegebenen Zahl \(n\) einen geschlossenen Ausdruck anzugeben, ist auch in der Zahlentheorie von einem gewissen Interesse. In der Theorie der Jordanschen Normalform benutzen wir den Begriff allerdings »nur« als ein relativ simples – wenngleich nützliches – Hilfsmittel.
\begin{tikzpicture} [scale=.7] \draw [thick] (0,0) -- (4,0); \draw [thick] (0,-1) -- (4,-1); \draw [thick] (0,-2) -- (4,-2); \draw [thick] (0,-3) -- (3,-3); \draw [thick] (0,-4) -- (1,-4); \draw [thick] (0,-5) -- (1,-5); \draw [thick] (0,0) -- (0,-5); \draw [thick] (1,0) -- (1,-5); \draw [thick] (2,0) -- (2,-3); \draw [thick] (3,0) -- (3,-3); \draw [thick] (4,0) -- (4,-2); \end{tikzpicture}

17.1.2 Eindeutigkeit der Jordanschen Normalform

Sei \(A\) eine Matrix in Jordanscher Normalform. Das charakteristische Polynom von \(A\) bestimmt die Diagonaleinträge zusammen mit ihrer Vielfachheit, insbesondere ändern sich diese Daten nicht, wenn \(A\) durch eine konjugierte Matrix ersetzt wird. Die Größe der Jordan-Blöcke lässt sich wie folgt beschreiben.

Lemma 17.11

Sei \(\lambda \) einer der Eigenwerte von \(A\), und seien \(r_1 \ge r_2 \ge \cdots \) die Größen der Jordan-Blöcke mit Diagonaleintrag \(\lambda \). Sei \(s_1 \ge s_2 \ge \cdots \) die zu \((r_i)_i\) duale Partition. Dann gilt

\[ s_i = \dim \operatorname{Ker}((A-\lambda E_n)^i) - \dim \operatorname{Ker}((A-\lambda E_n)^{i-1}). \]

Beweis

Weil \(A\) Jordansche Normalform hat, hat auch \(A-\lambda E_n\) Jordansche Normalform. Die Diagonaleinträge sind genau in denjenigen Blöcken gleich \(0\), die zu Jordan-Blöcken zum Eigenwert \(\lambda \) in der Matrix \(A\) korrespondieren. Jordan-Blöcke mit einem Diagonaleintrag \(\ne 0\) sind invertierbare Matrizen, diese liefern also keinen Beitrag zum Kern.

Andererseits gilt \(\operatorname{rg}(J_{r,0}^i) = r-i\) für \(i\le r\) und \(\operatorname{rg}(J_{r,0}^i) = 0\) für \(i {\gt} r\). Das heißt

\[ \dim \operatorname{Ker}(J_{r,0}^i) = i\ \text{für}\ i\le r,\quad \text{und}\quad \dim \operatorname{Ker}(J_{r,0}^i) = r\ \text{für}\ i {\gt} r. \]

Damit sehen wir

\[ \dim \operatorname{Ker}(J_{r,0}^i) - \dim \operatorname{Ker}(J_{r,0}^{i-1}) = \begin{cases} 1 & \text{falls}\ i \le r,\\ 0 & \text{falls}\ i {\gt} r. \end{cases} \]

Folglich ist

\[ \dim \operatorname{Ker}((A-\lambda E_n)^i) - \dim \operatorname{Ker}((A-\lambda E_n)^{i-1}) \]

die Anzahl der Jordan-Blöcke in \(A\) zum Eigenwert \(\lambda \), die mindestens die Größe \(i\) haben, also mit der Notation in der Aussage des Lemmas die Anzahl der \(j\ge 1\), so dass \(r_j \ge i\) gilt. Das ist die Definition von \(s_i\) im Sinne der dualen Partition.

Die Zahlen \(\dim \operatorname{Ker}(A-\lambda E_n)^i\) ändern sich nicht, wenn man \(A\) durch eine zu \(A\) konjugierte Matrix ersetzt. Dies beweist, dass die Größen \(r_i\) der Jordan-Blöcke in der Jordanschen Normalform einer trigonalisierbaren Matrix eindeutig bestimmt sind, da sie die duale Partition der Partition \((s_i)_i\) wie im Lemma bilden.

Wie immer können wir die Aussage auf trigonalisierbare Endomorphismen eines endlichdimensionalen Vektorraums übertragen: Die kombinatorischen Informationen der Jordanschen Normalform, also die Anzahl und Größe der Jordanblöcke zu den einzelnen Eigenwerten sind eindeutig bestimmt. Es gibt aber in aller Regel viele verschiedene Basen, so dass die darstellende Matrix Jordanform hat. Auch die zu den einzelnen Blöcken auf der Diagonale korrespondierenden Unterräume des zugrundeliegenden Vektorraums sind nicht eindeutig bestimmt. Immerhin ist für jeden Eigenwert \(\lambda \) die Summe aller Unterräume zu den Jordanblöcken mit Eigenwert \(\lambda \) eindeutig bestimmt, wie wir im nächsten Abschnitt sehen werden. Dieser Unterraum ist der sogenannte verallgemeinerte Eigenraum.