Inhalt

17.3 Die Jordansche Normalform für nilpotente Endomorphismen

Ist \(f\) ein trigonalisierbarer Endomorphismus eines Vektorraums \(V\), der nur einen einzigen Eigenwert \(\lambda \) hat, dann ist \(f-\lambda \operatorname{id}_V\) trigonalisierbar mit dem einzigen Eigenwert \(0\). Den letzteren Fall wollen wir in diesem Abschnitt genauer untersuchen. Unter Ausnutzung der Zerlegung in verallgemeinerte Eigenräume werden wir danach den Beweis des allgemeinen Satzes über die Jordansche Normalform leicht abschließen können.

Definition 17.17

Seien \(K\) ein Körper und \(V\) ein endlichdimensionaler \(K\)-Vektorraum, \(n=\dim (V)\). Ein Endomorphismus \(f\in \operatorname{End}_K(V)\) heißt nilpotent, falls die folgenden äquivalenten Bedingungen erfüllt sind:

  1. Es existiert \(i\ge 0\), so dass \(f^i=0\).

  2. \(f^n = 0\),

  3. \(\operatorname{minpol}_f | X^n\).

  4. \(\operatorname{charpol}_f = X^n\)

  5. Es gibt eine Basis \(\mathscr B\) von \(V\), so dass \(M^\mathscr B_\mathscr B(f)\) eine obere Dreiecksmatrix ist, deren Diagonaleinträge alle \(=0\) sind.

Beweis der Äquivalenz

Mit den Sätzen aus dem vorherigen Kapitel sind alle Implikationen leicht zu zeigen. Versuchen Sie es erstmal selbst, bevor Sie den Beweis hier lesen!

Aus dem Satz von Cayley-Hamilton in der Form von Korollar 16.23 – \(\operatorname{minpol}_f\, |\, \operatorname{charpol}_f\) – folgt (iv) \(\Rightarrow \) (iii). Die Implikationen (iii) \(\Rightarrow \) (ii) \(\Rightarrow \) (i) sind offensichtlich. Weil das Polynom \(X^n\) vollständig in Linearfaktoren zerfällt, folgt aus (iv), dass \(f\) trigonalisierbar ist, und damit (v), denn \(0\) ist die einzige Nullstelle von \(X^n\). Dass andererseits (iv) aus (v) folgt, ist klar.

Nun bleibt noch zu begründen, dass (i) \(\Rightarrow \) (iv) gilt. Wenn \(f^i =0\) ist, dann muss \(\operatorname{minpol}_f\) ein Teiler von \(X^i\) sein. Das einzige irreduzible Polynom, das \(X^i\) teilt, ist \(X\), und weil charakteristisches Polynom und Minimalpolynom von denselben irreduziblen Polynomen geteilt werden (Satz 16.26), muss \(\operatorname{charpol}_f\) ebenfalls eine Potenz von \(X\) sein. Weil \(\deg (\operatorname{charpol}_f)=n\) ist, gilt (iv).

Alternativ kann man Satz 16.26 mit dem folgenden Argument vermeiden, das direkt die Implikation (i) \(\Rightarrow \) (v) zeigt. Sei etwa \(f^m=0\). Wir betrachen die Kette

\[ 0 \subset \operatorname{Ker}(f)\subseteq \operatorname{Ker}(f^2) \subseteq \cdots \subseteq \operatorname{Ker}(f^{m-1})\subseteq \operatorname{Ker}(f^m) = V. \]

Wir wählen nacheinander Komplementärräume zu diesen Inklusionen, es sei also \(U_1\) ein Komplement von \(\operatorname{Ker}(f)\) in \(\operatorname{Ker}(f^2)\), es sei \(U_2\) ein Komplement von \(\operatorname{Ker}(f^2) = \operatorname{Ker}(f)\oplus U_1\) in \(\operatorname{Ker}(f^3)\), usw., und schließlich \(U_{m-1}\) ein Komplement von \(\operatorname{Ker}(f^{m-1}) = \operatorname{Ker}(f)\oplus U_1\oplus \cdots \oplus U_{m-2}\) in \(\operatorname{Ker}(f^m)=V\). Schreiben wir noch \(U_0:=\operatorname{Ker}(f)\), so erhalten wir eine Zerlegung

\[ V = U_0\oplus U_1\oplus \cdots \oplus U_{m-1} \]

mit der Eigenschaft, dass für alle \(i\) gilt, dass

\[ f(U_i) \subseteq U_0\oplus \cdots \oplus U_{i-1}, \]

denn offenbar gilt \(f(\operatorname{Ker}(f^{i+1}))\subseteq \operatorname{Ker}(f^i)\). Wählen wir Basen für \(U_0, U_1,\dots , U_{m-1}\) und setzen diese zu einer Basis von \(V\) zusammen, so erhalten wir eine Basis \(\mathscr B\) von \(V\), so dass \(M^\mathscr B_\mathscr B(f)\) eine Block-obere-Dreiecksmatrix ist, deren Diagonalblöcke gleich Null sind. Insbesondere ist \(M^\mathscr B_\mathscr B(f)\) eine obere Dreiecksmatrix mit Nullen auf der Diagonale.

Vergleiche auch Satz I.6.56, wo wir die Folgerung (i) \(\Rightarrow \) (ii) mit einem ähnlichen Argument wie am Ende des Beweises gezeigt haben. Mithilfe des Satzes von Cayley-Hamilton haben wir nun einen neuen Beweis erhalten.

Analog definieren wir den Begriff der nilpotenten Matrix; dort ist natürlich eine entsprechende Charakterisierung durch zueinander äquivalente Bedingungen möglich.

Definition 17.18

Seien \(K\) ein Körper und \(n\in \mathbb N\). Eine Matrix \(A\in M_n(K)\) heißt nilpotent, falls die folgenden äquivalenten Bedingungen erfüllt sind:

  1. Es existiert \(i\), so dass \(A^i=0\).

  2. \(A^n = 0\),

  3. \(\operatorname{minpol}_A | X^n\).

  4. \(\operatorname{charpol}_A = X^n\)

  5. Die Matrix \(A\) ist konjugiert zu einer oberen Dreiecksmatrix, deren Diagonaleinträge alle \(=0\) sind.

Lemma 17.19

Seien \(K\) ein Körper und \(V\) ein endlichdimensionaler \(K\)-Vektorraum. Seien \(f_1, f_2\in \operatorname{End}_K(V)\) Endomorphismen mit \(f_1\circ f_2 = f_2\circ f_1\).

  1. Sind \(f_1\) und \(f_2\) diagonalisierbar, so existiert eine Basis \(\mathscr B\) von \(V\), so dass sowohl \(M^\mathscr B_\mathscr B(f_1)\) als auch \(M^\mathscr B_\mathscr B(f_2)\) Diagonalmatrizen sind. Wir sagen, \(f_1\) und \(f_2\) seien simultan diagonalisierbar.

  2. Sind \(f_1\) und \(f_2\) diagonalisierbar, so ist \(f_1+f_2\) diagonalisierbar.

  3. Sind \(f_1\) und \(f_2\) nilpotent, so ist \(f_1+f_2\) nilpotent.

Beweis

zu (1). Übung (Hausaufgabe 3.4). Teil (2) folgt leicht aus Teil (1), weil die Summe von Diagonalmatrizen offenbar eine Diagonalmatrix ist.

Für Teil (3) skizzieren wie zwei Beweismöglichkeiten. Eine Möglichkeit ist, den binomischen Lehrsatz zu verwenden, und zwar im kommutativen Ring

\[ K[f_1, f_2] = \left\{ \sum _{i,j\ge 0} a_{ij}\, f_1^i\, f_2^j\, ;\ a_{ij}\in K,\ \text{nur endlich viele}\ a_{ij}\ne 0 \right\} \qquad (\subseteq \operatorname{End}_K(V)). \]

Lemma 17.20 Binomischer Lehrsatz

Sei \(R\) ein kommutativer Ring und seien \(x,y\in R\) und \(n\in \mathbb N\). Dann gilt

\[ (x+y)^n = \sum _{i=0}^n \binom {n}{i} x^i y^{n-i}. \]

Sind dann \(n_1, n_2\in \mathbb N\) mit \(f_i^{n_i}=0\), \(i=1,2\), so liefert der binomische Lehrsatz eine Darstellung von \((f_1+f_2)^{n_1+n_2}\) als Summe, in der in jedem Summanden entweder der Exponent von \(f_1\) mindestens \(n_1\), oder der Exponent von \(f_2\) mindestens \(n_2\) ist. Also ist jeder Summand \(=0\).

Alternativer Beweis. Eine andere Möglichkeit ist, die Aussage von Hausaufgabe 4.3 zu benutzen, dass miteinander kommutierende trigonalisierbare Endomorphismen simultan trigonalisierbar sind. Weil \(f_1\circ f_2=f_2\circ f_1\) gilt und weil jeder nilpotente Endomorphismus trigonalisierbar ist, folgt also, dass bezüglich einer geeigneten Basis sowohl \(f_1\) als auch \(f_2\) durch eine obere Dreiecksmatrix dargestellt werden. Weil beide nur den Eigenwert \(0\) haben, sind alle Diagonaleinträge gleich \(0\), und folglich gilt das auch für die Summe dieser beiden Matrizen. Es folgt, dass \(f_1+f_2\) ebenfalls nilpotent ist.

Wir benutzen unten die folgende präzisere Fassung von Lemma 16.17 für den Fall eines nilpotenten Endomorphismus.

Lemma 17.21

Sei \(f\in \operatorname{End}_K(V)\) ein nilpotenter Endomorphismus und sei \(U = \langle u,f(u), \dots \rangle \) ein zyklischer Unterraum. Dann ist \(\dim U = \min \{ m; f^m(u)=0 \} \). Ist \(u^\prime \in U\setminus f(U)\), so gilt

\[ U = \langle u’, f(u’), f^2(u’), \dots \rangle . \]

Beweis

Sei \(d\) definiert als \(\min \{ m; f^m(u)=0 \} \). Wir zeigen, dass \(u, f(u), \dots , f^{d-1}(u)\) eine linear unabhängige Familie ist. Weil sie (wegen \(f^d(u)=0\)) offenbar den Raum \(U\) erzeugt, folgt daraus \(\dim (U)=d\). Angenommen, es gäbe eine nicht-triviale Linearkombination

\[ a_0 u + a_1f(u) + \cdots a_{d-1} f^{d-1}(u) = 0. \]

Sei \(i\) minimal mit \(a_i\ne 0\). Wir wenden \(f^{d-i-1}\) an und erhalten

\[ a_i f^{d-1}(u) = 0, \]

und das ist ein Widerspruch.

(Alternativ kann man auch Lemma 16.17 verwenden.)

Wir sehen (zum Beispiel an der Form der darstellenden Matrix oder durch eine direkte Betrachtung der gewählten Basis), dass \(U=\langle u\rangle \oplus \operatorname{Im}(f)\) gilt. Jeder Vektor \(u^\prime \in U\setminus f(U)\) lässt sich also schreiben als \(\alpha u+f(v)\) mit \(\alpha \in K^\times \), \(v\in U\). Es folgt \(f^{d-1}(u^\prime ) = f^{d-1}(u) + f^d(v) = f^{d-1}(u)\ne 0\), und mit dem ersten Teil, nun angewandt auf \(\langle u^\prime ,f(u^\prime ), \dots \rangle \), dass \(\dim \langle u^\prime ,f(u^\prime ), \dots \rangle = d\) gilt. Also ist dieser Unterraum, wie behauptet, gleich \(U\).

(Wenn man die Basis stattdessen in der Reihenfolge \(\mathscr B=(f^{d-1}(u), \dots , u)\) schreibt, hat die Begleitmatrix die Form eines Jordan-Blocks: \(M^\mathscr B_\mathscr B(f) = J_{d,0}\).)

Nach diesen Vorbereitungen können wir die Existenz der Jordanschen Normalform für nilpotente Endomorphismen beweisen.

Satz 17.22 Normalform für nilpotente Endomorphismen/Matrizen

Es sei \(f\) ein nilpotenter Endomorphismus von \(V\). Dann existieren eine Basis \(\mathscr B\) von \(V\) und natürliche Zahlen \(r_1\ge \cdots \ge r_k\ge 1\), so dass

\[ M_{\mathscr B}^{\mathscr B}(f) = \operatorname{diag}(J_{r_1,0}, \dots , J_{r_k,0}). \]

Eine entsprechende Aussage gilt für nilpotente Matrizen in \(M_{n}(K)\).

Wegen der Eindeutigkeitsaussage im Satz über die Jordansche Normalform, die wir bereits bewiesen haben, sind die \(r_i\) eindeutig bestimmt. Wir haben auch bereits gesehen, dass die Anzahl der Jordan-Blöcke gleich der Dimension des Eigenraums von \(f\) zum Eigenwert \(0\), also gleich \(\dim \operatorname{Ker}f\) sein muss.

Beweis

Wir haben im Beweis des vorherigen Lemmas bemerkt, dass für jeden \(f\)-zyklischen Unterraum die darstellende Matrix einer geeigneten Basis die Form eines Jordan-Blocks hat. Deshalb ist die Aussage des Satzes äquivalent dazu, dass \(V\) die direkte Summe von \(f\)-zyklischen Unterräumen ist.

Wir zeigen das durch Induktion nach \(n=\dim V\). Für \(n=1\) ist nichts zu zeigen, sei also nun \(n {\gt} 1\). Sei \(U\subseteq V\) ein Unterraum der Dimension \(n-1\) mit \(\operatorname{Im}f \subseteq U\). Ein solcher Unterraum existiert, weil \(f\) nilpotent ist und daher nicht surjektiv sein kann. Es gilt dann \(f(U)\subseteq U\) und wir können die Induktionsvoraussetzung auf \(f_{|U}\) anwenden. Wir erhalten so eine Zerlegung \(U=U_1\oplus \cdots U_l\) als direkte Summe \(f\)-zyklischer Unterräume.

Sei nun \(v\in V\setminus U\). Wir schreiben

\[ f(v) = \sum _{i=1}^l u_i,\qquad \text{mit}\ u_i\in U_i\, i=1, \dots , l. \]

Für die \(i\), für die \(u_i\in f(U_i)\) liegt, sagen wir \(u_i=f(u_i^\prime )\), \(u_i^\prime \in U_i\), ersetzen wir nun \(v\) durch \(v-u_i^\prime \), und ersetzen \(u_i\) durch \(0\). Die obige Gleichung ist dann immer noch richtig. Wir erhalten am Ende einen Vektor \(v\in V\setminus U\) mit einer Darstellung

\[ f(v) = \sum _{i=1}^l u_i,\qquad \text{mit}\ u_i\in U_i\, i=1, \dots , l, \]

so dass für alle \(i\) gilt: \(u_i =0\) oder \(u_i \not\in f(U_i)\).

1. Fall: \(f(v)=0\). Dann ist \(\langle v\rangle \) ein \(f\)-zyklischer Untervektorraum und folglich

\[ V = \langle v \rangle \oplus U_1 \oplus \cdots \oplus U_\ell \]

eine Zerlegung von \(V\) in \(f\)-zyklische Unterräume und wir sind fertig.

2. Fall: \(f(v)\ne 0\). Sei \(m\) minimal mit der Eigenschaft, dass \(f^{m+1}(v) = f^m(f(v))=0\) gilt. Weil die Untervektorräume \(U_i\) eine direkte Summe bilden, gilt dann auch \(f^m(u_i)=0\) für alle \(i\). Aber für mindestens eines der \(u_i\) muss \(f^{m-1}(u_i)\ne 0\) sein. Nach Umnummerieren der \(U_i\) (und entsprechend der \(u_i\)) können wir annehmen, dass \(m\) auch minimal ist mit \(f^m(u_1)=0\). Wegen \(f(v)\ne 0\) ist dann \(u_1\ne 0\), nach unserer Vorüberlegung also \(u_1\not\in f(U_1)\). Wir wenden nun Lemma 17.21 an. Weil \(U_1\) ein \(f\)-zyklischer Unterraum ist, folgt \(U_1 = \langle u_1, f(u_1),\dots , f^{m-1}(u_1)\rangle \) und \(\dim U_1=m\). Andererseits hat \(W:=\langle v, f(v), \dots , f^m(v)\rangle \) die Dimension \(m+1\).

Behauptung. \(V = W \oplus U_2 \oplus \cdots \oplus U_\ell \).

Begründung. Da \(\dim V= \dim W+\dim \sum _{i{\gt}1} U_i\) ist, genügt es zu zeigen, dass

\[ W \cap (U_2 \oplus \cdots \oplus U_\ell ) = 0. \]

Nehmen wir also an, dass \(a_j\in K\) sind mit

\[ \sum _{j=0}^m a_j f^j(v) \in U_2 \oplus \cdots \oplus U_\ell . \]

Weil \(v\not\in U\) aber \(\operatorname{Im}(f)\subseteq U\) gilt, muss \(a_0=0\) sein. Indem wir wieder die Darstellung \(f(v) = \sum u_i\) hernehmen, können wir die Summe umschreiben als

\[ \sum _{j=0}^m a_j\, f^j(v) = \sum _{j=1}^m a_j\, f^j(v) = \sum _{i=1}^l \sum _{j=0}^{m-1} a_{j+1}\, f^j(u_i). \]

Jetzt nutzen wir noch aus, dass die ganze Summe in \(U_2 \oplus \cdots \oplus U_\ell \) liegt, und jeder einzelne Summand zum Index \(i\) in \(U_i\) enthalten ist, und erhalten

\[ \sum _{j=0}^{m-1} a_{j+1} f^j(u_1) \in U_1 \cap (U_2 \oplus \cdots \oplus U_\ell ) = 0, \]

und das impliziert \(a_1=\cdots =a_m=0\), weil \(u_1, \dots , f^{m-1}(u_1)\) linear unabhängig sind.