Inhalt

8.2 Die spezielle lineare Gruppe

Wir haben in Bemerkung 5.37 die Matrizen \(E_{ij}(a)\in GL_n(K)\) definiert (für \(1\le i\ne j\le n\), \(a\in K\)). Wir wiederholen hier die Definition:

Definition 8.31

Seien \(K\) ein Körper, \(n\in \mathbb N\), \(1\le i\ne j\le n\), \(a\in K\). Die Matrix \(E_{ij}(a) = (a_{\lambda \mu })_{\lambda ,\mu }\in GL_n(K)\) ist definiert durch

\[ a_{\lambda \mu } = \begin{cases} 1 & \lambda =\mu ,\\ a & \lambda = i,\ \mu = j,\\ 0 & \text{sonst.} \end{cases} \]

Die Matrizen der Form \(E_{ij}(a)\) nennen wir Elementarmatrizen.

Der Begriff Elementarmatrix wird teilweise auch mit einer etwas anderen Bedeutung benutzt; bei manchen Autoren heißt jede Matrix, die aus der Einheitsmatrix durch eine einzige elementare Zeilenumformung hervorgeht, eine Elementarmatrix. Bei uns sind es nur diejenigen, die durch eine einzige elementare Zeilenumformung vom Typ I aus der Einheitsmatrix hervorgehen.

Die Elementarmatrizen sind tatsächlich invertierbar; es gilt \(E_{ij}(a)^{-1} = E_{ij}(-a)\), wie man leicht nachrechnet. Genauer gilt \(E_{ij}(a) E_{ij}(b) = E_{ij}(a+b)\). Das können wir auch formulieren als: \(\varphi _{ij}\colon K\to GL_n(K)\), \(a\mapsto E_{ij}(a)\) ist ein Gruppenhomomorphismus von der additiven Gruppe \(K\) in die allgemeine lineare Gruppe.

Wir hatten in Abschnitt 5.3 besprochen, dass für jede Matrix \(A\in M_n(K)\) (und sogar allgemeiner für jede Matrix mit \(n\) Zeilen) \(E_{ij}(a)A\) die Matrix ist, die aus \(A\) durch Addition des \(a\)-fachen der \(j\)-ten Zeile zur \(i\)-ten Zeile hervorgeht. Analog ist \(A E_{ij}(a)\) die Matrix, die aus \(A\) durch Addition der \(i\)-ten Spalte zur \(j\)-ten Spalte hervorgeht.

If people do not believe that mathematics is simple, it is only because they do not realize how complicated life is.

John von Neumann.

Fundort: https://mathoverflow.net/a/7306

Definition 8.32 Spezielle lineare Gruppe

Sei \(K\) ein Körper. Die spezielle lineare Gruppe \(SL_n(K)\) ist die von allen Elementarmatrizen \(E_{ij}(a)\) erzeugte Untergruppe von \(GL_n(K)\).

Natürlich liegen alle Elementarmatrizen \(E_{ij}(a)\) selbst in \(SL_n(K)\), und damit auch alle Produkte von solchen, und damit kann man eine ganze Menge Matrizen »finden«. Weil das Inverse einer Elementarmatrix wieder eine Elementarmatrix ist, besteht die Gruppe \(SL_n(K)\) genau aus allen Produkten (mit endlich vielen Faktoren) von Elementarmatrizen.

Weil wir Multiplikation mit Elementarmatrizen auch als elementare Zeilenumformungen vom Typ I deuten können, können wir die Zugehörigkeit zur Gruppe \(SL_n(K)\) auch so beschreiben: Eine invertierbare Matrix \(A\) der Größe \(n\) liegt genau dann in \(SL_n(K)\), wenn sich die Einheitsmatrix durch wiederholte Anwendung von elementaren Zeilenumformungen vom Typ I in die Matrix \(A\) umformen lässt. Oder äquivalent: Wenn sich \(A\) durch wiederholte Anwendung von elementaren Zeilenumformungen vom Typ I in die Einheitsmatrix überführen lässt.

Wir wollen als nächstes einige Beispiele von Elementen der speziellen linearen Gruppe sammeln.

Beispiel 8.33

Sei \(K\) ein Körper.

  1. Es gilt \(\begin{pmatrix} 0 & 1 \\ -1 & 0 \end{pmatrix}\in SL_2(K)\). Äquivalent: Wir können die Einheitsmatrix \(E_2\) durch elementare Zeilenumformungen vom Typ I auf die genannte Matrix bringen. In der Tat:

    \[ \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}\xrightarrow {Z_2\rightsquigarrow Z_2-Z_1} \begin{pmatrix} 1 & 0 \\ -1 & 1 \end{pmatrix}\xrightarrow {Z_1\rightsquigarrow Z_1+Z_2} \begin{pmatrix} 0 & 1 \\ -1 & 1 \end{pmatrix}\xrightarrow {Z_2\rightsquigarrow Z_2-Z_1} \begin{pmatrix} 0 & 1 \\ -1 & 0 \end{pmatrix}. \]

    Wir können natürlich diese Umformungen als Matrizenmultiplikation umschreiben und erhalten damit die Darstellung

    \[ \begin{pmatrix} 0 & 1 \\ -1 & 0 \end{pmatrix} = \begin{pmatrix} 1 & 0 \\ -1 & 1 \end{pmatrix} \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix} \begin{pmatrix} 1 & 0 \\ -1 & 1 \end{pmatrix}. \]
  2. Seien \(n\in \mathbb N\) und \(a_1,\dots , a_n\in K\) mit \(\prod _{i=1}^n a_i = 1\). Dann ist \(\operatorname{diag}(a_i)\in SL_n(K)\).

    Der entscheidende Fall ist der Fall \(n=2\), den wir als erstes erklären werden. Die Behauptung ist dazu äquivalent, dass für jedes \(a\in K^\times \) die Einheitsmatrix \(E_2\) durch elementare Zeilenumformungen vom Typ I auf die Matrix \(\begin{pmatrix} a & 0 \\ 0 & a^{-1} \end{pmatrix}\) gebracht werden kann. Wir rechnen dazu

    \begin{align*} & \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}\xrightarrow {Z_2\rightsquigarrow Z_2+aZ_1} \begin{pmatrix} 1 & 0 \\ a & 1 \end{pmatrix}\xrightarrow {Z_1\rightsquigarrow Z_1-\frac{1-a}{a}Z_1} \begin{pmatrix} 1-(1-a) & -\frac{1-a}{a} \\ a & 1 \end{pmatrix} =\begin{pmatrix} a & -\frac{1-a}{a} \\ a & 1 \end{pmatrix}\xrightarrow {Z_2\rightsquigarrow Z_2-Z_1}\\ & \begin{pmatrix} a & -\frac{1-a}{a} \\ 0 & 1+\frac{1-a}{a} \end{pmatrix} =\begin{pmatrix} a & -\frac{1-a}{a} \\ 0 & a^{-1} \end{pmatrix}\xrightarrow {Z_1\rightsquigarrow Z_1+(1-a)Z_2} \begin{pmatrix} a & 0 \\ 0 & a^{-1} \end{pmatrix}. \end{align*}

    Für den allgemeinen Fall ergibt sich, indem wir die entsprechenden Zeilenumformungen auf die Zeilen \(i\), \(i+1\) anwenden, dass alle Matrizen der Form \(\operatorname{diag}(1, \dots , 1, a, a^{-1}, 1, \dots , 1)\) für \(a\in K\) in \(SL_n(K)\) liegen. Für Elemente \(a_i\in K^\times \) mit \(\prod _{i=1}^n a_i = 1\) gilt \((a_1\cdots a_{n-1})^{-1} = a_n\) und wir erhalten, dass

    \begin{align*} & \operatorname{diag}(a_1,\dots , a_n) =\\ & \operatorname{diag}(a_1, a_1^{-1}, 1, \dots , 1) \operatorname{diag}(1, a_1 a_2, (a_1 a_2)^{-1}, 1, \dots , 1) \cdots \operatorname{diag}(1, \dots , 1, a_1\cdots a_{n-1}, (a_1 \cdots a_{n-1})^{-1}) \end{align*}

    in \(SL_n(K)\) liegt.

  3. Ist \(B\in SL_n(K)\), so gilt auch \(B^t\in SL_n(K)\). In der Tat überprüft man leicht, dass für jede Untergruppe \(H\subseteq GL_n(K)\) auch die Teilmenge \(H^t := \{ h^t;\ h\in H\} \) eine Untergruppe von \(GL_n(K)\) ist. Weil \(E_{ij}(a)^t = E_{ji}(a)\) gilt, liegen alle \(E_{ij}(a)\) in \(SL_n(K)^t = \{ g^t;\ g\in SL_n(K)\} \), es folgt also \(SL_n(K) \subseteq SL_n(K)^t\). Weil \((SL_n(K)^t)^t =SL_n(K)\) gilt, folgt daraus durch Anwenden von \(-^t\) auch die umgekehrte Inklusion.

Wir hatten in Beispiel 8.20 bemerkt, dass die Gruppe \(GL_n(K)\) von den Matrizen der Form \(E_{ij}(a)\), \(P_{ij}\) und \(\operatorname{diag}(1,\dots , 1, a, 1, \dots , 1)\), \(a\in K^\times \) erzeugt wird. Insofern »ist der Unterschied zwischen \(SL_n(K)\) und \(GL_n(K)\) nicht sehr groß«. Das zeigt auch der folgende Satz. Wir werden die Situation in Kapitel 9 noch genauer verstehen und unter anderem zeigen, dass für jeden Körper, der mehr als \(2\) Elemente hat, und alle \(n\ge 1\) die Untergruppe \(SL_n(K)\) eine echte Untergruppe von \(GL_n(K)\) ist, also dass es invertierbare Matrizen gibt, die nicht in \(SL_n(K)\) liegen. Interessanterweise ist es mit den Methoden, die uns momentan zur Verfügung stehen, aber nicht so leicht zu zeigen, dass irgendeine konkrete Matrix nicht in \(SL_n(K)\) liegt. (Eine Ausnahme ist der Fall \(n=1\); dann gibt es gar keine Matrizen der Form \(E_{ij}(a)\), so dass \(SL_1(K) = \{ 1\} \) die triviale Gruppe ist.)

Satz 8.34

Seien \(K\) ein Körper und \(n\in \mathbb N\). Sei \(A\in GL_n(K)\). Dann existieren \(d, d^\prime \in K\) und \(B, C\in SL_n(K)\), so dass

\[ A = B \operatorname{diag}(1, \dots , 1, d), \qquad A = \operatorname{diag}(1, \dots , 1, d^\prime ) C. \]

Beweis

Wir zeigen zuerst die Existenz von \(B\), bzw. äquivalent die Existenz einer Matrix \(B^\prime \in SL_n(K)\), so dass \(B^\prime A\) eine Diagonalmatrix ist, deren erste \(n-1\) Einträge alle gleich \(1\) sind. Haben wir \(B^\prime \) gefunden, so setzen wir \(B = (B^\prime )^{-1}\).

In Beispiel 8.33 (1) haben wir gesehen, dass \(\left( \begin{array}{cc} 0 & 1 \\ -1 & 0 \end{array}\right)\) in der Gruppe \(SL_2(K)\) liegt. Eine Matrix \(A\in M_2(K)\) von links mit dieser Matrix zu multiplizieren, bewirkt bis auf Vorzeichen eine Zeilenvertauschung. Es ist klar, dass wir das Beispiel auf die Gruppe \(SL_n(K)\) übertragen können. Wir können daher durch Multiplikation mit einer geeigneten Matrix in \(SL_n(K)\) von links, die Matrix \(A\) bis auf Vorzeichen durch Zeilenvertauschungen abändern.

Damit können wir – mit kleinen Änderungen – den Gauß-Algorithmus in dem Sinne durchführen, dass wir \(A\) auf eine Diagonalmatrix bringen können. In der Tat kann \(A\) als invertierbare Matrix keine Nullspalte haben. Im ersten Schritt ändern wir \(A\) durch Multiplikation mit einer Matrix in \(SL_n(K)\) so ab, dass der Eintrag in der linken oberen Ecke \(\ne 0\) ist. Wir können zwar nicht mit einer Zeilenumformung vom Typ III diesen Eintrag auf \(1\) bringen, weil wir nur mit Matrizen aus \(SL_n(K)\) multiplizieren dürfen, aber dennoch können wir geeignete Vielfache der ersten Zeile von den anderen Zeilen abziehen, um zu erreichen, dass alle anderen Einträge der ersten Spalte gleich \(0\) sind.

Wir erhalten so eine Matrix der Form \(\begin{pmatrix} a & \ast \\ 0 & A^\prime \end{pmatrix}\), als Blockmatrix geschrieben, d.h. \(A^\prime \in M_{n-1}(K)\). Weil \(A\) invertierbar ist, ist auch \(A^\prime \) invertierbar. Eine Möglichkeit, das zu begründen, ist, dass \(A\) als reduzierte Zeilenstufenform die Einheitsmatrix \(E_n\) hat; wäre \(A^\prime \) nicht invertierbar, so wäre das nicht der Fall. Alternativ könnte man sagen, dass \(A\) Rang \(n\) hat und dass deshalb \(A^\prime \) Rang \(n-1\) haben muss, also invertierbar ist.

Wir fahren dann induktiv mit den anderen Spalten so fort, dass wir \(A\) auf die Form einer oberen Dreiecksmatrix bringen, und zwar – wieder wegen der Invertierbarkeit – mit Einträgen \(\ne 0\) auf der Diagonale. Als nächstes bringen wir alle Einträge oberhalb der Diagonalen durch Zeilenumformungen vom Typ I auf \(0\). Wir erhalten so eine Diagonalmatrix \(\operatorname{diag}(c_1, \dots , c_n)\).

Zum Schluss multiplizieren wir von links mit der Diagonalmatrix

\[ \operatorname{diag}(c_1, \dots , c_{n-1}, (c_1\cdots c_{n-1})^{-1})^{-1} \]

(siehe Beispiel 8.33 (2)) und erhalten die gewünschte Form.

Um die zweite Version des Satzes zu zeigen, schreiben wir \(A^t\) in der Form \(B\operatorname{diag}(1, \dots , 1, d)\), so dass \(A = (B\operatorname{diag}(1, \dots , 1, d))^t = \operatorname{diag}(1, \dots , 1, d) B^t\) ist. Weil mit \(B\) auch \(B^t\) in \(SL_n(K)\) liegt (Beispiel 8.33 (3)), sind wir damit fertig. Alternativ kann man für Teil (2) das Argument aus Teil (1) mit Spalten- statt Zeilenumformungen wiederholen.

Wir werden in Kapitel 9 – wenn wir die »Determinante« \(\det (A)\) von \(A\) eingeführt haben – sehen, dass \(d\) und \(d^\prime \) im obigen Satz stets gleich sind, und auch nicht von der Wahl von \(B\) und \(C\) abhängen, nämlich \(d=d^\prime =\det (A)\). Daraus folgt dann auch, dass für gegebenes \(A\) die Matrizen \(B\) und \(C\) eindeutig bestimmt sind.