7.4 Der Rang einer Matrix
Sei \(A\in M_{m\times n}(K)\).
Der Rang der Matrix \(A\), geschrieben \(\operatorname{rg}A\), ist der Rang der linearen Abbildung \(\mathbf f_A\), also die Dimension von \(\operatorname{Im}(\mathbf f_A)\). Mit anderen Worten: \(\operatorname{rg}A\) ist die Dimension des Untervektorraums von \(K^m\), der von den Spalten von \(A\) erzeugt wird. Man spricht daher auch vom Spaltenrang von \(A\).
Der Zeilenrang von \(A\) ist die Dimension des Untervektorraums von \(K^n\), der von den Zeilen von \(A\) erzeugt wird.
Wir wir gleich sehen werden, stimmen für jede Matrix \(A\) ihr Spaltenrang und ihr Zeilenrang überein. Diese – nicht offensichtliche – Tatsache erlaubt es uns, für den Zeilenrang kein eigenes Symbol einzuführen.
Sei \(A\in M_{m\times n}(K)\) gegeben, und sei \(f= \mathbf f_A\) die zugehörige lineare Abbildung \(K^n\to K^m\). Der Spaltenrang von \(A\) ist dann gerade \(\dim \operatorname{Im}(A)\), also der Rang von \(f\). Nach der Dimensionsformel ist diese Zahl gleich \(n - \dim \operatorname{Ker}(A)\). Es genügt also zu zeigen, dass der Zeilenrang von \(A\) mit \(n - \dim \operatorname{Ker}(A)\) übereinstimmt.
Nun verändern sich weder der Zeilenrang noch die Zahl \(n - \dim \operatorname{Ker}(A)\), wenn wir \(A\) ersetzen durch eine Matrix, die aus \(A\) durch eine elementare Zeilenumformung hervorgeht. (Was den Zeilenrang angeht, bleibt sogar der von den Zeilen erzeugte Untervektorraum gleich. Außerdem ändert sich der Kern von \(A\) nicht, siehe Lemma 5.12). Durch solche Umformungen können wir \(A\) letztlich auf Zeilenstufenform bringen. Für eine Matrix in Zeilenstufenform ist die Aussage aber klar: Denn der Zeilenrang ist dann gerade die Anzahl der nicht-verschwindenden Zeilen, also die Anzahl der führenden Einsen, und die Dimension des Kerns ist die Anzahl der Spalten ohne führende Eins (eben die Anzahl der »frei wählbaren Variablen«). Die Differenz \(n-\dim (\operatorname{Ker}(A))\) ist also ebenfalls die Anzahl der führenden Einsen.
Wohlgemerkt muss die Matrix \(A\) hier nicht quadratisch sein! Die von den Zeilen bzw. Spalten erzeugten Untervektorräume befinden sich im nicht-quadratischen Fall in unterschiedlichen umgebenden \(K\)-Vektorräumen. Das Theorem sagt, dass sie aber immer dieselbe Dimension haben (und insbesondere ist diese \(\le \min (m,n)\)).
Wir geben noch einen alternativen Beweis, der insofern einfacher ist, als dass die Dimensionsformel für lineare Abbildungen nicht benutzt werden muss, sondern nur die Tatsache, dass isomorphe \(K\)-Vektorräume dieselbe Dimension haben (Lemma 7.11). Siehe auch Bemerkung 7.56 für noch einen anderen Beweis.
Sei \(A\in M_{m\times n}(K)\). Wir können aus Satz 7.37 folgern, dass invertierbare Matrizen \(S\in M_m(K)\), \(T\in M_n(K)\) existieren, so dass
(als Blockmatrix verstanden), wobei \(r = \operatorname{rg}(A)\). In der Tat können wir den Satz anwenden auf die Abbildung \(\mathbf f_A\) und finden damit Basen \(\mathscr B\), \(\mathscr C\) von \(K^n\) und \(K^m\), so dass \(M^\mathscr B_\mathscr C(\mathbf f_A)\) die obige Form hat. Wir definieren dann \(S = M^{\mathscr E_m}_\mathscr C\), \(T=M^\mathscr B_{\mathscr E_n}\), wobei \(\mathscr E_n\) und \(\mathscr E_m\) die Standardbasen von \(K^n\) und \(K^m\) bezeichnen.
Für die Matrix \(\begin{pmatrix} E_r & 0 \\ 0 & 0 \end{pmatrix}\) ist klar, dass Zeilenrang und Spaltenrang übereinstimmen (nämlich gleich \(r\) sind). Es genügt daher zu zeigen, dass Zeilenrang und Spaltenrang sich nicht verändern, wenn wir eine Matrix von links und rechts mit invertierbaren Matrizen (der richtigen Größen) multiplizieren. Für den Spaltenrang folgt das aus Teil (3) des folgenden Lemmas. Für den Zeilenrang erhalten wir das Ergebnis, wenn wir das Lemma auf die transponierte Matrix anwenden (denn der Zeilenrang einer Matrix \(A\) ist gleich dem Spaltenrang von \(A^t\), und mit \(S\) und \(T\) sind auch \(S^t\) und \(T^t\) invertierbar, und \((SAT)^t = T^t A^t S^t\)).
Sei \(K\) ein Körper.
Sei \(f\colon V\to W\) eine lineare Abbildung zwischen endlich-dimensionalen \(K\)-Vektorräumen und seien \(c\colon W\to W^\prime \) und \(c^\prime \colon V^\prime \to V\) Isomorphismen. Dann gilt \(\operatorname{rg}(c\circ f\circ c^\prime ) = \operatorname{rg}(f)\).
Sei \(f\colon V\to W\) eine lineare Abbildung zwischen endlich-dimensionalen \(K\)-Vektorräumen. Seien \(\mathscr B\) eine Basis von \(V\) und \(\mathscr C\) eine Basis von \(W\). Dann gilt \(\operatorname{rg}(M^\mathscr B_\mathscr C(f)) = \operatorname{rg}(f)\).
Sei \(A\in M_{m\times n}(K)\). Seien \(S\in M_m(K)\), \(T\in M_n(K)\) invertierbare Matrizen. Dann gilt \(\operatorname{rg}(SAT) = \operatorname{rg}(A)\).
zu (1). Diese Aussage belegt erneut die Philosophie, dass Vektorraumstrukturen durch Isomorphismen erhalten bleiben. Es ist \(\operatorname{Im}(c^\prime ) = V\), weil \(c^\prime \) ein Isomorphismus, also insbesondere surjektiv ist; also ist \(\operatorname{Im}(c\circ f\circ c^\prime ) = \operatorname{Im}(c\circ f)\). Weil \(c\) ein Isomorphismus ist, ist auch die Einschränkung \(c_{\operatorname{Im}(f)}\colon \operatorname{Im}(f)\to W^\prime \) injektiv, induziert somit einen Isomorphismus \(\operatorname{Im}(f)\cong \operatorname{Im}(c\circ f)\). Es folgt \(\operatorname{rg}(f ) \dim \operatorname{Im}(c\circ f) = \dim \operatorname{Im}(c\circ f\circ c^\prime ) = \operatorname{rg}(c\circ f\circ c^\prime )\).
zu (2). Nach Definition ist
und die Aussage folgt aus Teil (1), weil wir bereits wissen, dass \(\operatorname{rg}(M(c_\mathscr C\circ f\circ c_\mathscr B^{-1})) = \operatorname{rg}(c_\mathscr C\circ f\circ c_\mathscr B^{-1})\) ist.
zu (3). Man kann diese Aussage auch durch Argumente »mit Matrizen« beweisen, aber wir wollen einen kurzen und sehr transparenten Beweis geben, der Teil (1) und die Entsprechung von Matrizen und linearen Abbildungen ausnutzt:
Es gilt
wobei wir bei der zweiten Gleichheit Teil (1) nutzen, und in beiden Schritten die Gleichheit \(\operatorname{rg}(\mathbf f_M) = \operatorname{rg}(M)\), die für beliebige Matrizen \(M\) richtig ist.
Man sagt manchmal, zwei Matrizen \(A,B\in M_{m\times n}(K)\) seien äquivalent, wenn invertierbare Matrizen \(S\in M_m(K)\) und \(T\in M_n(K)\) existieren, so dass \(B=SAT\). Aus dem Lemma sehen wir, dass äquivalente Matrizen denselben Rang haben. Aus der oben angesprochenen »Matrizenversion« der Smith-schen Normalform folgt, dass Matrizen mit demselben Rang äquivalent sind.
7.4.1 Zusammenfassung
Wir wollen noch einmal verschiedenes Ergebnisse, die wir inzwischen bewiesen haben, zusammentragen.
Seien \(V\), \(W\) endlich erzeugte Vektorräume der Dimensionen \(n=\dim V\), \(m=\dim W\), und seien \(\mathscr B=(v_1, \dots , v_n)\), \(\mathscr C=(w_1, \dots , w_m)\) Basen von \(V\) bzw. \(W\). Sei \(f\colon V\rightarrow W\) eine lineare Abbildung und \(A=M^\mathscr B_\mathscr C(f)\in M_{m\times n}(K)\) die zugehörige Matrix.
Es ist dann \(\operatorname{Ker}(A) = \operatorname{Ker}(\mathbf f_A)\) die Lösungsmenge des durch \(A\) gegebenen homogenen linearen Gleichungssystems und der Kern der Abbildung \(x\mapsto Ax\). Die Koordinatenabbildung \(c_\mathscr B\) induziert einen Isomorphismus \(\operatorname{Ker}(f) \cong \operatorname{Ker}(A)\).
Andererseits ist \(\operatorname{Im}(A) = \operatorname{Im}(\mathbf f_A)\) die Menge aller \(b\in K^m\), für die das lineare Gleichungssystem mit erweiterter Koeffizientenmatrix \((A\mid b)\) lösbar ist. Die Koordinatenabbildung \(c_\mathscr C\) induziert einen Isomorphismus \(\operatorname{Im}(f)\cong \operatorname{Im}(A)\). Insbesondere gilt \(\operatorname{rg}(f) = \operatorname{rg}(A)\).
Es sind äquivalent:
Die Abbildung \(f\) ist injektiv.
\(\operatorname{Ker}(A) = 0\).
\(\operatorname{rg}(A) = n\).
Die Spalten von \(A\) sind linear unabhängig.
Das durch \(A\) gegebene homogene lineare Gleichungssystem ist eindeutig lösbar (d.h. es existiert nur die triviale Lösung).
Es sind äquivalent:
Die Abbildung \(f\) ist surjektiv.
\(\operatorname{rg}A = m\).
Die Zeilen von \(A\) sind linear unabhängig.
Das lineare Gleichungssystem mit erweiterter Koeffizientenmatrix \((A\mid b)\) ist für alle \(b\in K^m\) lösbar.
Ist \(m=n\), so sind alle Punkte in (1) und (2) äquivalent, und äquivalent zu
Die Abbildung \(f\) ist ein Isomorphismus.
Die Matrix \(A\) ist invertierbar.
Die Spalten von \(A\) bilden eine Basis von \(K^m\).
Das lineare Gleichungssystem mit erweiterter Koeffizientenmatrix \((A\mid b)\) ist für alle \(b\in K^m\) eindeutig lösbar.