16.4 Ergänzungen*
In dieser Bemerkung wird ein anderer Beweis des Satzes von Cayley-Hamilton skizziert, in dem der Satz über den komplexen Zahlen durch ein »Stetigkeitsargument« aus dem Fall von Diagonalmatrizen abgeleitet wird. Um das Argument durchzuführen, werden allerdings Grundkenntnisse der Analysis und Topologie benötigt. Hat man diese Vorkenntnisse zur Verfügung, erhält man so ein schlagendes Argument für den Satz, und dieses Beweisprinzip der Reduktion auf den Fall von Diagonalmatrizen lässt sich auch an anderer Stelle einsetzen. Mithilfe der sogenannten Zariski-Topologie (nach Oscar Zariski), die in der algebraischen Geometrie eine fundamentale Rolle spielt, lässt sich das Argument auch über einem beliebigen Grundkörper durchführen.
Wie oben bemerkt, ist die Aussage des Satzes von Cayley–Hamilton für Diagonalmatrizen offensichtlich. Weil zueinander konjugierte Matrizen dasselbe charakteristische Polynom und Minimalpolynom haben, folgt der Satz (in der Form, dass das Minimalpolynom das charakteristische Polynom teile) damit für alle diagonalisierbaren Matrizen.
Sei nun zunächst \(K=\mathbb C\) der Körper der komplexen Zahlen. Wir können dann von stetigen Abbildungen \(\mathbb C^m\to \mathbb C^m\) sprechen und den Satz von Cayley–Hamilton mit dem folgenden »topologischen« Argument beweisen. Die Abbildung
ist eine stetige Abbildung, denn die Einträge der Matrix \(\operatorname{charpol}_A(A)\) lassen sich als polynomiale Ausdrücke in den Einträgen von \(A\) schreiben, und Polynomfunktionen sind stetig.
Nun gilt für jede stetige Abbildung, dass des Urbild einer abgeschlossenen Teilmenge des Wertebereichs ebenfalls abgeschlossen ist. (Das ist sogar äquivalent zur Stetigkeit.) Angewandt auf die abgeschlossene Teilmenge \(\{ 0\} \subseteq M_n(\mathbb C)\) sehen wir damit, dass die Teilmenge von \(M_n(\mathbb C)\), die aus allen Matrizen \(A\) mit \(\operatorname{charpol}_A(A)=0\) besteht, abgeschlossen ist.
Damit genügt es, die folgende Aussage zu zeigen: Jede abgeschlossene Teilmenge von \(M_n(\mathbb C)\), die alle diagonalisierbaren Matrizen enthält, stimmt mit \(M_n(\mathbb C)\) überein. Mit anderen Worten müssen wir begründen, dass in jedem Ball mit Radius \(\epsilon {\gt} 0\) um eine beliebige Matrix stets eine diagonalisierbare Matrix liegt.
Dafür benutzen wir, dass eine Matrix, deren charakteristisches Polynom in \(n\) verschiedene Linearfaktoren zerfällt, jedenfalls diagonalisierbar ist. Das folgt – ohne den Satz von Cayley–Hamilton benutzen zu müssen – aus den obigen Ergebnissen. Denn das Minimalpolynom muss dann auch in \(n\) verschiedene Linearfaktoren zerfallen, es hat also nur einfache Nullstellen.
Die Bedingung, dass das charakteristische Polynom in \(n\) verschiedene Linearfaktoren zerfalle, bedeutet, dass es nur einfache Nullstellen hat (denn über dem algebraisch abgeschlossenen Körper \(\mathbb C\) zerfällt es jedenfalls vollständig in Linearfaktoren), also dass die Diskriminante \(\Delta _{\operatorname{charpol}_A}\in \mathbb C\) dieses Polynoms von \(0\) verschieden ist (Bemerkung 15.84). Die Menge der nicht-diagonalisierbaren Matrizen ist also enthalten in der Menge
Nun ist auch \(\Delta _{\operatorname{charpol}_A}\) ein polynomialer Ausdruck in den Koeffizienten von \(A\), und die Nullstellenmenge eines Polynoms \(\ne 0\) (in mehreren Variablen, in diesem Fall in den \(n^2\) Variablen, die zu den Einträgen der Matrix \(A\in M_n(\mathbb C)\) korrespondieren) kann keinen offenen Ball enthalten. (Dies kann man durch Induktion nach Anzahl der Unbestimmten zeigen.)
Den Fall des Körpers \(K=\mathbb R\) der reellen Zahlen kann man ähnlich behandeln, wenn man benutzt, dass das charakteristische Polynom eine Matrix \(A\in M_n(\mathbb R)\) davon unabhängig ist, ob man \(A\) als Element von \(M_n(\mathbb R)\) oder von \(M_n(\mathbb C)\) betrachtet.
Wir können jetzt Bemerkung LA1.10.18 noch präzisieren: Ist \(K\) ein Körper der Charakteristik \(0\), d.h. dass der eindeutig bestimmte Ringhomomorphismus \(\mathbb Z\to K\) injektiv ist, und sind \(A,B\in M_n(K)\), so sind äquivalent:
Für alle \(i\ge 1\) gilt \(\operatorname{Spur}(A^i) = \operatorname{Spur}(B^i)\).
Es gilt \(\operatorname{charpol}_A = \operatorname{charpol}_B\).
Insbesondere haben also in dieser Situation \(A\) und \(B\) dieselben Eigenwerte, und ihre algebraischen Vielfachheiten, also die Vielfachheiten als Nullstelle des charakteristischen Polynoms, stimmen ebenfalls überein.
Von H. Derksen wurde ein Beweis des Fundamentalsatzes der Algebra gegeben, der bis auf die beiden unten angegebenen Fakten (1) und (2) nur lineare Algebra benötigt. Allerdings sind die Beweise, die mit Methoden von fortgeschrittenen Vorlesungen (speziell der Funktionentheorie einerseits und der Algebra andererseits) gegeben werden können, letztlich erhellender, weil die Struktur der Situation insgesamt klarer wird.
Ist \(f\in \mathbb C[X]\) ein Polynom vom Grad \({\gt} 1\), dann besitzt \(f\) eine Nullstelle in \(\mathbb C\).
Die beiden »analytischen« Eigenschaften, die in Derksens Beweis benötigt werden, sind
Jedes Polynom in \(\mathbb R[X]\) von ungeradem Grad besitzt eine Nullstelle in \(\mathbb R\).
Jedes quadratische Polynom in \(\mathbb C[X]\) hat eine Nullstelle in \(\mathbb C\).
Den ersten Punkt erhält man aus dem Zwischenwertsatz und der Betrachtung des Grenzwerts der gegebenen Polynomfunktion für \(x\to \pm \infty \). Der zweite Punkt folgt (mit einer Methode zur Lösung quadratischer Gleichungen nach Wahl) daraus, dass jede komplexe Zahl eine Quadratwurzel besitzt.
Der Beweis beruht auf einer trickreichen Formulierung, die es erlaubt, an mehreren Stellen mit vollständiger Induktion zu arbeiten. Siehe [ De ] .