Inhalt

B.1 Das Lemma von Zorn

Wir haben in Lemma 3.61 gesehen, dass endliche Produkte von nicht-leeren Mengen stets nicht leer sind – eine Aussage, die sehr einleuchtend ist. Interessanterweise hat die entsprechende Aussage für unendliche Produkte eine besondere Stellung unter den Axiomen der Mengenlehre:

Axiom B.1 Auswahlaxiom

Seien \(I\) eine Menge und \(X_i\), \(i\in I\), nicht-leere Mengen. Dann ist das Produkt \(\prod _{i\in I} X_i\) nicht leer.

Dieses Axiom wurde erstmals 1904 von Zermelo formuliert, gehört aber nicht zu dem Axiomensystem von Zermelo und Fraenkel, das heutzutage mit dem Kürzel ZF bezeichnet wird (diese Axiome wurden nach Vorarbeiten von Zermelo 1921 von Fraenkel formuliert). Es wurde 1938 von Gödel bewiesen, dass das Auswahlaxiom nicht im Widerspruch zu den Axiomen ZF steht, und erst 1963 konnte Cohen zeigen, dass es andererseits auch nicht aus diesen Axiomen folgt.

Das Axiomensystem »ZF + Auswahlaxiom« bezeichnet man mit ZFC (»C« für »axiom of choice«), und es ist das in überwiegenden Teilen der heutigen Mathematik gängige Axiomensystem für die Mengenlehre und damit die Grundlage der allermeisten mathematischen Theorien. Dass das Auswahlaxiom eine Sonderstellung hat, liegt daran, dass man einerseits einen großen Teil der Mathematik auch ohne Auswahlaxiom aus dem Axiomensystem ZF herleiten kann, und andererseits, dass das Auswahl auch einige Konsequenzen hat, die der Intuition widersprechen.

Ein bekanntes Beispiel dafür ist das Banach-Tarski-Paradoxon. Dieses hängt eng damit zusammen, dass es nicht möglich ist, jeder beschränkten Teilmenge von \(\mathbb R^3\) ein »Volumen«, also eine Zahl in \(\mathbb R_{\ge 0}\) zuzuordnen, so dass das Volumen nicht konstant \(0\), additiv für endliche disjunkte Vereinigungen und invariant unter Verschiebungen, Drehungen und Spiegelungen ist.

The Axiom of Choice is obviously true, the well-ordering principle obviously false, and who can tell about Zorn’s lemma?

Jerry Bona

Fundort: https://mathoverflow.net/a/7194

Auch wenn das Auswahlaxiom einige Herausforderungen an unsere Intuition stellt, ist die oben formulierte Aussage doch so überzeugend, dass es üblicherweise (und auch in diesem Skript) in die Liste der verwendeten Axiome aufgenommen wird. Wie erwähnt, ist bewiesen worden, dass es nicht im Widerspruch zu den Axiomen in ZF steht, so dass es aus mathematischer Sicht unkritisch ist, dieses Axiom zu verwenden. Und es ist oft praktisch, weil es so mächtig ist. In der linearen Algebra erlaubt es uns zu beweisen, dass jeder Vektorraum eine Basis besitzt (siehe Ergänzung 6.48).

Man kann zeigen, dass das Auswahlaxiom zu der Aussage, dass jeder Vektorraum eine Basis besitzt, äquivalent ist.

Leicht zu sehen ist, dass das Auswahlaxiom äquivalent ist zu

Satz B.2

Sei \(f\colon X\to Y\) eine surjektive Abbildung. Dann existiert ein Schnitt von \(f\), d.h. eine Abbildung \(g\colon Y\to X\) mit \(f\circ g = \operatorname{id}_Y\).

Proof
Die Existenz von \(g\) entspricht der Existenz eines Elements von \(\prod _{y\in Y} f^{-1}(\{ y\} )\). Wegen der Surjektivität von \(f\) sind die Mengen \(f^{-1}(\{ y\} )\) alle nicht-leer.
Proof

Um aus dem Satz das Auswahlaxiom abzuleiten, betrachtet man für eine Familie \(X_i\) die surjektive Abbildung \(\coprod _{i\in I} X_i\to I\), wobei \(\coprod _{i\in I} X_i\) die »disjunkte Vereinigung« der \(X_i\) ist. Dies ist eine Menge, die alle \(X_i\) als Teilmengen enthält, die gleich der Vereinigung aller dieser Teilmengen \(X_i\) ist, und die \(X_i\cap X_j = \emptyset \) für alle \(i\ne j\) erfüllt. (Formal definiert man die disjunkte Vereinigung der \(X_i\), indem man \(X_i\) identifiziert mit \(\{ i\} \times X_i\), \(i\in I\), und dann die Vereinigung aller dieser Mengen bildet. Durch das Hinzufügen der Komponente \(i\) erreicht man, dass die Kopien der verschiedenen \(X_i\) sich nicht schneiden. Hier wird eine Vereinigung von Mengen gebildet, die nicht Teilmenge einer vorgegebenen Menge sind. Diese Konstruktion ist im Rahmen von ZF durchführbar.)

Eine andere bekannt Aussage, die äquivalent ist zum Auswahlaxiom, ist der

Satz B.3 Wohlordnungssatz

Sei \(X\) eine Menge. Dann existiert eine Wohlordnung auf \(X\), d.h. eine totale Ordnung \(\preceq \), derart dass jede nicht-leere Teilmenge von \(X\) ein kleinstes Element bezüglich \(\preceq \) hat.

Siehe Abschnitt 3.14.3 für die hier verwendeten Begriffe. So plausibel das Auswahlaxiom ist, so schwierig ist es, sich beispielsweise eine Wohlordnung der Menge der reellen Zahlen vorzustellen.

Um zu beweisen, dass jeder Vektorraum eine Basis hat, benötigen wir eine andere zum Auswahlaxiom äquivalente Aussage, und zwar das sogenannte Lemma von Zorn.

Dafür benötigen wir zuerst einige Sprechweisen: Zunächst benutzen wir die Begriffe der partiellen und der totalen Ordnung, wie sie in Abschnitt 3.14.3 eingeführt wurden. Ein besonders passendes Beispiel in unserem Kontext ist die Teilmengenbeziehung: Ist \(M\) eine Menge, so bezeichnen wir mit \(P(M)\) die Potenzmenge von \(M\), also die Menge aller Teilmengen von \(M\). Diese ist mittels der Inklusion \(\subseteq \) partiell geordnet, das bedeutet: Für Elemente \(X,Y, Z\in P(M)\) (also Teilmengen \(X, Y\subseteq M\)) gilt

  1. \(X\subseteq X\),

  2. aus \(X\subseteq Y\) und \(Y\subseteq Z\) folgt \(Y\subseteq Z\),

  3. aus \(X\subseteq Y\) und \(Y\subseteq X\) folgt \(X=Y\).

Bei einer totalen Ordnung müssen zusätzlich je zwei Elemente vergleichbar sein (wie bei der üblichen Anordnung der ganzen Zahlen: Für \(x,y\in \mathbb Z\) gilt \(x\le y\) oder \(y\le x\)). Bei der Inklusion von Teilmengen ist das offensichtlich nicht der Fall: In vielen Situationen gilt weder \(X\subseteq Y\) noch \(Y\subseteq X\). Man spricht daher von einer partiellen Ordnung. Jede Teilmenge \(U \subseteq P(M)\), also eine Menge von Teilmengen von \(M\), der nicht alle Teilmengen angehören müssen, ist dann auch durch die Inklusion \(\subseteq \) partiell geordnet. Während die folgende Diskussion für \(P(M)\) mit der partiellen Ordnung \(\subseteq \) nicht so interessant ist, genügt es, wenn Sie sich alles im Fall einer Teilmenge \(U\subseteq P(M)\) der Potenzmenge irgendeiner Menge \(M\) vorstellen (mit \(\subseteq \) als partieller Ordnung).

Sei nun \(U\) eine Menge mit einer partiellen Ordnung \(\preceq \). Wir hatten in Definition 3.80 definiert, dass ein Element \(x\in U\) maximal (bezüglich \(\preceq \)) heißt, wenn für alle \(y\in U\) aus \(x\preceq y\) schon \(x=y\) folgt.

Beispiel B.4
  1. Sei \(M\) eine Menge und \(U=P(M)\) mit \(\subseteq \) als partieller Ordnung. Dann ist \(M\) ein maximales Element, und zwar das einzige.

  2. Sei \(M\) eine nicht-leere Menge und \(U\subset P(M)\) die Teilmenge von \(P(M)\), die aus allen echten Teilmengen \(X\subsetneq M\) von \(M\) besteht. Dann ist für jedes \(m\in M\) das Element \(M\setminus \{ m\} \) ein maximales Element von \(U\) bezüglich \(\subseteq \).

  3. Seien \(K\) ein Körper und \(V\) ein \(K\)-Vektorraum. Sei \(U\subset P(V)\) die Menge aller linear unabhängigen Teilmengen von \(V\). Wir haben in Satz 6.36 gesehen, dass die maximalen Elemente von \(U\) genau die Basen von \(V\) sind. Das Lemma von Zorn wird uns ein Kriterium für die Existenz eines maximalen Elements in irgendeiner partiell geordneten Menge zur Verfügung stellen. Angewandt auf das Beispiel hier erhalten wir damit das Ergebnis, dass jeder Vektorraum eine Basis besitzt. Siehe Ergänzung 6.48.

Definition B.5

Sei \(U\) eine durch \(\preceq \) partiell geordnete Menge. Sei \(U^\prime \) eine Teilmenge von \(U\). Ein Elemente \(x\in U\) heißt obere Schranke von \(U^\prime \), wenn für alle \(y\in U^\prime \) gilt, dass \(y\preceq x\).

In der vorherigen Definition ist es wichtig, dass wir nicht verlangen, dass die obere Schranke \(x\) ein Element von \(U^\prime \) ist. Im Zornschen Lemma wird die Existenz oberer Schranken für gewisse Teilmengen von \(U\) verlangt. (Eine obere Schranke von \(U\) selbst wäre gerade ein größtes Element; dessen Existenz wollen wir sicherlich nicht zur Voraussetzung machen.) Dafür bemerken wir, dass jede Teilmenge \(U^\prime \subseteq U\) einer partiell geordneten Menge selbst wieder partiell geordnet ist. Je nachdem kann es natürlich passieren, dass die partielle Ordnung von \(U\) auf der Teilmenge \(U^\prime \) sogar eine totale Ordnung induziert; in diesem Fällen fordert man im Lemma von Zorn die Existenz einer oberen Schranke.

Satz B.6 Lemma von Zorn

Sei \(U\) eine nicht-leere Menge mit einer partiellen Ordnung \(\preceq \), die die folgende Eigenschaft hat: Jede Teilmenge \(U^\prime \subseteq U\), die durch \(\preceq \) total geordnet ist, besitzt eine obere Schranke in \(U\).

Dann existiert in \(U\) ein maximales Element bezüglich \(\preceq \).

Formal gesehen kann man darauf verzichten, die Voraussetzung \(U\ne \emptyset \) in die Aussage des Lemmas aufzunehmen, weil die folgende Bedingung, angewandt auf die total geordnete Teilmenge \(U^\prime := \emptyset \), garantiert, dass \(U\) ein Element enthält, nämlich eine obere Schranke der leeren Teilmenge.

Man nennt total geordnete Teilmengen einer partiell geordneten Menge manchmal auch Ketten, und nennt eine partiell geordnete Menge induktiv geordnet, wenn jede Kette eine obere Schranke besitzt. Dann kann man das Lemma von Zorn formulieren als: Jede induktiv geordnete Menge besitzt ein maximales Element.

Wir verzichten darauf, an dieser Stelle zu beweisen, dass das Lemma von Zorn aus dem Auswahlaxiom folgt. Siehe  [ So ]  1.9 für einen gut lesbaren Beweis. Man kann auch zeigen, dass das Auswahlaxiom aus dem Zornschen Lemma folgt (das ist eher noch einfacher zu beweisen als die andere Implikation). Die beiden Aussagen sind also (unter den Axiomen in ZF) äquivalent. Sie könnten daher auch einfach das Zornsche Lemma als eines der Axiome betrachten, die der Mengenlehre zugrunde liegen sollen.

Bemerkung B.7

Wenn in der obigen Situation eine Kette \(U^\prime \) nur endlich viele Elemente hat, so können wir sie uns in der Form

\[ u_0 \preceq \cdots \preceq u_n \]

vorstellen. Dann ist natürlich \(u_n\) eine obere Schranke. Sobald es unendlich viele Elemente in \(U^\prime \) gibt, wird die Sache offenbar komplizierter. Es genügt nicht, den Fall von Ketten der Form

\[ u_0 \preceq u_1 \preceq u_1 \preceq \dots , \]

die durch \(\mathbb N\) indiziert sind, zu betrachten! Um das Zornsche Lemma anwenden zu können, muss man zeigen, dass jede Kette eine obere Schranke besitzt, und eine Kette muss nicht abzählbar sein.

Sonst könnte man zum Beispiel zeigen, dass die Menge der reellen Zahlen eine maximale abzählbare Teilmenge besitzt. Das ist offenbar nicht möglich, da eine abzählbare Teilmenge von \(\mathbb R\) eine echte Teilmenge sein muss, und sie nach Hinzufügen eines weiteren Elements abzählbar bleibt.