Inhalt

15.4 Integritätsbereiche

15.4.1 Definition

Sei \(R\) ein Ring. In diesem Abschnitt betrachten wir nur kommutative Ringe. Wir haben schon Beispiele von Ringen gesehen, in denen so genannte Nullteiler existieren – Elemente \(x\), so dass \(xy=0\) für ein \(y\ne 0\) – die von \(0\) verschieden sind. Das ist sozusagen eine unangenehme Eigenschaft, und wir werden uns daher an vielen Stellen auf nullteilerfreie Ringe einschränken, also auf Ringe, in denen \(0\) der einzige Nullteiler ist. Wir machen dafür die folgende Definition.

Definition 15.28

Ein kommutativer Ring \(R\) heißt Integritätsbereich (oder Integritätsring), wenn \(R\ne \{ 0 \} \) und für alle \(x, y\in R\) mit \(xy=0\) gilt: \(x=0\) oder \(y=0\).

Beispiel 15.29

Der Ring \(\mathbb Z\) und alle Körper sind Integritätsbereiche. Der Ring \(\left.\mathbb Z\middle /n\right.\) ist genau dann ein Integritätsring, wenn \(n\) eine Primzahl ist. In diesem Fall ist \(\left.\mathbb Z\middle /n\right.\) ja sogar ein Körper. Andernfalls können wir \(n=ab\) mit \(1 {\lt} a,b {\lt} n\) schreiben, und dann gilt in \(\left.\mathbb Z\middle /n\right.\), dass \(a, b\ne 0\) aber \(ab=0\) ist.

Lemma 15.30

Sei \(R\) ein kommutativer Ring und seien \(f,g\in R[X]\). Dann gilt

  1. \(\deg (f+g) \le \max (\deg f, \deg g)\),

  2. \(\deg (fg) \le \deg f + \deg g\), und falls \(R\) ein Integritätsbereich ist, so gilt sogar die Gleichheit.

Wie wir sehen werden, gelten die Aussagen des Lemmas (mit unserer Definition \(\deg (0)=-\infty \)) auch für den Fall, dass \(f\) oder \(g\) das Nullpolynom ist, wenn man mit \(-\infty \) in der »offensichtlichen« Weise rechnet, das heißt es gelte

\[ -\infty \le -\infty ,\quad -\infty \le n\ \text{für alle}\ n\in \mathbb N, \]

und

\[ -\infty + (-\infty ) = -\infty ,\quad -\infty + n = n+(-\infty ) = -\infty \ \text{für alle}\ n\in \mathbb N. \]

Insbesondere ist dann \(\max (-\infty , n) = n\) für alle \(n\in \mathbb N\cup \{ -\infty \} \).

Beweis

Es ist klar, dass für \(f=0\) oder \(g=0\) beide Aussagen richtig sind (und das erklärt, warum es sinnvoll ist, dem Nullpolynom auf diese formale Art den Grad \(-\infty \) zuzuweisen).

Nun gelte \(f\ne 0\) und \(g\ne 0\). Wir schreiben

\[ f(X) = \sum _{i=0}^m a_i X^i,\qquad g(X) = \sum _{i=0}^n b_i X^i \]

mit \(a_m \ne 0\) und \(b_n\ne 0\). Ist \(m\ne n\), so ist der Grad von \(f+g\) gleich der größeren der beiden Zahlen \(m\) und \(n\). Ist \(m=n\), dann ist ebenfalls \(\deg (f+g) = \max (m, n)\), es sei denn, es gilt \(a_m = -b_n\). Im letzteren Fall ist \(\deg (f+g) {\lt} \max (m, n)\). Damit ist Teil (1) bewiesen.

Für Teil (2) müssen wir nur beobachten, dass

\[ f(X) \, g(X) = \sum _{i=0}^{m+n} \left(\sum _{j+k=i} a_jb_k\right) X^i \]

gilt, und daher jedenfalls \(\deg (fg) \le m+n = \deg f + \deg g\) ist. Weil \(j,k\ge 0\) gilt, hat die Summe für \(i=m+n\) nur den einen Summanden \(a_m b_n\). Ist \(R\) ein Integritätsring, so ist das Produkt \(a_m b_n\ne 0\), und es folgt \(\deg (fg) = m+n\).

Korollar 15.31

Sei \(R\) ein Integritätsring. Dann ist auch \(R[X]\) ein Integritätsring. Es gilt \(R[X]^\times = R^\times \).

Beweis

Es folgt aus Lemma 15.30, dass das Produkt von zwei Polynomen \(f, g\in R[X]\setminus \{ 0\} \) nicht \(=0\) sein kann. Es ist auch klar, dass \(R[X]\) nicht der Nullring ist, sofern \(R\) nicht der Nullring ist. Also ist \(R[X]\) ein Integritätsring.

Ist \(f\in R[X]^\times \), so existiert \(g\in R[X]\) mit \(fg=1\), also ist \(\deg (fg) =0\). Aus Lemma 15.30 folgt dann \(\deg (f) = \deg (g) = 0\) (hier benutzen wir erneut, dass \(R\) ein Integritätsring ist!), also sind \(f\) und \(g\) konstante Polynome und es folgt \(f\in R^\times \).

Machen Sie sich klar, dass für einen endlichen Körper \(K\) der Ring \(\operatorname{Pol}(K)\) der Polynomfunktionen \(K\to K\) (siehe Bemerkung 15.27) kein Integritätsring ist.

15.4.2 Teilbarkeit in Integritätsringen

Eine wichtige Eigenschaft von Integritätsringen ist die sogenannte Kürzungsregel.

Lemma 15.32

Ist \(R\) ein Integritätsring, und sind \(a,b,c\in R\) mit \(a\ne 0\) und \(ab=ac\), so folgt \(b=c\).

Beweis

Aus \(ab = ac\) folgt \(a(b-c) = ab-ac = 0\), also \(b-c = 0\), weil wir \(a\ne 0\) vorausgesetzt haben und \(R\) ein Integritätsring ist.

Wir wollen nun den Begriff des Teilers, den wir vom Ring der ganzen Zahlen her kennen, für allgemeine Integritätsringe definieren.

Definition 15.33

Sei \(R\) ein Integritätsring. Seien \(a,b\in R\)

  1. Wir sagen, \(a\) sei ein Teiler von \(b\) (oder \(b\) sei durch \(a\) teilbar, in Zeichen \(a\, |\, b\)), falls \(c\in R\) existiert mit \(ac=b\). Es ist äquivalent zu sagen, dass \(b\) ein Vielfaches von \(a\) sei. Wenn \(a\) kein Teiler von \(b\) ist, dann schreiben wir \(a\nmid b\).

  2. Wir nennen \(a\), \(b\) zueinander assoziiert, falls \(c\in R^\times \) existiert mit \(ac=b\).

Da das Element \(c\) in Teil (2) der Definition eine Einheit sein muss, können wir die Gleichung \(ac=b\) auch umschreiben als \(bc^{-1} = a\); wie die Sprechweise suggeriert, kommt es also nicht auf die Reihenfolge von \(a\) und \(b\) an. (Die Relation »assoziiert zu« ist symmetrisch, Abschnitt LA1.3.14, Definition LA1.3.67, siehe auch Definition 3.67 unten.)

Lemma 15.34

Seien \(R\) ein Integritätsring und \(a,b\in R\).

  1. Es sind äquivalent:

    1. \(a\, |\, b\),

    2. \(b \in (a)\),

    3. \((b) \subseteq (a)\).

  2. Es sind äquivalent:

    1. \(a\) und \(b\) sind assoziiert zueinander,

    2. \(a\, |\, b\) und \(b\, |\, a\),

    3. \((a) = (b)\).

Beweis

Der Beweis von Teil (1) ist einfach. In Teil (2) ist klar, dass für assoziierte Elemente \(a\) und \(b\) gilt, dass \((a) = (b)\) ist. Wegen Teil (1) ist das äquivalent zu der Bedingung, dass \(a\, |\, b\) und \(b\, |\, a\). Gilt umgekehrt \((a) = (b)\), etwa \(b = ca\) und \(a = db\), so folgt \(a = cd a\) und damit \((1-cd)a=0\). Weil \(R\) ein Integritätsring ist, folgt \(a = 0\) (also auch \(b=0\)) oder \(1-cd=0\), und das impliziert, dass \(c\) und \(d\) Einheiten von \(R\) sind, also dass \(a\) und \(b\) zueinander assoziiert sind.

Grundlegende Eigenschaften der Teilbarkeit wie die folgenden lassen sich dann leicht beweisen:

\[ a\, |\, b,\ b\, |\, c\quad \Longrightarrow \quad a\, |\, c \]

und

\[ a\, |\, b,\ a\, |\, c\quad \Longrightarrow \quad a\, |\, (b+c) \]

für alle \(a,b,c\in R\).

Es stellt sich heraus, dass der Begriff des Integritätsrings so allgemein ist, dass keine allgemeine »vernünftige« Theorie von Teilbarkeit zu erwarten ist (konkret: im allgemeinen gibt es kein analoges Ergebnis zur eindeutigen Primfaktorzerlegung, die wir in \(\mathbb Z\) haben). Besonders gut verhalten sich Integritätsringe, in denen wir eine Division mit Rest, ähnlich wie in \(\mathbb Z\), haben.

Im Ring der ganzen Zahlen können wir Division mit Rest durchführen: Sind \(a\) und \(b\) ganze Zahlen, so existieren \(q, r\in \mathbb Z\) mit \(a = qb+r\) und \(\lvert r\rvert {\lt} \lvert b\rvert \). Dabei sind \(q\) und \(r\) sogar eindeutig bestimmt: Es ist \(q\) die größte ganze Zahl, die \(\le \frac ab\) ist, und \(r = a-qb\). Die Division mit Rest ist eine essenzielle Eigenschaft des Rings der ganzen Zahlen, aus der sich viele nützliche Eigenschaften folgern lassen, und es ist daher naheliegend zu untersuchen, ob es in anderen Ringen eine ähnliche »Division mit Rest« gibt. (Siehe auch Ergänzung LA1.3.44.)

Satz 15.35 Polynomdivision

Sei \(R\) ein kommutativer Ring und seien \(f, g \in R[X]\), so dass der Leitkoeffizient von \(g\) in \(R^\times \) liegt. Dann existieren eindeutig bestimmte Polynome \(q, r\in R[X]\) mit \(\deg r {\lt} \deg g\) und so dass

\[ f = qg + r. \]

Für uns ist vor allem der Fall wichtig, dass \(R\) ein Körper ist. In diesem Fall ist die Bedingung, dass der Leitkoeffizient von \(g\) eine Einheit ist, dazu äquivalent, dass \(g\ne 0\) gilt.

Beweis

Wir führen Induktion nach dem Grad von \(f\). Die Voraussetzung an \(g\) impliziert insbesondere, dass \(g\ne 0\), also \(\deg (g)\in \mathbb N\) ist. Ist \(\deg (f) {\lt} \deg (g)\), so können wir einfach \(q=0\), \(r=f\) setzen.

Sei nun \(m:= \deg (f) \ge \deg (g) =: n\). Insbesondere ist dann \(f\ne 0\). Sei \(a\in R\) der Leitkoeffizient von \(f\) und \(b\in R^\times \) der Leitkoeffizient von \(g\). Dann ist

\[ h :=f - ab^{-1}X^{m-n}g \]

ein Polynom vom Grad \({\lt} m\), denn \(f\) und \(ab^{-1}X^{m-n}g\) sind Polynome vom Grad \(m\) mit demselben Leitkoeffizienten \(a\). Nach Induktionsvoraussetzung können wir \(h\) in der Form \(q_1g+r\) mit \(\deg (r) {\lt} \deg (g)\) schreiben. Wir setzen dann \(q := q_1 + ab^{-1}X^{m-n}\) und erhalten

\[ f = h + ab^{-1}X^{m-n}g = q_1g+r+ ab^{-1}X^{m-n}g = qg+r. \]

Die Eindeutigkeit kann man folgendermaßen begründen: Ist

\[ f = q_1 g + r_1 = q_2 g + r_2 \]

mit \(\deg (r_1), \deg (r_2) {\lt} \deg (g)\), dann folgt

\[ r_2 - r_1 = (q_1-q_2)g, \]

und das ist aus Gradgründen nur möglich, wenn \(q_1-q_2 = 0\) ist. Also ist \(q_1=q_2\) und damit auch \(r_1=r_2\).

Vergleiche auch Lemma LA1.4.26 und Beispiel LA1.4.27.

Definition 15.36

Ein Integritätsring \(R\) heißt euklidischer Ring, falls eine Abbildung

\[ \delta \colon R\setminus \{ 0\} \rightarrow \mathbb N \]

(eine sogenannte Gradabbildung) existiert, so dass für alle \(a,b \in R\), \(b\ne 0\), Elemente \(q, r\in R\) existieren, so dass \(r = 0\) oder \(\delta (r) {\lt} \delta (b)\) und \(a = qb+r\).

Es wird in der Definition nicht verlangt, dass \(q\) und \(r\) für gegebene \(a\) und \(b\) eindeutig bestimmt sind.

Beispiel 15.37
  1. Der Ring \(\mathbb Z\) ist euklidisch, als Gradfunktion können wir den Absolutbetrag verwenden: \(\delta (a) = \lvert a\rvert \). Das folgt daraus, dass wir im Ring \(\mathbb Z\) die Division mit Rest haben.

  2. Sei \(K\) ein Körper. Dann ist der Polynomring \(K[X]\) mit der Gradfunktion \(\delta (f) = \deg (f)\) ein euklidischer Ring. Dies folgt daraus, dass wir im Ring \(K[X]\) die Polynomdivision durchführen können.

  3. Der Ring \(\mathbb Z[i] = \{ a+ib;\ a,b\in \mathbb Z\} \) ist euklidisch (siehe die Übungsaufgaben).

Menschen, die von der Algebra nichts wissen, können sich auch nicht die wunderbaren Dinge vorstellen, zu denen man mit Hilfe der genannten Wissenschaft gelangen kann.

Gottfried Wilhelm Leibniz

Fundort: http://www.mathe.tu-freiberg.de/~hebisch/cafe/zitate.html

Definition 15.38
  1. Ein Ideal \(\mathfrak a\) in einem Ring \(R\) heißt Hauptideal, wenn ein Element \(a\in R\) existiert, so dass \(\mathfrak a = (a) := \{ xa ;\ x\in R\} \).

  2. Ein Integritätsring \(R\) heißt Hauptidealring, wenn jedes Ideal in \(R\) ein Hauptideal ist.

Der Erzeuger eines Hauptideals ist in der Regel nicht eindeutig bestimmt. Ist \(R\) ein Integritätsring, so folgt aus Lemma 15.34, dass Elemente \(a\), \(b\) genau dann dasselbe Hauptideal erzeugen, wenn sie zueinander assoziiert sind.

Satz 15.39

Jeder euklidische Ring ist ein Hauptidealring. Insbesondere gilt:

  1. Der Ring \(\mathbb Z\) ist ein Hauptidealring.

  2. Ist \(K\) ein Körper, dann ist der Polynomring \(K[X]\) in einer Unbestimmten über \(K\) ein Hauptidealring.

Beweis

Sei \(R\) ein euklidischer Ring mit Gradfunktion \(\delta \). Sei \(\mathfrak a\subseteq R\) ein Ideal. Ist \(\mathfrak a\) das Nullideal, dann handelt es sich trivialerweise um ein Hauptideal: \(\mathfrak a = (0)\). Andernfalls sei \(a\in \mathfrak a \setminus \{ 0\} \) ein Element, für das der Wert \(\delta (a)\) minimal ist. Wir wollen zeigen, dass \(\mathfrak a = (a)\) gilt. Die Inklusion \(\supseteq \) ist klar, weil \(a\) nach Definition in \(\mathfrak a\) liegt.

Sei nun \(x\in \mathfrak a\). Wir benutzen jetzt, dass \(R\) euklidisch ist und schreiben \(x = qa+r\) mit \(r = 0\) oder \(\delta (r) {\lt} \delta (a)\). Ist \(r=0\), so folgt \(x = qa \in (a)\), wie gewünscht. Der Fall \(r\ne 0\), \(\delta (r) {\lt} \delta (a)\) kann gar nicht eintreten, denn es ist \(r = x-qa \in \mathfrak a\), und \(a\) war so gewählt, dass kein Element aus \(\mathfrak a\setminus \{ 0\} \) unter \(\delta \) einen kleineren Wert als \(\delta (a)\) annimmt.

Beispiel 15.40

Der Ring \(\mathbb Z[X]\) ist kein Hauptidealring (zum Beispiel ist das Ideal \((2,X)\) kein Hauptideal – warum?). Insbesondere ist \(\mathbb Z[X]\) kein euklidischer Ring: Die Funktion \(\deg \) ist keine Gradabbildung mit den in der Definition euklidischer Ringe geforderten Eigenschaften, und es gibt auch keine andere Abbildung \(\mathbb Z[X]\setminus \{ 0\} \to \mathbb N\), die diese Eigenschaften hat.

Insbesondere sehen wir, dass der Polynomring über einem Integritätsring \(R\) nicht unbedingt ein euklidischer Ring. Wenn man das Studium der Ringtheorie noch ein kleines bisschen weiterführt, kann man zeigen, dass \(R[X]\) genau dann ein Hauptidealring ist, wenn \(R\) ein Körper ist.

Es gibt auch Hauptidealringe, die nicht euklidisch sind, es ist aber nicht ganz einfach, hierfür Beispiele zu geben (siehe zum Beispiel  [ Sch ] 6.10).

Definition 15.41

Sei \(R\) ein Integritätsring, seien \(a, b\in R\).

  1. Ein Element \(d\in R\) heißt größter gemeinsamer Teiler von \(a\), \(b\), wenn \(d\, |\, a\), \(d\, |\, b\), und für jedes Element \(d'\), das \(a\) und \(b\) teilt, \(d'\, |\, d\). Man schreibt oft \(\operatorname{ggT}(a,b)\) für einen größten gemeinsamen Teiler von \(a\) und \(b\) (aber siehe die folgende Bemerkung – diese Notation ist nicht ganz unproblematisch!).

  2. Ein Element \(d\in R\) heißt kleinstes gemeinsames Vielfaches von \(a\), \(b\), wenn \(a\, |\, d\), \(b\, |\, d\), und für jedes Element \(d'\), das von \(a\) und \(b\) geteilt wird, \(d\, |\, d'\). Man schreibt oft \(\operatorname{kgV}(a,b)\) für ein kleinstes gemeinsames Vielfaches von \(a\) und \(b\) (aber siehe die folgende Bemerkung – diese Notation ist nicht ganz unproblematisch!).

  3. Die Elemente \(a, b\) heißen teilerfremd, falls \(1\) ein größter gemeinsamer Teiler von \(a\) und \(b\) ist.

Man beachte, dass das Zeichen \( {\gt} \) in der Definition des Begriffs des größten gemeinsamen Teilers nicht auftritt – in einem allgemeinen Integritätsring steht uns ja keine Anordnung der Elemente zur Verfügung. Angewandt auf den Ring der ganzen Zahlen stimmt die obige Definition aber mit der üblichen Definition überein (siehe Lemma LA1.3.53). (Wenn Sie den Begriff der partiellen Ordnung kennen (Abschnitt LA1.3.14.3), dann sollten Sie die Definition eines größten gemeinsamen Teilers mit der Definition eines größten Elements bezüglich einer partiellen Ordnung vergleichen. Da die Teilbarkeitsrelation aber meistens nicht antisymmetrisch ist, und daher keine partielle Ordnung ist, passt das nicht vollständig zusammen. Wenn man sich auf die natürlichen Zahlen als Grundmenge einschränkt, dann erhält man aber eine partielle Ordnung, siehe Beispiel LA1.3.81. Im allgemeinen Fall könnte man aus jeder Klasse zueinander assoziierter Element jeweils eines auswählen und erhielte dann mit der Teilbarkeit eine partielle Ordnung.)

Bemerkung 15.42

Sei \(R\) ein Integritätsring.

  1. Sind \(a,b\in R\) und erfüllen \(d_1\) und \(d_2\) die Eigenschaft eines größten gemeinsamen Teilers, dann gilt \(d_1\, |\, d_2\) und \(d_2\, |\, d_1\), also sind \(d_1\) und \(d_2\) zueinander assoziiert. Andererseits ist für jeden größten gemeinsamen Teiler \(d\) von \(a\) und \(b\) und jede Einheit \(u\in R^\times \) offenbar auch \(ud\) ein größter gemeinsamer Teiler von \(a\) und \(b\). Ähnlich verhält es sich mit dem kleinsten gemeinsamen Vielfachen.

    Weil größter gemeinsamer Teiler und kleinstes gemeinsames Vielfaches nur bis auf Multiplikation mit Einheiten aus \(R\) eindeutig bestimmt sind, ist es eine ungenaue Notation, \(d = \operatorname{ggT}(a,b)\) zu schreiben (und entsprechend für \(\operatorname{kgV}(a,b)\)).

    Zum Beispiel sind im Ring \(\mathbb Z\) sowohl \(2\) als auch \(-2\) ein größter gemeinsamer Teiler von \(-6\) und \(14\).

  2. Im allgemeinen müssen ein größter gemeinsamer Teiler bzw. ein kleinstes gemeinsames Vielfaches zweier Elemente nicht existieren. Selbst wenn ein größter gemeinsamer Teiler \(d\) von \(a,b\in R\) existiert, kann man \(d\) im allgemeinen nicht in der Form \(xa+yb\) ausdrücken (wie es im Ring der ganzen Zahlen möglich ist, siehe Lemma LA1.3.53 bzw. den folgenden Punkt (3)). Im allgemeinen folgt aus der Bedingung, dass \(1\) ein größter gemeinsamer Teiler von \(a\) und \(b\) ist, also nicht, dass das von \(a\) und \(b\) erzeugte Ideal das Einsideal ist.

  3. Ein Element \(d\in R\) ist genau dann ein gemeinsamer Teiler von \(a\) und \(b\), wenn \((a,b)\subseteq (d)\) gilt (siehe Lemma 15.34). Wenn \((a,b) = (d)\) ein Hauptideal ist, dann folgt mit demselben Lemma, dass \(d\) ein größter gemeinsamer Teiler von \(a\) und \(b\) ist.

    Wir sehen insbesondere, dass in einem Hauptidealring ein größter gemeinsamer Teiler zweier Elemente immer existiert. Außerdem erzeugen in diesem Fall Elemente \(a\) und \(b\) genau dann das Einsideal, wenn \(1\) größter gemeinsamer Teiler von \(a\) und \(b\) ist.

  4. Ist \(R\) sogar euklidisch, dann kann man den größten gemeinsamen Teiler von \(a\) und \(b\) mit dem euklidischen Algorithmus (Bemerkung 15.43) berechnen.

Siehe auch Bemerkung 15.54.

Bemerkung 15.43 Der euklidische Algorithmus

Ist \(R\) ein Hauptidealring und sind \(a, b\in R\), so ist \((a,b)\) ein Hauptideal. In euklidischen Ringen kann man mit dem sogenannten Euklidischen Algorithmus recht leicht ein Element \(d\in R\) berechnen, für das \((a, b) = (d)\) gilt. Wie in Bemerkung 15.42 erläutert, bedeutet das genau, dass \(d\) ein ggT von \(a\) und \(b\) ist. Wir nehmen dazu an, dass \(a, b\ne 0\) ist, denn sonst ist nichts zu tun.

Der Algorithmus besteht darin, induktiv eine Folge \(a_0, a_1, a_2, \dots \) von Elementen in \(R\) wie folgt zu definieren bzw. zu berechnen:

\[ a_0 := a,\quad a_1 := b \]

und für \(i {\gt} 1\) definieren wir \(a_i\) durch Division von \(a_{i-2}\) durch \(a_{i-1}\) mit Rest, d.h. wir schreiben

\[ a_{i-2} = q_{i-1} a_{i-1} + a_{i}. \]

Der Algorithmus bricht ab, sobald \(a_{k+1} = 0\) ist, das Ergebnis ist dann \(d:= a_k\), wie wir nachfolgend begründen werden. Weil für die Gradfunktion \(\delta \) von \(R\) gilt, dass

\[ \delta (a_1) {\gt} \delta (a_{2}) {\gt} \delta (a_{3}) {\gt} \cdots \]

(solange \(a_i\ne 0\) gilt), ist das nach endlich vielen Schritten der Fall.

Dann folgt aus \(a_{i-2} = q_i a_{i-1} + a_{i}\), dass \((a_{i-1}, a_i) = (a_{i-2}, a_{i-1})\) gilt, und aus der letzten Gleichung \(a_{k-1} = q_k a_k\) folgt \(a_{k-1}\in (a_k)\), also

\[ (a_k) = (a_{k-1}, a_k) = (a_{k-2}, a_{k-1}) = \cdots = (a,b), \]

wir haben also tatsächlich einen Erzeuger des Hauptideals \((a,b)\) gefunden.

Oft ist es nützlich, dass der Algorithmus auch eine Möglichkeit liefert, eine Darstellung der Form \(a_k = xa+yb\) zu berechnen. Dazu betrachten wir die Gleichungskette

\begin{align*} a_k & = a_{k-2} - q_{k-1}a_{k-1}\\ & = a_{k-2} - q_{k-1} (a_{k-3} - q_{k-2} a_{k-2}) \\ & = -q_{k-1} a_{k-3} + (1+q_{k-1}q_{k-2})a_{k-2} \\ & = -q_{k-1} a_{k-3} + (1+q_{k-1}q_{k-2})(a_{k-4} - q_{k-3}a_{k-3}) \\ & = \cdots , \end{align*}

aus der wir die gewünschte Darstellung \(a_k = xa_0 + ya_1 = xa+yb\) erhalten.

15.4.3 Faktorielle Ringe

Wir wollen nun eine Klasse von Ringen definieren und untersuchen, in der ein Analogon der eindeutigen Primfaktorzerlegung gilt, die wir vom Ring der ganzen Zahlen kennen (Satz LA1.3.56).

Eine Primzahl ist eine natürliche Zahl \(p {\gt} 1\), die sich nicht als Produkt \(ab\) mit \(a,b\in \mathbb Z\), \(1 {\lt} a,b {\lt} p\) schreiben lässt. Um diesen Begriff auf beliebige Integritätsringe zu übertragen, ist es sinnvoll, die Einschränkung auf Zahlen \({\gt} 1\) fallenzulassen und auch Zahlen \({\lt} -1\) zu betrachten, die sich nicht in nichttrivialer Weise als Produkt schreiben lassen. Das Nullelement und die Einheiten \(1, -1\in \mathbb Z^\times \) spielen eine Sonderrolle. Der Begriff, den man so erhält, ist der des »irreduziblen Elements«, Definition 15.44 (1). Oft ist eine andere Eigenschaft von Primzahlen aber wichtiger, nämlich die sogenannte Primeigenschaft. Wenn eine Primzahl \(p\) ein Produkt teilt, dann teilt sie auch einen der Faktoren:

\[ p\, |\, ab\quad \Longrightarrow \quad p\, |\, a\ \text{oder}\ p\, |\, b. \]

Siehe Satz LA1.3.52 für einen Beweis. Wir haben diese Eigenschaft von Primzahlen in Abschnitt LA1.4.2.1 benutzt, um zu zeigen, dass der Restklassenring \(\left.\mathbb Z\middle /p\right.\) für eine Primzahl \(p\) ein Körper ist. Diese Eigenschaft ist die Grundlage von Teil (2) der folgenden Definition. In allgemeinen Integritätsringen müssen diese Eigenschaften nicht zusammenfallen!

Definition 15.44

Sei \(R\) ein Integritätsring.

  1. Ein Element \(p\in R\setminus (R^\times \cup \{ 0\} )\) heißt irreduzibel, falls für alle \(a,b\in R\) mit \(p=ab\) gilt: \(a\in R^\times \) oder \(b\in R^\times \).

  2. Ein Element \(p\in R\setminus (R^\times \cup \{ 0\} )\) heißt prim (oder Primelement), falls für alle \(a,b\in R\) mit \(p\, |\, ab\) gilt: \(p\, |\, a\) oder \(p\, |\, b\).

Ist \(R\) ein Integritätsring und sind \(p,a,b\in R\) mit \(p=ab\ne 0\), dann ist \(a\) genau dann eine Einheit in \(R\), wenn \(p\) und \(b\) assoziiert sind. Denn wenn \(a\) eine Einheit ist, so folgt direkt aus der Definition, dass \(p\) und \(b\) assoziiert zueinander sind. Und wenn \(p\) und \(b\) assoziiert sind, sagen wir \(p= ub\) mit \(u\in R^\times \), so folgt \(ub = ab\) und mit der Kürzungsregel, dass \(a = u \in R^\times \) ist. Wir könnten also Teil (1) der Definition auch so formulieren, dass \(p\in R\setminus (R^\times \cup \{ 0\} )\) genau dann irreduzibel ist, wenn in jeder Darstellung \(p=ab\) einer der Faktoren zu \(p\) assoziiert ist.

Satz 15.45

Sei \(R\) ein Integritätsring. Ist \(p\in R\) prim, so ist \(p\) irreduzibel. Ist \(R\) ein Hauptidealring, so gilt auch die Umkehrung.

Beweis

Sei zunächst \(p\) prim. Wenn sich \(p\) als Produkt \(p = ab\) schreiben lässt, so folgt aus der Primeigenschaft \(p\, |\, a\) oder \(p\, |\, b\). Nehmen wir ohne Einschränkung an, dass der erste Fall eintritt. Andererseits impliziert \(p=ab\) auch, dass \(a\) ein Teiler von \(p\) ist. Wir haben also \(a\, |\, p\) und \(p\, |\, a\), und es folgt, dass \(a\) und \(p\) zueinander assoziiert sind. Wie oben bemerkt, zeigt das die Irreduzibilität von \(p\).

Sei nun \(R\) ein Hauptidealring und \(p\in R\) irreduzibel. Wir wollen zeigen, dass \(p\) prim ist. Seien also \(a,b\in R\) mit \(p\, |\, ab\). Nehmen wir an, dass \(p\nmid a\) gilt, also \(a\not\in (p)\). Dann ist \((p)\subsetneq (a,p)\) eine echte Teilmenge. Hier ist \((a,p)\) das von \(a\) und \(p\) erzeugte Ideal, das wir folgendermaßen explizit beschreiben können:

\[ (a,p) = \{ xa+yp;\ x,y\in R\} . \]

In der Tat ist klar, dass hier \(\supseteq \) gilt, da \(a\) und \(p\) in \((a,p)\) liegen und wegen der Idealeigenschaft folglich auch alle Ausdrücke der Form \(xa+yp\). Andererseits ist leicht zu sehen, dass die rechte Seite ein Ideal ist, und weil \((a,p)\) das kleinste Ideal ist, das \(a\) und \(p\) enthält, folgt die Gleichheit.

Weil \(R\) ein Hauptidealring ist, ist das Ideal \((a,p)\) ein Hauptideal, es gibt also ein Element \(d\in R\) mit \((a,p) = (d)\). Es folgt dann \(d\, |\, p\) und wegen der Irreduzibilität von \(p\) und weil \((p)\ne (d)\) ist, dass \((d) = R\) sein muss. Damit erhalten wir \(1\in (d)=(a,p)\), also existieren \(x,y \in R\) mit \(ax+yp = 1\). Wir sehen jetzt, dass \(p\, |\, (1-ax)\), also erst recht \(p\, |\, (b-abx)\), und wegen \(p\, |\, ab\) folgt nun \(p\, |\, b\).

Lemma 15.46

Sei \(R\) ein Hauptidealring, und seien

\[ \mathfrak a_0 \subseteq \mathfrak a_1 \subseteq \mathfrak a_2 \subseteq \cdots \]

Ideale von \(R\), die ineinander enthalten sind. Man spricht von einer aufsteigenden Kette von Idealen in \(R\).

Dann existiert \(i\ge 0\), so dass \(\mathfrak a_i = \mathfrak a_j\) für alle \(j\ge i\). Man sagt, die Kette sei stationär.

Beweis

Sei \(R\) ein Hauptidealring und sei

\[ \mathfrak a_0 \subseteq \mathfrak a_1 \subseteq \mathfrak a_2 \subseteq \cdots \]

eine aufsteigende Kette von Idealen in \(R\). Dann ist auch die Vereinigung \(\mathfrak a :=\bigcup _{i\ge 0} \mathfrak a_i\) ein Ideal. In der Tat, für \(x,y\in \mathfrak a\) existieren \(i\) und \(j\) mit \(x\in \mathfrak a_i\), \(y\in \mathfrak a_j\). Sei ohne Einschränkung \(i\le j\), also \(\mathfrak a_i \subseteq \mathfrak a_j\). Dann gilt \(x+y\in \mathfrak a_j\subseteq \mathfrak a\). Außerdem gilt für alle \(z\in R\), dass \(zx\in \mathfrak a_i\subseteq \mathfrak a\) ist.

Weil \(R\) ein Hauptidealring ist, existiert ein Element \(a\in R\) mit \(\mathfrak a = (a)\). Dann muss aber \(a\) in einem der Ideale \(\mathfrak a_i\) liegen, es folgt \(\mathfrak a = (a) \subseteq \mathfrak a_i\) und damit die Gleichheit \(\mathfrak a = \mathfrak a_i\) und insbesondere \(\mathfrak a_i = \mathfrak a_j\) für alle \(j\ge i\).

Ringe, die die Eigenschaft aus dem Lemma haben, in denen also jede aufsteigende Kette von Idealen stationär ist, heißen auch noethersche Ringe (nach der Mathematikerin Emmy Noether).

Für \(R=\mathbb Z\) bzw. \(R=K[X]\) (\(K\) ein Körper) kann man das Lemma noch einfacher beweisen, indem man den Absolutbetrag bzw. die Gradfunktion benutzt.

Satz 15.47

Sei \(R\) ein Hauptidealring. Dann lässt sich jedes Element aus \(R\setminus (R^\times \cup \{ 0\} )\) als Produkt von Primelementen schreiben.

Beweis

Wegen Satz 15.45 ist es äquivalent zu zeigen, dass sich jedes Element als Produkt von irreduziblen Elementen schreiben lässt. Angenommen, das wäre nicht der Fall, sei also \(a_0\in R\setminus (R^\times \cup \{ 0\} )\) ein Element, das sich nicht als Produkt von irreduziblen Elementen schreiben lässt. Insbesondere kann dann \(a_0\) nicht irreduzibel sein, es existiert also eine Produktdarstellung \(a_0 = a_1 b_1\) mit Nicht-Einheiten \(a_1\), \(b_1\). Wenn diese Elemente beide als Produkt irreduzibler Elemente geschrieben werden könnten, dann bekämen wir auch eine entsprechende Darstellung für \(a_0\). Das ist nicht möglich, wir können also (indem wir nötigenfalls \(a_1\) und \(b_1\) vertauschen) annehmen, dass auch \(a_1\) sich nicht als Produkt von irreduziblen Elementen schreiben lässt.

Wenn wir in dieser Weise fortfahren, erhalten wir eine Folge von Elementen

\[ a_i = a_{i+1} b_{i+1},\quad i=0,1,2, \dots , \]

von \(R\), die sämtlich keine Einheiten sind. In Termen von Idealen folgt, dass \((a_{i}) \subseteq (a_{i+1})\) für alle \(i\ge 0\) gilt, wir erhalten also eine aufsteigende Kette

\[ (a_0) \subseteq (a_1) \subseteq (a_2) \subseteq \cdots \]

von Idealen in \(R\), die nach Lemma 15.46 stationär wird, es gibt also ein \(i\) mit \((a_i) = (a_{i+1})\). Das impliziert aber, dass \(b_{i+1}\) im Widerspruch zu unserer Konstruktion doch eine Einheit in \(R\) ist.

Lemma 15.48

Sei \(R\) ein Integritätsring, seien \(p_1,\dots , p_r\in R\) prim und seien \(q_1,\dots , q_s\in R\) irreduzibel. Gilt

\[ p_1 \cdot \cdots \cdot p_r = q_1 \cdot \cdots \cdot q_s, \]

so gilt \(r=s\) und nach einer eventuellen Umnummerierung der \(q_i\) gilt für alle \(i=1, \dots , r\), dass \(p_i\) und \(q_i\) zueinander assoziiert sind.

Beweis

Sei \(p\in R\) ein Primelement, d.h. aus \(p\, |\, ab\) folgt \(p\, |\, a\) oder \(p\, |\, b\) (für alle \(a,b\in R\)). Per Induktion folgt dann aus \(p\, |\, a_1\cdot \cdots \cdot a_n\) für Elemente \(a_i\in R\), dass \(p\) einen der Faktoren des Produkts \(a_1\cdot \cdots \cdot a_n\) teilt: Es existiert \(i\) mit \(p\, |\, a_i\).

Wir beweisen nun eine etwas allgemeinere Aussage als die des Lemmas, nämlich: Seien \(u\in R^\times \), seien \(p_1,\dots , p_r\in R\) prim und seien \(q_1,\dots , q_s\in R\) irreduzibel. Gilt

\[ p_1 \cdot \cdots \cdot p_r = u q_1 \cdot \cdots \cdot q_s, \]

so gilt \(r=s\) und nach einer eventuellen Umnummerierung der \(q_i\) gilt für alle \(i=1, \dots , r\), dass \(p_i\) und \(q_i\) zueinander assoziiert sind.

Die Aussage des Lemmas folgt, indem wir \(u=1\) setzen.

Wir führen Induktion nach \(r\). Der Fall \(r=0\), indem links das leere Produkt \(1\) steht, ist trivial, da irreduzible Elemente per Definition keine Einheiten sein können.

Für \(r\ge 1\) gilt \(p_1 \, |\, p_1 \cdot \cdots \cdot p_r = u q_1 \cdot \cdots \cdot q_s\), dass \(p_1\) eines der \(q_i\) teilt. (Dass \(p\, |\, u\), ist unmöglich, da \(u\) eine Einheit und \(p_1\) keine Einheit ist.) Nach Umnummerierung der \(q_i\) können wir annehmen, dass \(p_1 \, |\, q_1\), etwa \(q_1 = \epsilon p_1\). Weil \(q_1\) irreduzibel und \(p_1\) als Primelement keine Einheit ist, folgt daraus, dass \(\epsilon \in R^\times \) und sodann, dass \(q_1\) und \(p_1\) zueinander assoziiert sind.

Es folgt auch (siehe Lemma 15.32), dass

\[ p_2 \cdot \cdots \cdot p_r = (u \epsilon ^{-1}) q_2 \cdot \cdots \cdot q_s, \]

und per Induktionsvoraussetzung folgt die Behauptung.

Vergleiche auch den Beweis der Eindeutigkeit der Primfaktorzerlegung in \(\mathbb Z\) in Satz LA1.3.56.

Da Primelemente stets irreduzibel sind (Satz 15.45), zeigt Lemma 15.48, dass eine Zerlegung als ein Produkt in Primelemente immer bis auf Reihenfolge und Übergang zu assoziierten Elementen eindeutig ist.

Definition 15.49

Ein Integritätsring \(R\) heißt faktoriell, wenn sich jedes Element aus \(R\setminus (R^\times \cup \{ 0\} )\) als Produkt von Primelementen schreiben lässt.

Man sagt in der Situation dieser Definition auch, in \(R\) gelte die »eindeutige Zerlegung in Primfaktoren«. Eine (etwas aus der Mode gekommene) alternative Bezeichnung für faktorielle Ringe ist ZPE-Ringe – das steht für »Zerlegung in Primelemente eindeutig«. Auf Englisch werden faktorielle Ringe oft als »UFD« bezeichnet, das ist die Abkürzung für »unique factorization domain«. Wir können Satz 15.47 nun wie folgt formulieren.

Korollar 15.50

Jeder Hauptidealring ist faktoriell.

Satz 15.51

Sei \(R\) ein Integritätsring. Dann sind äquivalent:

  1. Der Ring \(R\) ist faktoriell.

  2. Jedes Element aus \(R\setminus (R^\times \cup \{ 0\} )\) lässt sich als Produkt von irreduziblen Elementen schreiben, und jedes irreduzible Element von \(R\) ist prim.

Beweis

Es ist klar, dass (ii) \(\Rightarrow \) (i) gilt. Für die Implikation (i) \(\Rightarrow \) (ii) müssen wir zeigen, dass in einem faktoriellen Ring jedes irreduzible Element prim ist. Sei also \(R\) faktoriell und \(p\in R\) irreduzibel. Dann können wir \(p\) als Produkt von Primelementen schreiben, etwa

\[ p = p_1\cdot \cdots \cdot p_r. \]

Aus der Irreduzibilität folgt dann aber direkt, dass \(r=1\) und folglich \(p=p_1\) ein Primelement sein muss.

Beispiel 15.52

Da \(\mathbb Z\) ein Hauptidealring ist, ist \(\mathbb Z\) faktoriell. Wegen \(\mathbb Z^\times = \{ 1, -1\} \) gilt auch die folgende, etwas präzisere Aussage: Jede ganze Zahl \(a\in \mathbb Z\), \(a\ne 0\), lässt sich schreiben als \(a=\epsilon p_1\cdot \cdots \cdot p_r\) mit \(\epsilon \in \{ 1,-1\} \) und (positiven) Primzahlen \(p_i\). Dabei ist \(\epsilon \) eindeutig bestimmt (nämlich gleich dem Vorzeichen von \(a\)), und die \(p_i\) sind eindeutig bestimmt bis auf die Reihenfolge. Siehe auch Satz LA1.3.56.

Für die ganzen Zahlen kannten wir diese Aussage ja schon aus der Linearen Algebra 1. Im anderen wichtigen Beispiel für Hauptidealringe, das wir kennengelernt haben, ist sie hingegen neu, und wird in den kommenden beiden Kapitel eine wichtige Rolle spielen.

Beispiel 15.53

Sei \(K\) ein Körper. Nach dem Gezeigten ist der Polynomring \(R=K[X]\) faktoriell. Es gilt \(R^\times = K^\times \) und wir erhalten: Jedes Polynom \(f\in K[X]\), \(f\ne 0\), lässt sich schreiben als Produkt \(f = u f_1\cdot \cdots \cdot f_r\), wobei \(u\in K^\times \), \(f_i\in K[X]\) irreduzibel und normiert.

Dabei ist \(u\) eindeutig bestimmt (\(u\) ist der Leitkoeffizient von \(f\)), und die \(f_i\) sind eindeutig bestimmt bis auf ihre Reihenfolge. (Da die \(f_i\) irreduzibel sind, gilt \(\deg f_i {\gt} 0\) für alle \(i\).)

Bemerkung 15.54

Sei \(R\) ein faktorieller Ring.

  1. Sei \(P\subset R\) eine Menge von Primelementen mit der Eigenschaft, dass für jedes Primelement \(q\in R\) genau ein \(p\in P\) existiert, das zu \(q\) assoziiert ist. Wir nennen dann \(P\) ein Vertretersystem der Primelemente in \(R\) bis auf Assoziiertheit. Wir können dann für ein Element \(a\in R \setminus \{ 0\} \) die Primfaktorzerlegung in der Form

    \[ a = u \prod _{p\in P} p^{v_p(a)} \]

    schreiben, wobei \(u\in R^\times \) eine Einheit ist und \(v_p(a)\in \mathbb N\) und \(v_p(a) = 0\) für alle bis auf endlich viele \(p\in P\) gilt (daher ist das Produkt ein endliches Produkt, wenn alle Faktoren, die \(=1\) sind, weggelassen werden, denn für \(v_p(a)= 0\) ist \(p^{v_p(a)} = p^0 = 1\)). Ist \(a\) eine Einheit, so sind alle \(v_p(a)= 0\), und umgekehrt. Bei dieser Schreibweise sind \(u\) und alle Zahlen \(v_p(a)\) eindeutig bestimmt.

    Dann gilt \(p^k\, |\, a\) genau dann, wenn \(v_p(a) \ge k\) ist.

    Im Fall \(R=\mathbb Z\) wählt man als die Menge \(P\) üblicherweise die Menge der (positiven) Primzahlen. Ist \(R=K[X]\) der Polynomring über einem Körper, dann ist die übliche Wahl für \(P\) die Menge der normierten primen Polynome. Man erhält dann genau die oben diskutierten Beispiele wieder.

  2. Seien nun \(a,b\in R \setminus (R^\times \cup \{ 0\} )\). Wir schreiben wie in Punkt (1) die Primfaktorzerlegungen als

    \[ a = u \prod _{p\in P} p^{v_p(a)},\quad b = u^\prime \prod _{p\in P} p^{v_p(b)}. \]

    Es gilt \(a\, |\, b\) genau dann, wenn \(v_p(a) \le v_p(b)\) für alle \(p\in P\) gilt.

  3. Mit der Notation aus Punkt (2) ist

    \[ \prod _{p\in P} p^{\min (v_p(a), v_p(b))} \]

    ein größter gemeinsamer Teiler von \(a\) und \(b\) in \(R\), und

    \[ \prod _{p\in P} p^{\max (v_p(a), v_p(b))} \]

    ein kleinstes gemeinsames Vielfaches von \(a\) und \(b\) in \(R\) (Definition 15.41). Durch die Wahl von \(P\) erhält man in dieser Art und Weise einen ausgezeichneten größten gemeinsamen Teiler und ein ausgezeichnetes kleinstes gemeinsames Vielfaches von \(a\) und \(b\). Jeder andere größte gemeinsame Teiler (bzw. jedes andere kleinste gemeinsame Vielfache) im Sinne von Definition 15.41 ist, wie in jedem Integritätsring, zu den oben genannten ggT/kgV assoziiert.

    Insbesondere existieren ggT und kgV in faktoriellen Ringen immer. Allerdings folgt aus \(\operatorname{ggT}(a,b) = 1\) nicht in jedem faktoriellen Ring, dass Elemente \(x,y\) existieren mit \(xa+yb = 1\) – in Hauptidealringen ist das aber richtig (Bemerkung 15.42), und nur in diesen »funktionieren« die Begriffe ggT und kgV wirklich gut.

Du wolltest doch Algebra, da hast du den Salat.

Jules Verne, Reise um den Mond, 4. Kapitel

Fundort: http://www.mathe.tu-freiberg.de/~hebisch/cafe/zitate.html

Ergänzung 15.55

Wir skizzieren zwei Beispiele von Integritätsringen, die nicht faktoriell sind.

  1. Die Teilmenge

    \[ \mathbb Z[i\sqrt{5}] := \{ a + ib\sqrt{5};\ a,b\in \mathbb Z\} \quad \subseteq \mathbb C \]

    ist ein Unterring. Man kann zeigen, dass dieser Integritätsring nicht faktoriell ist. Das Element \(2\) ist in diesem Ring irreduzibel, jedoch kein Primelement, denn es teilt das Produkt

    \[ (1-i\sqrt{5})(1+i\sqrt{5})=6=2\cdot 3, \]

    aber teilt weder \(1-i\sqrt{5}\) noch \(1+i\sqrt{5}\).

    Dieser und ähnliche Ringe werden in der algebraischen Zahlentheorie genauer untersucht. Die Theorie auf den nicht-faktoriellen Fall auszudehnen ist dort sehr wichtig, und war der Ausgangspunkt dafür, den Begriff des Ideals einzuführen (siehe Ergänzung 15.20). Man kann zeigen, dass die Ideale im Ring \(\mathbb Z[i\sqrt{5}]\) eine eindeutige »Zerlegung« in sogenannte Primideale (vgl. Ergänzung 15.75) zulassen, und dies ist oft ein guter Ersatz für die Zerlegung von Elementen des Rings als Produkt von Primelementen, die in diesem Ring eben nicht immer möglich ist.

  2. Sei \(K\) ein Körper. Die Teilmenge

    \[ K[T^2, T^3] := \left\{ \sum _{i=0}^n a_i T^i;\ n\in \mathbb N,\ a_i\in K,\ a_1 = 0 \right\} \subseteq K[T] \]

    ist ein Unterring. Dieser Ring ist ein weiteres Beispiel eines Integritätsrings, der nicht faktoriell ist, denn \(T^6 = (T^2)^3 = (T^3)^2\) hat zwei verschiedene Zerlegungen in irreduzible Elemente.

    In der algebraischen Geometrie wird dieser Ring »in geometrischer Weise« interpretiert. Man kann eine Verbindung herstellen zu der hier abgebildeten »Kurve« in der Ebene (die Abbildung entspricht dem Fall \(K=\mathbb R\)), und dann in präziser Weise begründen, dass die Eigenschaft des obigen Rings, nicht faktoriell zu sein, damit zusammenhängt, dass die abgebildete Kurve am Ursprung nicht »glatt« ist, also an diesem Punkt auch »nach beliebig starkem Hereinzoomen« nicht wie eine Gerade aussieht.

    \begin{tikzpicture}  \begin{axis} [ xmin=-1.8,xmax=3.8, ymin=-7,ymax=7, axis x line=middle, axis y line=middle ] \addplot [ultra thick, domain=-3:3,samples=50]({x^2},{x^3}); \end{axis} \end{tikzpicture}
    Die Menge \(\{ (x, y)^t\in \mathbb R^2;\ y^2 = x^3 \} \)
    Der Zusammenhang zwischen dem Ring \(K[T^2, T^3]\) und der Gleichung \(y^2 - x^3 = 0\) kommt daher, dass die Abbildung \(K[X,Y] \to K[T]\), \(X\mapsto T^3\), \(Y\mapsto T^2\), ein Ringhomomorphismus mit Bild \(K[T^2, T^3]\) und Kern \((Y^2-X^3)\) ist. (Es ist in Ordnung, wenn Sie diese ganze Bemerkung etwas kryptisch finden …)

15.4.4 Nullstellen von Polynomen

Sei \(R\) ein Ring.

Definition 15.56

Sei \(f\in R[X]\). Ein Element \(\alpha \in R\) heißt Nullstelle von \(f\), falls \(f(\alpha ) = 0\).

Sei nun \(R\) ein Integritätsring. Wir haben gesehen, dass dann auch \(R[X]\) ein Integritätsring ist (Korollar 15.31).

Lemma 15.57

Ein Element \(\alpha \in R\) ist genau dann Nullstelle eines Polynoms \(f\in R[X]\), wenn \(X-\alpha \) das Polynom \(f\) teilt.

Beweis

Wenn \(f\) ein Vielfaches von \(X-\alpha \) ist, dann ist natürlich \(f(\alpha )=0\). Ist andererseits \(\alpha \) eine Nullstelle von \(f\) und schreiben wir \(f\) im Sinne der Division mit Rest als

\[ f = q\cdot (X-\alpha ) + r \]

mit \(\deg (r) {\lt} 1\), dann ergibt Einsetzen von \(\alpha \), dass \(r(\alpha ) = f(\alpha ) = 0\). Weil \(r\) ein konstantes Polynom ist, folgt \(r=0\), also \(f = q\cdot (X-\alpha )\).

Insbesondere sehen wir, dass ein Polynom vom Grad \(n\) höchstens \(n\) verschiedene Nullstellen haben kann (siehe auch Satz LA1.4.25).

Ein Polynom vom Grad \(1\) nennen wir auch ein lineares Polynom. Ein lineares Polynom, das \(f\) teilt, nennen wir einen Linearfaktor von \(f\). Ist \(R=K\) ein Körper, so ist jedes lineare Polynom vom Grad \(1\) zu einem eindeutig bestimmten Polynom der Form \(X-a\), \(a\in K\) assoziiert. Über beliebigen Ringen ist diese Aussage natürlich nicht richtig; es kann dann auch lineare Polynome geben, die keine Nullstellen in dem Ring haben, zum Beispiel \(R=\mathbb Z\) und \(f = 2X-1\in \mathbb Z[X]\).

Definition 15.58

Sei \(R\) ein Integritätsring, \(f\in R[X]\), \(f\ne 0\).

  1. Ist \(\alpha \in R\), so gibt es eine eindeutig bestimmte natürliche Zahl \(m\in \mathbb N\), so dass \((X-\alpha )^m\, |\, f\), aber \((X-\alpha )^{m+1}\nmid f\). Wir schreiben \(\operatorname{mult}_\alpha (f) := m\). Das Element \(\alpha \) ist genau dann eine Nullstelle von \(f\), wenn \(m \ge 1\). Wir sagen dann, \(\alpha \) sei eine Nullstelle der Vielfachheit (oder: Multiplizität) \(m\).

    Eine Nullstelle mit Vielfachheit \(1\) nennen wir auch einfache Nullstelle, eine mit Vielfachheit \(2\) entsprechend doppelte Nullstelle usw.

  2. Wir sagen, ein Polynom \(f\in R[X]\setminus \{ 0\} \) zerfalle vollständig in Linearfaktoren, wenn \(f\) Produkt von linearen Polynomen, d.h. von Polynomen vom Grad \(1\) ist. Ist \(R\) ein Körper, so ist das gleichbedeutend damit, dass sich \(f\) in der Form \(c\prod _{i=1}^{\deg (f)}(X-\alpha _i)\) mit \(c\in K^\times \) und \(\alpha _i\in K\) schreiben lässt.

Definition 15.59

Ein Körper \(K\) heißt algebraisch abgeschlossen, wenn jedes nichtkonstante Polynom, also jedes Polynom in \(K[X]\setminus K\), eine Nullstelle in \(K\) besitzt.

Per Induktion zeigt man, dass man algebraisch abgeschlossene Körper äquivalent dadurch charakterisieren kann, dass jedes nicht-konstante Polynom vollständig in Linearfaktoren zerfällt.

Weder der Körper \(\mathbb Q\) noch der Körper \(\mathbb R\) sind algebraisch abgeschlossen (überlegen Sie sich Beispiele von nichtkonstanten Polynomen, die keine Nullstelle haben). Auch ein endlicher Körper kann nicht algebraisch abgeschlossen sein (warum?). Es ist auch gar nicht so einfach, Beispiele von algebraisch abgeschlossenen Körpern anzugeben. Das zugänglichste Beispiel ist der Körper \(\mathbb C\).

Theorem 15.60 Fundamentalsatz der Algebra

Der Körper \(\mathbb C\) der komplexen Zahlen ist algebraisch abgeschlossen.

Dieses schwierige Theorem beweisen wir nicht im Rahmen der Vorlesung über lineare Algebra. Es wird üblicherweise auf verschiedene Arten in den Vorlesungen Algebra und Funktionentheorie bewiesen, kann aber auch mit Mitteln der Analysis I bewiesen werden. Siehe Ergänzung 16.32 für einen trickreichen Beweis, der nur sehr wenig Analysis benötigt und ansonsten mit linearer Algebra auskommt.

15.4.5 Der chinesische Restsatz

Sei \(R\) ein Ring, \(\mathfrak a\subset R\) ein Ideal. Für Elemente \(x,y\in R\) schreiben wir

\[ x \equiv y \mod \mathfrak a, \text{ wenn } x-y\in \mathfrak a. \]

In den meisten Fällen, die für uns relevant sind, ist \(\mathfrak a = (a)\) ein Hauptideal; dann schreiben wir auch \(x \equiv y \mod a\), und dies ist gerade äquivalent zu \(a \, |\, x-y\). Man sagt, \(x\) sei kongruent zu \(y\) modulo \(\mathfrak a\). Kongruenz ist eine »Äquivalenzrelation« (siehe Definition 3.67 unten).

Im folgenden Satz betrachten wir für Elemente \(a,b\) eines (Integritäts-)Rings \(R\) das von \(a\) und \(b\) erzeugte Ideal

\[ (a,b) = \{ xa+yb;\ x,y\in R\} \]

und betrachten die Bedingung, dass dieses gleich \(R\) ist. Weil ein Ideal \(\mathfrak a\) genau dann gleich dem ganzen Ring ist, wenn es die \(1\) enthält, ist das gewissermaßen eine abkürzende Schreibweise dafür, dass \(x, y\in R\) existieren mit \(xa+yb=1\). Ist \(R\) ein Hauptidealring (und das ist der Fall, der für uns später relevant sein wird), ist die Bedingung dazu äquivalent, dass \(1\) ein größter gemeinsamer Teiler von \(a\) und \(b\) ist (Bemerkung 15.42).

Satz 15.61 Chinesischer Restsatz

Seien \(R\) ein Ring und \(a_1, \dots , a_r\in R\), so dass \((a_i, a_j) = R\) für alle \(i\ne j\). Sei \(a = a_1\cdot \cdots \cdot a_r\).

Seien \(b_1, \dots , b_r\in R\). Dann existiert ein Element \(b\in R\), so dass

\[ b \equiv b_i \mod a_i\quad \text{für alle}\ i=1,\dots , r \]

gilt.

Ist \(b^\prime \) ein weiteres solches Element, so gilt \(b \equiv b' \mod a\). (Wir sagen, die Lösung der vorgegebenen Kongruenzen sei eindeutig bestimmt modulo \(a\).)

Beweis

Vorüberlegung. Wir zeigen zuerst, dass unter der Voraussetzung, dass für alle \(i\ne j\) die Elemente \(a_i\) und \(a_j\) das Einsideal erzeugen, auch für alle \(i\) die Elemente \(a_i\) und \(a_i^\prime := \prod _{j\ne i} a_j\) das Einsideal erzeugen. Sei zur Vereinfachung der Notation ohne Einschränkung \(i=1\). Jedenfalls existieren \(x_j, y_j\in R\), \(j = 2, \dots , n\), so dass \(x_ja_1 + y_ja_j = 1\). Daraus erhalten wir

\[ \prod _{j=2}^n (x_ja_1 + y_ja_j) = 1, \]

und wenn wir den Ausdruck auf der linken Seite ausmultiplizieren, sind alle Summanden Vielfache von \(a_1\), bis auf den Term \(\prod _{j=2}^n y_ja_j\). Wir erhalten also tatsächlich einen Ausdruck der Form

\[ x a_1 + y (a_2\cdot \cdots \cdot a_n) \]

(mit \(y = y_2\cdot \cdots \cdot y_n\)).

Nach dieser Vorüberlegung können wir für jedes \(i\in \{ 1, \dots , n\} \) Elemente \(x_i, y_i\in R\) finden, so dass

\[ x_i a_i + y_i a_i^\prime = 1, \]

also \(y_i a_i^\prime \equiv 1\mod a_i\). Nach Definition der \(a_i^\prime \) ist auch klar, dass \(y_i a_i^\prime \equiv 0\mod a_{j}\) für alle \(j \ne i\) gilt. Wir setzen nun

\[ b = \sum _{i=1}^n b_i y_i a_i^\prime . \]

In der Tat gilt dann für jedes \(i\), dass

\[ b \equiv b_i y_i a_i^\prime \equiv b_i \mod a_i, \]

wie gewünscht. Damit ist die Existenzaussage bewiesen.

Seien nun \(b, b^\prime \in R\) mit \(b \equiv b_i \mod a_i\) und \(b^\prime \equiv b_i \mod a_i\) für alle \(i\). Es folgt \(b-b^\prime \in (a_i)\) für alle \(i\), also \(b-b^\prime \in \bigcap _{i=1}^n (a_i)\). Es genügt also zu zeigen, dass \(\bigcap _{i=1}^n (a_i) = (a)\) gilt (wobei die Inklusion \(\supseteq \) klar ist; allerdings ist das auch die Inklusion, die uns hier nicht interessiert). Mithilfe der Vorüberlegung können wir das per Induktion beweisen und uns damit auf den Fall \(n=2\) zurückziehen. Dann haben wir Elemente \(a_1, a_2\in R\) gegeben, die das Einsideal erzeugen, etwa \(x_1a_1+x_2a_2 = 1\), und wollen für \(c\in (a_1)\cap (a_2)\) zeigen, dass \(c\in (a_1a_2)\) gilt. Wir können \(c = y_1 a_1 = y_2a_2\) und damit

\[ x_2 c = x_2y_1a_1 = x_2y_2a_2 = y_2(1-x_1a_1) \]

schreiben, also \(y_2 = x_2y_1a_1 + y_2x_1a_1 \in (a_1)\). Es folgt, dass \(c = y_2a_2\) ein Vielfaches von \(a_1 a_2\) ist, wie wir zeigen wollten.

Man kann den Satz noch etwas allgemeiner fassen und mit fast demselben Beweis abhandeln, siehe Ergänzung 18.135.

Beispiel 15.62

Wir betrachten das folgende Beispiel. Sei \(R = \mathbb Z\) der Ring der ganzen Zahlen. Wir wollen eine ganze Zahl \(x\) finden, so dass

\begin{align*} & x\equiv 3 \mod 5, \\ & x \equiv 2 \mod 6, \\ & x \equiv 1 \mod 11. \end{align*}

Es folgt aus dem chinesischen Restsatz, dass solche Zahlen existieren, und dass je zwei Lösungen modulo \(5\cdot 6\cdot 11 = 330\) kongruent sind.

Um ein \(x\) zu finden, können wir die Schritte aus dem allgemeinen Beweis nachvollziehen. Wir schreiben zuerst die \(1\) als »Linearkombination« einer der Zahlen \(5\), \(6\), \(11\) und dem Produkt der anderen Zahlen, d.h.

\begin{align*} 1 & = 5 x_1 + 66 y_1\\ 1 & = 6 x_2 + 55 y_2\\ 1 & = 11 x_3 + 30 y_3. \end{align*}

Diese Darstellungen lassen sich mit dem euklidischen Algorithmus (Bemerkung 15.43) finden. Im konkreten Fall gilt zum Beispiel

\begin{align*} 1 & = 5 \cdot (-13) + 66 \cdot 1\\ 1 & = 6 \cdot (-9) + 55 \cdot 1\\ 1 & = 11 \cdot 11 + 30 \cdot (-4). \end{align*}

Dann können wir

\[ x = 3 \cdot 66 \cdot 1 + 2\cdot 55\cdot 1 + 1\cdot 30\cdot (-4) = 188 \]

setzen. Hier ist in jedem Summanden der erste Faktor die rechte Seite der Kongruenz die \(x\) erfüllen soll, und dann kommt das Produkt aus der obigen Darstellung der \(1\). In der Tat hat \(188\) bei Division durch \(5\) den Rest \(3\), bei Division durch \(6\) den Rest \(2\) und bei Division durch \(11\) den Rest \(1\).

Ergänzung 15.63

Die Aussage des chinesischen Restsatzes findet man bereits in dem Buch »Sun Zi Suanjing« ds chinesischen Mathematikers Sun Zi (um 3. Jh.) – daher der Name.