3.3 Polynomringe
Sei \(R\) ein Ring.
Eine \(R\)-Algebra ist ein Ring \(S\) zusammen mit einem Ringhomomorphismus \(\varphi \colon R\to S\).
Seien \(S\), \(S'\) mit Ringhomomorphismen \(\varphi \colon R\to S\), \(\varphi '\colon R\to S'\) Algebren über \(R\). Ein Homomorphismus von \(R\)-Algebren ist ein Ringhomomorphismus \(\psi \colon S\to S'\), so dass \(\varphi ' = \psi \circ \varphi \) gilt.
Wir bezeichnen mit \(\operatorname{Hom}_R(S, S')\) die Menge aller \(R\)-Algebren-Homomorphismen von \(S\) nach \(S'\). Besonders dann, wenn \(R\) ein Körper ist, sprechen wir statt von einem \(R\)-Algebren-Homomorphismus auch einfach von einem \(K\)-Homomorphismus.
Man kann allgemeiner definieren, wann ein nicht-kommutativer Ring \(S\) eine Algebra über einem kommutativen Ring \(R\) ist, aber die Definition ist ein kleines bisschen komplizierter als oben und wir beschränken uns auf den Fall dass \(R\) und \(S\) kommutative Ringe sind.
Ist \(K\) ein Körper und \(A\) eine \(K\)-Algebra, gegeben durch einen Ringhomomorphismus \(\varphi \colon K\to A\), so können wir \(A\) als \(K\)-Vektorraum mit der Skalarmultiplikation \(x\cdot a :=\varphi (x)a\) verstehen (für \(x\in K\), \(a\in A\), und wobei rechts die Ringmultiplikation von \(A\) verwendet wird). Es ist leicht nachzurechnen, dass die Vektorraumaxiome erfüllt sind. Ist andererseits \(A\) ein Ring, der auch ein \(K\)-Vektorraum ist, stimmen Ring- und Vektorraumaddition überein, und gilt \(x(ab) = (xa)b = a(xb)\) für alle \(x\in K\), \(a,b\in A\), so trägt \(A\) eine \(K\)-Algebrenstruktur, nämlich \(K\to A\), \(x\mapsto x\cdot 1\). Verwendet man den Begriff des \(R\)-Moduls (siehe Abschnitt LA2.18.7.1) so kann man den Begriff der \(R\)-Algebra auch für beliebige kommutative Ringe in analoger Weise betrachten.
Sei \(R\) ein Ring. Der Polynomring \(R[X]\) ist eine \(R\)-Algebra (vermöge des Ringhomomorphismus \(R\to R[X]\), der \(a\in R\) abbildet auf das konstante Polynom \(a\)). Ist \(S\) eine \(R\)-Algebra, gegeben durch \(\varphi \colon R\to S\), \(\alpha \in S\) und \(\Phi \colon R[X]\to S\) der zugehörige Einsetzungshomomorphismus mit \(\Phi (X) = \alpha \), \(\Phi (a) = \varphi (a)\) für \(a\in R\), so ist \(\Phi \) ein Homomorphismus von \(R\)-Algebren.
Wir verallgemeinern die Konstruktion des Polynomrings über einem Ring in einer Variablen, indem wir auch mehrere Variablen zulassen (gegebenenfalls auch unendlich viele). Ist \(I\) die vorgegebene Indexmenge für die Variablen, so definieren wir einen kommutativen Ring \(R[X_i; i\in I]\), den Polynomring in den Variablen \(X_i\), \(i\in I\). Seine Elemente sind Linearkombinationen (mit Koeffizienten in \(R\)) von Ausdrücken der Form \(X_{i_1}^{n_1}\cdot \cdots \cdot X_{i_r}^{n_r}\) für \(r\in \mathbb N\), \(i_s\in I\), \(n_s\in \mathbb N_{{\gt} 0}\). (In jedem einzelnen Polynom treten also immer nur endlich viele Variablen auf.) Diese Polynome werden in der offensichtlichen Weise addiert. Die Multiplikation ist durch die Regel
und die Distributivgesetze eindeutig bestimmt (wobei wir hier auch \(m_s=0\) bzw. \(n_s=0\) zulassen und \(X_i^0 = 1\) setzen).
Den Polynomring \(R[X_1,\dots , X_n]\) in endlich vielen Variablen \(X_1,\dots , X_n\) kann man identifizieren mit \((R[X_1,\dots , X_{n-1}])[X_n]\), so dass man diese Ringe auch induktiv konstruieren kann. Im Fall einer unendlichen Indexmenge \(I\) der Variablen kann man den Polynomring \(R[X_i;\ i\in I]\) als die Vereinigung der Ringe \(R[X_i;\ i\in I']\) über alle endlichen Teilmengen \(I'\subset I\) definieren (allerdings vereinigt man hier Mengen, die nicht als Teilmengen einer gemeinsamen Obermenge gegeben sind).
Wir haben dann den Begriff des Einsetzungshomomorphismus.
Seien \(R\) ein Ring, \(I\) eine Menge, \(S\) eine \(R\)-Algebra, gegeben durch einen Ringhomomorphismus \(\varphi \colon R\to S\). Sind Elemente \(x_i\in S\), \(i\in I\) gegeben, dann gibt es einen eindeutig bestimmten \(R\)-Algebren-Homomorphismus \(\Phi \colon R[X_i;\ i\in I]\to S\) mit \(\Phi (X_i)=x_i\) für alle \(i\in I\).
Für \(f\in R[X_i]\) schreiben wir meist \(f(x_i)\) statt \(\Phi (f)\).
Allgemeiner kann man hier auch Ringhomomorphismen \(\varphi \colon R\to S\) in einen nicht notwendig kommutativen Ring \(S\) betrachten. Man erhält dann zu Elementen \(x_i\in S\) wie oben einen eindeutig bestimmten Ringhomomorphismus \(\Phi \) für den \(\Phi (x)=\varphi (x)\) für \(x\in R\) und \(\Phi (X_i) = x_i\) für alle \(i\in I\) gilt.
Die Eindeutigkeit ist klar, ebenso ist ein Kandidat für \(\Phi \) offensichtlich. Man muss dann nur überprüfen, dass es sich um einen \(R\)-Algebren-Homomorphismus handelt. Das ist unproblematisch; man benutzt, dass Polynome aus Elementen aus \(R\) und den Unbestimmten durch sukzessive Multiplikation und Addition aufgebaut sind und dass \(\varphi \) ein Ringhomomorphismus ist.
Den Satz über den Einsetzungshomomorphismus kann man auch als universelle Eigenschaft des Polynomrings betrachten und folgendermaßen umformulieren.
Sei \(R\) ein kommutativer Ring und \(I\) eine Menge. Dann existiert eine \(R\)-Algebra \(P\) zusammen mit Elementen \(X_i\in P\), \(i\in I\), so dass für alle \(R\)-Algebren \(S\) die Abbildung
bijektiv ist.
Die \(R\)-Algebra \(P\) ist eindeutig bestimmt bis auf eindeutigen Isomorphismus im folgenden Sinne: Ist \(P'\) zusammen mit Elementen \(X_i\! '\in P'\) eine \(R\)-Algebra, die ebenfalls die obige Eigenschaft besitzt, so existiert ein eindeutig bestimmter \(R\)-Algebren-Isomorphismus \(P\to P'\) mit \(X_i\mapsto X_i\! '\) für alle \(i\).
Wir schreiben auch \(R[X_i,\ i\in I] := P\) und nennen diesen Ring den Polynomring über \(R\) in den Variablen \(X_i\), \(i\in I\).
Wir definieren \(P\) als den oben konstruierten Polynomring. Die Umkehrabbildung der Abbildung \(\operatorname{Hom}_R(P, S) \to \operatorname{Abb}(I, S)\) bildet eine Abbildung von \(I\) nach \(S\), also eine durch \(I\) indizierte Familie von Elementen von \(S\) ab auf den zugehörigen Einsetzungshomomorphismus \(P=R[X_i]\to S\).
Dass \(P\) durch die genannte »universelle« Eigenschaft eindeutig bestimmt ist bis auf eindeutigen Isomorphismus, zeigt man »wie üblich«, siehe zum Beispiel Abschnitt LA2.18.1.1.
Etwas formaler kann man wie folgt vorgehen. Wir hatten den Polynomring in einer Variablen definiert als die Menge \(R^{(\mathbb N)}\) aller Tupel von Elementen aus \(R\), in denen höchstens endlich viele Einträge \(\ne 0\) sind. Addiert werden Elemente von \(R^{(\mathbb N)}\) komponentenweise. Die Multiplikation zweier solcher Tupel \((a_n)_n\), \((b_n)_n\) ist das Tupel
Um dieses zu bilden, wird neben der Addition und Multiplikation in \(R\) nur die Addition auf \(\mathbb N\) benötigt. Die Variable \(X\) wurde dann als das Element \((0,1,0,\dots )\) definiert. Damit kann man dann jedes Element aus \(R[X] := R^{(\mathbb N)}\) in der üblichen Form \(\sum _{i=0}^d a_iX^i\) mit \(d\in \mathbb N\), und eindeutig bestimmten \(a_i\in R\) schreiben.
Den Polynomring in den Variablen \(X_i\), \(i\in I\), für eine beliebige Indexmenge können wir dann konstruieren, indem wir die Menge \(\mathbb N\) oben ersetzen durch
Es wird
zu einem Ring mit der komponentenweisen Addition und der Multiplikation
wobei nun \(n,j,k\in \mathbb N^{(I)}\) zu betrachten sind (und auf \(\mathbb N^{(I)}\) die komponentenweise Addition verwendet wird).
Die Variablen definieren wir wie folgt. Zu \(i\in I\) sei \(e_i\in \mathbb N^{(I)}\) der »\(i\)-te Standardbasisvektor«, d.h. das Tupel mit einer \(1\) an der \(i\)-ten Stelle und sonst überall Nullen. Wir setzen dann \(X_i := (\xi _{in})_n\) mit \(\xi _{ie_i} = 1\) und \(\xi _{in}=0\) für alle \(n\ne e_i\).
Noch etwas allgemeiner kann man in dieser Konstruktion \(\mathbb N^{(I)}\) durch irgendeine Menge mit einer kommutativen und assoziativen Verknüpfung mit einem neutralen Element ersetzen (also durch ein kommutatives »Monoid«). Siehe auch [ Bo-A ] 2.5, [ JS ] IV.3.
Sei \(R\) ein Ring, \(f\in R[X]\) ein Polynom und \(S\) eine \(R\)-Algebra. Sei \(\alpha \in S\).
Das Element \(\alpha \) heißt Nullstelle von \(f\) (in \(S\)), wenn \(f(\alpha )=0\) gilt. (Um \(f(\alpha )\) in \(S\) »auszurechnen«, wenden wir also auf alle Koeffizienten von \(f\) den zur \(R\)-Algebra \(S\) gehörigen Ringhomomorphismus \(R\to S\) an und setzen dann für \(X\) das Element \(\alpha \) ein.)
Sei nun in der obigen Situation \(S\) ein Integritätsring und \(f\ne 0\). Die eindeutig bestimmte natürliche Zahl \(m\) mit \((X-\alpha )^m\, |\, f\) und \((X-\alpha )^{m+1}\nmid f\) heißt die Vielfachheit (oder Ordnung) von \(\alpha \) als Nullstelle von \(f\); wir schreiben \(\operatorname{mult}_\alpha (f) := m\).
Es ist also \(\alpha \) genau dann eine Nullstelle von \(f\), wenn \(\operatorname{mult}_\alpha (f) \ge 1\) gilt. Im Fall \(\operatorname{mult}_\alpha (f) = 1\) nennen wir \(\alpha \) auch eine einfache Nullstelle, falls \(\operatorname{mult}_\alpha (f) {\gt} 1\) ist, so heißt \(\alpha \) eine mehrfache Nullstelle. Genauer sprechen wir im Fall \(\operatorname{mult}_\alpha (f) = 2\) von einer doppelten Nullstelle, usw.
In der Analysis wird bewiesen, dass man für eine differenzierbare Funktion \(\mathbb R\to \mathbb R\) an der Ableitung ablesen kann, ob es sich bei einer Nullstelle um eine mehrfache Nullstelle handelt. Eine Ableitung im Sinne der Analysis, die auf dem Grenzwertbegriff basiert, steht uns im Allgemeinen natürlich nicht zur Verfügung. Überraschender Weise ist aber die »formale Ableitung« eines Polynoms, die durch die Anwendung der üblichen Ableitungsregeln gebildet wird, für manche Eigenschaften ein nützlicher Ersatz.
Sei \(R\) ein Ring. Die Bildung der Ableitung von Polynomen genügt den folgenden Rechenregeln. Hier seien \(f,g\in R[X]\), \(a\in R\).
\((af)' = a\cdot f'\),
\((f+g)' = f' + g'\),
\((fg)' = f' g + fg'\).
Die Teile (1) und (2) sind leicht nachzurechnen. Für Teil (3) genügt es wegen (1) und (2) dann, den Fall \(f=X^i\), \(g=X^j\) zu betrachten (denn beide Seiten der Gleichung in (3) verhalten sich »\(R\)-bilinear« in \(f\) und \(g\)). In diesem Fall ist die Sache klar.
Seien \(R\) ein Integritätsring, \(f\in R[X]\), \(f\ne 0\), und \(\alpha \in R\) eine Nullstelle von \(f\). Dann sind äquivalent:
\(\alpha \) ist eine mehrfache Nullstelle von \(f\),
\(f'(\alpha ) = 0\).
Wir schreiben \(f = (X-\alpha )^r g\) mit \(g(\alpha )\ne 0\), also \(r = \operatorname{mult}_\alpha (f)\). Nach Voraussetzung ist \(r\ge 1\). Es gilt dann, wie man leicht nachrechnet,
und Einsetzen von \(\alpha \) liefert
Daraus folgt die Behauptung.
Wir können also in der Situation des Lemmas sagen:
\(f(\alpha ) = 0\quad \Leftrightarrow \quad \operatorname{mult}_\alpha (f) {\gt} 0\),
\(f(\alpha ) = f'(\alpha ) = 0\quad \Leftrightarrow \quad \operatorname{mult}_\alpha (f) {\gt} 1\),
Wo liegt das Problem, wenn man die Liste fortsetzen wollte, indem man höhere Ableitungen von \(f\) betrachtet und dementsprechende höhere Vielfachheiten als Nullstelle?