Inhalt

15.3 Der Polynomring über einem (kommutativen) Ring

Ist \(K\) ein Körper und \(A\) eine quadratische Matrix in \(M_n(K)\), dann möchten wir die Polynomfunktion \(K\to K\), \(\lambda \mapsto \det (A-\lambda E_n)\), untersuchen (bzw. die Funktion \(\lambda \mapsto \det (\lambda E_n-A)\), die sich später als etwas »schöner« erweist und sich von der vorgenannten Funktion nur um den Faktor \((-1)^n\) unterscheidet), um die Eigenwerte von \(A\) zu untersuchen. Der Ring der Polynomfunktionen \(K\to K\) hat aber (im Fall endlicher Körper) einige unschöne Eigenschaften (es ist kein Integritätsring im Sinne von Definition 15.28 unten). Es ist daher nützlich, eine Variante dieses Rings einzuführen, den sogenannten Polynomring.

Sei \(R\) ein kommutativer Ring. Wir wollen den Polynomring über \(R\) definieren, wobei wir uns ein Polynom als einen »formalen Ausdruck« der Form

\[ \sum _{i=0}^n a_i X^i,\quad a_i\in R, \]

vorstellen, also als eine Linearkombination von Potenzen der »Unbestimmten« \(X\) mit Koeffizienten \(a_i\in R\). Dabei sollen zwei Polynome genau dann gleich sein, wenn alle Koeffizienten gleich sind (wobei wir erlauben, zusätzliche Summanden \(0\cdot X^r\) hinzuzufügen, um auch zwei Polynome vergleichen zu können, in denen die Summationsgrenzen unterschiedlich sind). Der Begriff des Polynoms wird sich daher im allgemeinen Fall vom Begriff der Polynomfunktion (Abschnitt I.4.3) unterscheiden, siehe Bemerkung 15.27.

Es ist auch klar, wie wir mit Polynomen »rechnen« möchten, d.h. wie die Addition und Multiplikation von Polynomen vonstatten gehen sollte: Polynome werden »koeffizientenweise« addiert, d.h.

\[ \sum _{i=0}^n a_i X^i + \sum _{i=0}^n b_i X^i = \sum _{i=0}^n (a_i+b_i) X^i, \]

wobei man beachte, dass wir uns durch »Auffüllen mit Nullen« immer auf den Fall zurückziehen können, dass beide Summen denselben Summationsbereich haben. Die Multiplikation ist eindeutig dadurch festgelegt, dass das Distributivgesetz gelten soll, und dass

\[ X^i\, \cdot \, X^j = X^{i+j}\qquad \text{für alle}\ i,j\ge 0 \]

gelten soll. Es folgt dann

\[ \left(\sum _{i=0}^m a_i X^i\right) \cdot \left(\sum _{i=0}^n b_i X^i\right) = \sum _{i=0}^n\left(\sum _{j+k=i} a_jb_k\right) X^i \]

für das Produkt von zwei allgemeinen Polynomen. Dabei ist \(0\le j\le m\), \(0\le k\le n\).

Ein technisches Problem bei der ganzen Sache ist, wie man das Symbol \(X\) in die Definition einbaut, bzw. was \(X\) eigentlich »ist«. Die Lösung, die wir wählen, ist, das \(X\) zunächst einmal zu vergessen. Ein Polynom soll ja durch seine Koeffizienten festgelegt sein und wir müssen nur beschreiben, wie mit Tupeln von Koeffizienten gerechnet werden soll. Danach können wir das Element \(X\) des Polynomrings definieren als das Polynom mit Koeffizienten \(a_i = 0\) für alle \(i\ne 1\) und \(a_1=1\). In der Tupelschreibweise schreiben wir die Koeffizienten in der Reihenfolge \((a_0, a_1, a_2, \dots )\).

Definition 15.22

Der Polynomring \(R[X]\) über \(R\) in der Unbestimmten \(X\) ist der Ring aller Folgen \((a_i)_{i\in \mathbb N}\) mit nur endlich vielen Einträgen \(\ne 0\), mit elementweiser Addition und der Multiplikation

\[ (a_i)_i \cdot (b_i)_i = \left( \sum _{j+k=i} a_jb_k \right)_i. \]

Dies ist ein kommutativer Ring mit \(1 = (1,0,0,\dots )\) (und \(0 = (0,0,\dots )\)). Die Elemente von \(R[X]\) heißen Polynome.

Wir setzen \(X:= (0,1,0,0,\dots )\in R[X]\) und erhalten dann

\[ (a_0, a_1, a_2, \dots ) = \sum _{i\ge 0} a_i X^i, \]

wobei nur endlich viele \(a_i\) von Null verschieden sein dürfen. Insbesondere können wir jedes Element von \(R[X]\) in eindeutiger Weise in der Form \(\sum _{i\ge 0} a_iX^i\) schreiben (fast alle \(a_i = 0\)).

Es ist nicht schwer nachzurechnen, dass für diese Verknüpfungen tatsächlich alle Ringaxiome erfüllt sind. Der Ring \(R[X]\) ist ein kommutativer Ring.

Die Abbildung \(R\rightarrow R[X]\), \(a\mapsto (a, 0, 0, \dots )\) ist ein injektiver Ringhomomorphismus und wir fassen vermöge dieses Homomorphismus Elemente von \(R\) als Elemente von \(R[X]\) auf. Diese Elemente heißen konstante Polynome.

An Stelle von \(X\) kann man natürlich auch andere Buchstaben verwenden, um die Unbestimmte zu bezeichnen, wir können also auch von den Polynomringen \(R[x]\), \(R[T]\), usw. sprechen.

Bemerkung 15.23

Achtung: Ist \(S\) ein Ring, \(R\subseteq S\) ein Unterring und \(\alpha \in S\), dann verwendet man die eckigen Klammern auch mit einer etwas anderen (allgemeineren) Bedeutung, und zwar bezeichnet \(R[\alpha ]\) dann nicht den Polynomring in der Unbestimmten \(\alpha \) (was ja auch problematisch wäre, weil dann \(\alpha \) zwei verschiedene Bedeutungen hätte), sondern den Unterring von \(S\), der aus allen polynomialen Ausdrücken in \(\alpha \) besteht:

\[ R[\alpha ] =\left\{ \sum _{i=0}^n a_i\alpha ^i;\ n\in \mathbb N, a_i\in R\right\} \subseteq S. \]

Beispiele dafür sind die Ringe \(K[A]\) und \(K[f]\) aus Beispiel 15.14. Ein anderes Beispiel ist der Körper \(\mathbb Q[\sqrt{2}] = \{ a+b\sqrt{2};\ a,b\in \mathbb Q\} \subseteq \mathbb R\) – hier sind die höheren Potenzen von \(\sqrt{2}\) (warum?) verzichtbar. Allgemeiner verwendet man diese Notation auch, wenn \(\varphi \colon R\to S\) ein (nicht notwendig injektiver) Ringhomomorphismus ist, für \(\alpha \in S\) schreibt man dann

\[ R[\alpha ] =\left\{ \sum _{i=0}^n \varphi (a_i)\alpha ^i;\ n\in \mathbb N, a_i\in R\right\} \subseteq S. \]

Mit der in Satz 15.24 eingeführten Terminologie ist also \(R[\alpha ]\subseteq S\) das Bild des Einsetzungshomomorphismus \(R[X]\to S\), \(f\mapsto f(\alpha )\), der durch \(X\mapsto \alpha \) und \(\varphi \colon R\to S\) gegeben ist.

Wenn man möchte, dann kann man die Schreibweise \(R[X]\) als Spezialfall der hier beschriebenen Notation betrachten, denn der Ring \(R[X]\) besteht ja genau aus allen polynomialen Ausdrücken in \(X\) mit Koeffizienten in \(R\).

Allgemeiner kann man Polynomringe in mehr als einer Unbestimmten definieren, etwa \(R[X_1, X_2, \dots , X_n]\) oder sogar \(R[X_i,\ i\in I]\) für eine beliebige Menge \(I\). Man kann dabei den Fall, dass die Indexmenge \(I\) unendlich viele Elemente hat, zulassen; es werden aber nur endliche Summen und Produkte der Unbestimmten und ihrer Potenzen gebildet, d.h., dass in jedem einzelnen Polynom nur endlich viele der Unbestimmten \(X_i\) auftreten können.

Ist \(f = \sum _{i=0}^n a_iX^i\in R[X]\) ein Polynom mit Koeffizienten in \(R\) und \(x\in R\), so können wir \(x\) für die Unbestimmte \(X\) »einsetzen«: Wir definieren

\[ f(x) := \sum _{i=0}^n a_ix^i \in R. \]

Im folgenden Satz wird das noch etwas verallgemeinert und präzisiert. Erstens können wir nicht nur Elemente aus \(R\) einsetzen, sondern Elemente aus einem Ring \(S\), sobald wir »wissen, wie die Koeffizienten (aus \(R\)) als Elemente von \(S\) aufgefasst« werden sollen. Formal verlangen wir, dass ein Ringhomomorphismus \(R\to S\) gegeben ist. Zweitens erhalten wir für fixiertes \(x\) auf diese Weise einen Ringhomomorphismus \(R[X]\to R\) (bzw. im allgemeineren Fall \(R[X]\to S\)), das heißt \((f+g)(x) = f(x)+g(x)\), \((fg)(x) = f(x) g(x)\) und für \(f=1\) gilt \(f(x) = 1\).

Satz 15.24 Einsetzungshomomorphismus

Sei \(R\) ein kommutativer Ring, \(\varphi \colon R\rightarrow S\) ein Ringhomomorphismus und \(x\in S\). Dann existiert ein eindeutig bestimmter Ringhomomorphismus \(\Phi \colon R[X] \rightarrow S\) mit \(\Phi (a) = \varphi (a)\) für alle \(a\in R\) und \(\Phi (X) = x\), nämlich

\[ \sum _{i=0}^n a_iX^i \mapsto \sum _{i=0}^n \varphi (a_i)x^i. \]

Beweis

Aus den Bedingungen \(\Phi (a) = \varphi (a)\) für alle \(a\in R\) und \(\Phi (X) = x\) ergibt sich, weil \(\Phi \) ein Ringhomomorphismus ist, die angegebene Formel für das Bild eines beliebigen Polynoms unter \(\Phi \). Es ist also nur noch zu zeigen, dass diese Formel wirklich einen Ringhomomorphismus beschreibt. Das folgt aus einer einfachen direkten Rechnung, die ausnutzt, dass \(\varphi \) ein Ringhomomorphismus ist.

Wir schreiben in der Situation des Satzes auch \(f(x) = \Phi (f)\).

Die Abbildung \(\varphi \) wird oftmals nicht explizit angegeben, wenn »klar« ist, um welche Abbildung es sich handelt. Die drei (für uns) wichtigsten Fälle sind

  1. \(R=S\) und \(\varphi = \operatorname{id}_R\),

  2. \(R\subseteq S\) ist ein Unterring und \(\varphi \) ist die Inklusionsabbildung \(R\to S\), \(x\mapsto x\).

  3. \(R=K\) ist ein Körper, \(S=M_n(K)\) der Matrizenring (\(n\in \mathbb N\)), und \(\varphi \colon K\to M_n(K)\) ist gegeben durch \(a\mapsto aE_n\).

Beispiel 15.25
  1. Sei \(K=\mathbb Q\), \(A = \begin{pmatrix} 1 & 2 \\ 3 & 4 \end{pmatrix}\) und \(f = X^2 - 5 X + 5\). Dann ist (mit \(\varphi \) wie in Punkt (3) der vorhergehenden Liste)

    \[ f(A) = A^2 - 5 E_2 A + 5 E_2 = A^2 - 5A + 5 E_2 = \begin{pmatrix} 7 & 10 \\ 15 & 22 \end{pmatrix} - \begin{pmatrix} 5 & 10 \\ 15 & 20 \end{pmatrix} + \begin{pmatrix} 5 & 0 \\ 0 & 5 \end{pmatrix} = \begin{pmatrix} 7 & 0 \\ 0 & 7 \end{pmatrix}. \]
  2. Die Ringe \(K[A]\) und \(K[f]\) aus Beispiel 15.14 sind gerade die Bilder der Einsetzungshomomorphismen

    \[ K[X] \to M_n(K),\ X\mapsto A,\quad \text{und}\quad K[X]\to \operatorname{End}_K(V),\ X\mapsto f. \]

    Dass es sich um Ringhomomorphismen handelt, besagt, dass die Multiplikation von Polynomen der Multiplikation in \(M_n(A)\) (also dem Matrizenprodukt) bzw. in \(\operatorname{End}_K(V)\) (also der Verkettung von Endomorphismen) entspricht. Zum Beispiel wird unter dem rechten Ringhomomorphismus das Polynom \(X^2 -1\) auf den Endomorphismus \(f^2 - \operatorname{id}_V\) abgebildet:

    \[ f^2 -\operatorname{id}_V\colon V\to V,\quad v\mapsto f(f(v)) - v. \]

Definition 15.26

Sei \(R\) ein kommutativer Ring, \(f= \sum _{i=0}^N a_iX^i \in R[X]\) mit \(a_N\ne 0\). Dann heißt \(a_N\) der Leitkoeffizient von \(f\) und \(N\) der Grad von \(f\), in Zeichen \(\deg f\). Das Element \(a_0\) heißt der Absolutkoeffizient (oder: das absolute Glied) von \(f\). Ein normiertes Polynom ist ein Polynom, dessen Leitkoeffizient gleich \(1\) ist.

Wir setzen formal \(\deg 0 = -\infty \). (Dass das eine gute Idee ist, ergibt sich in Kürze aus Lemma 15.30.) Es ist also für \(f\in R[X]\) der Grad \(\deg (f)\) genau dann \(\ge 0\), wenn \(f\ne 0\) gilt.

Ein Polynom vom Grad \(1\) heißt auch lineares Polynom, unter einem quadratischen Polynom versteht man ein Polynom vom Grad \(2\). Manchmal spricht man auch von kubischen Polynomen im Sinne von Polynomen vom Grad \(3\).

Bemerkung 15.27

Sei \(R\) ein Ring. Ist \(f\in R[X]\) ein Polynom, so erhalten wir die Abbildung \(R\to R\), \(x\mapsto f(x)\). Abbildungen dieser Form nennen wir Polynomfunktionen. Die Polynomfunktionen bilden einen Unterring \(\operatorname{Pol}(R)\) des Rings \(\operatorname{Abb}(R, R)\) (siehe Beispiel 15.3).

Die Abbildung

\[ R[X] \to \operatorname{Pol}(R), \]

die \(f\in R[X]\) abbildet auf die zugehörige Polynomfunktion \(x\mapsto f(x)\), ist ein Ringhomomorphismus vom Polynomring \(R[X]\) in den Ring der Polynomfunktionen \(R\to R\), der nach Definition von \(\operatorname{Pol}(R)\) surjektiv, aber im allgemeinen nicht injektiv ist. Ist \(R\) ein Körper mit unendlich vielen Elementen, so ist dieser Ringhomomorphismus ein Isomorphismus, siehe Korollar I.4.28.

Über einem endlichen Körper \(K\) hat es gewisse Vorteile, mit dem Ring \(K[X]\) zu arbeiten, der – wie wir in den nachfolgenden Abschnitten sehen werden – eine relativ einfache Struktur hat. Insbesondere gilt für \(f,g \in K[X]\) mit \(f,g\ne 0\), dass auch das Produkt \(fg\ne 0\) ist. Diese wichtige Eigenschaft besprechen wir im folgenden Abschnitt über Integritätsringe.