6.1 Vektorräume
Sei \(K\) ein Körper. Ein (\(K\)-)Vektorraum oder Vektorraum über \(K\) ist eine Menge \(V\) zusammen mit Verknüpfungen \(+\colon V\times V\to V\) (Addition) und \(\cdot \colon K\times V\rightarrow V\) (Skalarmultiplikation), so dass gilt:
Die Verknüpfung \(+\) auf \(V\) ist assoziativ, d. h. für alle \(u, v, w\in V\) gilt \((u+v)+w = u+(v+w)\).
Die Verknüpfung \(+\) auf \(V\) besitzt ein eindeutig bestimmtes neutrales Element \(0\). (Dieses Element nennt man den Nullvektor von \(V\).)
Jedes Element \(v\in V\) besitzt ein inverses Element bezüglich \(+\), d.h. es existiert \(w\in V\) mit \(v+w = 0 = w+v\).
Die Verknüpfung \(+\) auf \(V\) ist kommutativ: Für alle \(v, w\in V\) gilt \(v+w=w+v\).
Für alle \(a,b\in K\), \(v\in V\) gilt: \(a\cdot (b\cdot v) = (ab)\cdot v\).
Für alle \(v\in V\) gilt \(1\cdot v=v\).
(Distributivgesetz 1) Für alle \(a,b \in K\), \(v\in V\) gilt: \((a+b)\cdot v = a\cdot v+b\cdot v\).
(Distributivgesetz 2) Für alle \(a\in K\), \(v,w\in V\) gilt: \(a\cdot (v+w) = a\cdot v+a\cdot w\).
Man nennt \(K\) auch den Grundkörper des Vektorraums \(V\). Die Skalarmultiplikation ist also keine Verknüpfung, die aus zwei Elementen von \(V\) ein weiteres produziert. Stattdessen verknüpft man ein »Skalar«, d.h ein Element des Grundkörpers \(K\), mit einem Element von \(V\). Wie bei der Multiplikation von Elementen eines Körpers lassen wir bei der Skalarmultiplikation den Punkt \(\cdot \) üblicherweise aus.
Wie im Fall eines Körpers (vergleiche Lemma 4.7) ist das additive Inverse eines Elements \(v\) eindeutig bestimmt. Wir bezeichnen es mit \(-v\) und nennen dieses Element auch das Negative von \(v\). Wir setzen \(v-w := v+(-w)\) und können somit auch davon sprechen, Elemente von \(V\) zu subtrahieren.
Sei \(K\) ein Körper. In allen folgenden Fällen ist es leicht nachzurechnen, dass die Bedingungen der Vektorraumdefinition (die »Vektorraumaxiome«) erfüllt sind. (In den meisten Fällen haben wir das schon gemacht oder implizit ausgenutzt, ohne den Begriff Vektorraum zu benutzen.)
Ist \(n\in \mathbb N\), so ist \(K^n\) mit der im vorherigen Kapitel definierten Addition und Skalarmultiplikation ein \(K\)-Vektorraum. Dies ist das prototypische Beispiel eines Vektorraums und man nennt \(K^n\) den Standardvektorraum.
Der Nullvektorraum (oder auch Nullraum) ist der \(K\)-Vektorraum, der nur ein einziges Element hat. Dies muss dann der Nullvektor des Vektorraums sein. Wir schreiben manchmal \(0\) für den Nullraum \(\{ 0 \} \). Eine andere Bezeichnung für denselben Vektorraum ist \(K^0\). (Ganz streng genommen könnten wir von unterschiedlichen Nullvektorräumen sprechen, je nachdem, wie wir das eine Element nennen. Da aber dieses Element wegen der Vektorraumaxiome immer die Rolle des Nullvektors in diesem Vektorraum haben muss, handelt es sich doch praktisch gesehen immer um denselben Raum. Wir werden das im folgenden Kapitel präzisieren, siehe Bemerkung 7.12.)
Der Raum der \((m\times n)\)-Matrizen \(M_{m\times n}(K)\) ist mit der Addition von Matrizen und der Skalarmultiplikation (Definition 5.29) ein Vektorraum über \(K\).
Sei \(U \subseteq K^n\) ein Teilraum im Sinne von Definition 5.23. Dann sind die Einschränkungen der Addition und Skalarmultiplikation auf \(K^n\) Abbildungen \(+\colon U\times U\to U\) und \(\cdot \colon K\times U\to U\), mittels derer \(U\) zu einem Vektorraum über \(K\) wird.
Sei \(M\) eine Menge. Die Menge \(\operatorname{Abb}(M, K)\) aller Abbildungen \(M\to K\) ist ein Vektorraum, wenn wir die Addition und Skalarmultiplikation für \(f, g\colon M\to K\), \(a\in K\) definieren durch
\[ (f+g)\colon M\to K,\ m\mapsto f(m)+g(m),\qquad (af)\colon M\to K,\ m\mapsto af(m). \]Die Menge der Polynomfunktionen \(K\to K\) ist ein \(K\)-Vektorraum, wenn die Addition und Skalarmultiplikation wie im vorherigen Punkt definiert werden.
Wir können das Beispiel \(\operatorname{Abb}(M, K)\) noch verallgemeinern: Sei \(W\) ein \(K\)-Vektorraum und sei \(X\) irgendeine Menge. Dann ist die Menge \(\operatorname{Abb}(X, W)\) mit den folgenden Verknüpfungen ein \(K\)-Vektorraum:
\begin{align*} f+g & := (X\to W,\ x\mapsto f(x)+g(x)),\\ a\cdot f & := (X\to W, x\mapsto af(x), \end{align*}wobei \(f, g\in \operatorname{Abb}(X, W)\), \(a\in K\). Alle Vektorraumaxiome sind leicht nachzuprüfen; es lässt sich alles auf die entsprechenden Bedingungen in \(W\) zurückführen. Der Nullvektor in diesem Vektorraum ist die konstante Abbildung mit Wert \(0\in W\).
Sei \(L\) ein Erweiterungskörper von \(K\) (siehe 4.4). Dann können wir die Multiplikation \(L\times L\to L\) einschränken zu einer Abbildung \(K\times L\to L\). Mit dieser Abbildung als Skalarmultiplikation und der Körperaddition wird \(L\) zu einem \(K\)-Vektorraum. Zum Beispiel können wir in dieser Weise \(\mathbb R\) als \(\mathbb Q\)-Vektorraum betrachten: Die Addition ist die gewöhnliche Addition reeller Zahlen, und für \(a\in \mathbb Q\), \(v\in \mathbb R\) ist die Skalarmultiplikation durch die Bildung des Produkts von \(a\in \mathbb Q\subset \mathbb R\) und \(v\in \mathbb R\) als reelle Zahlen gegeben.
Analog ist \(\mathbb C\) ein \(\mathbb R\)-Vektorraum.
So simpel diese Feststellung ist, so nützlich ist sie doch, später in der Algebra-Vorlesung, aber zum Beispiel auch in Ergänzung 6.57 und Ergänzung 7.65.
Da die Summe und das Produkt von stetigen Funktionen \(\mathbb R\rightarrow \mathbb R\) wieder stetig ist, sieht man, dass die Menge aller stetigen Funktionen \(\mathbb R\to \mathbb R\) (mit der Addition und Skalarmultiplikation für Abbildungen wie vorher) ein \(\mathbb R\)-Vektorraum ist. Entsprechendes gilt für die Menge aller differenzierbaren Funktionen, und auch wenn man den Definitionsbereich durch eine geeignete Teilmenge von \(\mathbb R\) ersetzt, beispielsweise durch ein offenes Intervall.
Man kann sich fragen, ob es nicht natürlicher wäre, die Definition eines Vektorraums dadurch zu ersetzen, dass man erst einmal definiert, was ein Vektor ist.
Es ist aber unmöglich, die gewünschten Eigenschaften von Vektoren in dieser Weise zu abstrahieren, weil sie eben nur im Zusammenspiel mit anderen Vektoren fassbar sind (der Addition von Vektoren und der Multiplikation mit Elementen des Grundkörpers). Deshalb stellt man in der linearen Algebra die Definition eines Vektorraums an den Beginn und definiert dann:
Die (etwas formalistische) Antwort auf die Frage Was ist ein Vektor? ist also: Ein Vektor ist ein Element eines Vektorraums.
In mathematics you don’t understand things. You just get used to them.
John von Neumann,
Antwort auf die Bemerkung eines Physikers, der gesagt hatte
»I don’t understand the method of characteristics.«
wiedergegeben in: G. Zukav, The Dancing Wu Li Masters:
An Overview of the New Physics, Rider, London, 1990.
Man muss vielleicht schon etwas (mathematisch) abgebrüht sein, um sich mit dieser Definition anzufreunden, sie entspricht aber der Zielsetzung, jede Definition so anzulegen, dass sie möglichst vielseitig einsetzbar ist – in diesem Fall heißt das: über die geometrische Anschauung hinaus.
Aber wie stellt man die Verbindung zu der Anschauung her, dass ein Vektor als ein Pfeil interpretiert werden kann (der eine Länge und eine Richtung hat)? Selbst wenn wir uns auf den Vektorraum \(\mathbb R^2\), also die reelle Zahlenebene, oder den \(\mathbb R^3\), den wir anschaulich mit dem uns umgebenden Raum identifizieren können, einschränken – die Elemente sehen wir ja als Punkte in der Ebene beziehungsweise im Raum, und nicht als Pfeile. Diese Anschauung liegt schon der Wahl des Worts Vektor, von lateinisch vectare, »führen, tragen, bringen«, vector, »Fahrer, Träger«, zugrunde, das übrigens von Hamilton in Verbindung mit der Theorie der Quaternionen (siehe Abschnitt 2.3 und Ergänzung 4.11) als erstem benutzt wurde.
Was der Pfeil gut beschreibt, ist die Operation, \(v\) zu einem anderen Element zu addieren. Wenn wir den Startpunkt des Pfeils vom Ursprung nach \(v\) an den Punkt \(x\) legen, ist der Endpunkt des Pfeils bei \(x+v\). In diesem Sinn ist dieser Pfeil eine Beschreibung der Abbildung \(t_v\colon V\to V\), \(x\mapsto x+v\).
Die Abbildung \(V\to \operatorname{Abb}(V,V)\), \(v\mapsto t_v\) ist eine injektive Abbildung. Das bedeutet, dass der Vektor durch die Abbildung \(t_v\) eindeutig bestimmt ist. Man kann den Vektor \(v\) aus dem Pfeil »zurückgewinnen« – das ist ja klar, weil \(v\) gerade der Endpunkt des Pfeils ist, wenn wir ihn am Ursprung beginnen lassen.
Der Begriff des affinen Raums unter einem Vektorraum macht die Unterscheidung zwischen den Rollen der Elemente von \(V\) als »Punkte« bzw. als »Pfeile« noch deutlicher. Wir werden ihn in der Vorlesung aber allenfalls streifen. Siehe Kapitel 11.
Seien \(K\) ein Körper und \(V\) ein \(K\)-Vektorraum. Für alle \(a\in K\), \(v\in V\) gilt:
\(a\cdot v = 0\) genau dann, wenn \(a=0\) oder \(v=0\).
\(-(av) = (-a)v = a(-v)\), und \((-1)\cdot v = -v\).
\(a\sum v_i = \sum av_i\), \((\sum a_i)v = \sum a_iv\), \(\sum a_iv_i + \sum b_iv_i = \sum (a_i+b_i)v_i\) (alle Summen seien endliche Summen).
zu (1). Sei zuerst \(a=0\) und \(v\in V\) beliebig. Dann gilt wegen der Distributivität und wegen \(0+0=0\):
und wenn wir auf beiden Seiten \(-(0v)\) addieren (also das Inverse von \(0v\) addieren), erhalten wir
Sei nun \(v=0\) und \(a\in K\) beliebig. Dann gilt
und wir folgern ähnlich wie vorher, dass \(a0=0\).
Seien nun \(a\in K^\times \), \(v\in V\setminus \{ 0\} \). Um den Beweis von Teil (1) abzuschließen, müssen wir noch zeigen, dass \(av\ne 0\). Wir wissen, dass
und deshalb muss \(av\ne 0\) gelten (denn sonst wäre nach dem schon Gezeigten \(a^{-1}(av) = a^{-1}0 = 0\)).
zu (2). Wir zeigen zunächst \(-(av) = (-a)v\), mit anderen Worten, dass \((-a)v\) das Negative von \(av\) ist. In der Tat gilt
Die zweite Behauptung ergibt sich ganz ähnlich:
Die letzte Behauptung folgt, wenn wir \(a=1\) setzen: \((-1)\cdot v = 1 \cdot (-v) = -v\).
zu (3). Diese Aussagen folgen mit vollständiger Induktion aus den Distributivgesetzen.
Seien \(K\) ein Körper und \(V\) ein \(K\)-Vektorraum. Eine nichtleere Teilmenge \(U\subseteq V\) heißt Untervektorraum (oder Teilraum) von \(V\), wenn \(U\) abgeschlossen unter Addition und Skalarmultiplikation ist, das bedeutet: Sind \(u, u^\prime \in U\), so gilt auch \(u+u^\prime \in U\). Ist \(u\in U\) und \(a\in K\), so ist \(au\in U\).
Wenn \(U\subseteq V\) ein Untervektorraum ist, dann existiert ein Element \(u\in U\), und aus den Untervektorraumeigenschaften folgt \(0 = 0\cdot u \in U\): die Menge \(U\) enthält den Nullvektor \(0\in V\) (alternativ kann man das auch sehen, indem man \(0 = u + (-1)\cdot u \in U\) schreibt). Man könnte also in der Definition die Bedingung, dass \(U\) nicht leer ist, von vorneherein durch die Bedingung \(0\in U\) ersetzen.
Weil \(-u = (-1)\cdot u\), impliziert die Abgeschlossenheit unter der Skalarmultiplikation, dass \(U\) zu jedem Element auch sein additives Inverses enthält. Deswegen ist \(U\) mit den Einschränkungen der Verknüpfungen von \(V\) selbst ein \(K\)-Vektorraum.
In jedem Vektorraum \(V\) sind \(\{ 0\} \) (oft geschrieben als \(0\), und bezeichnet als der triviale Untervektorraum) und \(V\) Teilräume.
Für \(V=K^n\) stimmt der hier definierte Begriff des Untervektorraums mit dem des Teilraums aus Definition 5.23 überein. Insbesondere erhalten wir so eine Vielzahl von Beispielen von Untervektorräumen: Jede Lösungsmenge eines homogenen Gleichungssystems mit \(n\) Unbestimmten ist ein Untervektorraum von \(K^n\).
Sind \(U_1, U_2\subseteq V\) Untervektorräume, so ist \(U_1\cap U_2\) ein Untervektorraum von \(V\). Allgemeiner gilt: Ist \(I\) irgendeine Menge und sind \(U_i\), \(i\in I\), Untervektorräume von \(V\), so ist der Durchschnitt \(\bigcap _{i\in I}U_i\) ein Untervektorraum von \(V\).
Sei \(K\) ein Körper. Was sind die Untervektorräume von \(K^2\)? Es ist nicht schwer zu sehen, dass neben \(0\) und \(K^2\) auch alle Teilmengen der Form \(\{ ax; a\in K\} \) für ein festes Element \(x\in K^2\) die Untervektorraumeigenschaften erfüllen. Es ist richtig, aber nicht offensichtlich, dass damit alle Untervektorräume von \(K^2\) gefunden sind.
Versuchen Sie einmal, das zu zeigen! Spätestens am Ende dieses Kapitels, wenn wir den Begriff der Dimension behandelt haben, wird Ihnen der Beweis leicht fallen.
Eine weitere Methode, um aus gegebenen Untervektorräumen einen weiteren zu konstruieren, ist die Summe von Untervektorräumen:
Sei \(V\) ein \(K\)-Vektorraum. Sind \(U, W\subseteq V\) Untervektorräume von \(V\), so ist \(U+W\) der kleinste Untervektorraum von \(V\), der \(U\) und \(W\) enthält.
Das bedeutet: \(U+W\) ist ein Untervektorraum von \(V\) und wenn \(V^\prime \subseteq V\) irgendein Untervektorraum mit \(U\subseteq V^\prime \) und \(W\subseteq V^\prime \) ist, dann gilt \(U+W \subseteq V^\prime \).
Es ist leicht nachzuprüfen, dass \(U+W\) ein Untervektorraum von \(V\) ist.
Sei nun \(V^\prime \subseteq V\) ein Untervektorraum von \(V\), der \(U\) und \(W\) enthält. Dann gilt für alle \(u\in U\) und \(w\in W\), dass \(u\in V^\prime \) und \(w\in V^\prime \), also \(u+w\in V^\prime \) (denn \(V^\prime \) ist ein Untervektorraum). Also gilt \(U+W\subseteq V^\prime \).
Zusammen mit der obigen Bemerkung, dass der Durchschnitt von Untervektorräumen wieder ein Untervektorraum ist, ergibt sich damit die Beschreibung von \(U+W\) als dem Durchschnitt aller Untervektorräume \(V^\prime \) von \(V\), die \(U\) und \(W\) enthalten.
Sei \(V\) ein \(K\)-Vektorraum.
Sind \(U, W\subseteq V\) Untervektorräume mit \(U\cap W = 0\), so schreiben wir statt \(U+W\) auch \(U\oplus W\) und sagen, \(U\) und \(W\) bilden (innerhalb \(V\)) eine direkte Summe.
Sei \(U\subseteq V\) ein Untervektorraum von \(V\). Wir nennen einen Untervektorraum \(W\) einen Komplementärraum von \(U\) (oder ein Komplement von \(U\)), wenn \(U\oplus W = V\), mit anderen Worten: \(U+W = V\) und \(U\cap W = 0\).
Während die Summe von Untervektorräumen ein Verfahren ist, zu zwei beliebigen Untervektorräumen einen weiteren zu konstruieren, drückt das Symbol \(\oplus \) an dieser Stelle eine Eigenschaft des Paars \(U\), \(W\) von Untervektorräumen aus (nämlich, dass sie trivialen Durchschnitt haben). Siehe auch Abschnitt 6.6.
Wir werden unten sehen (Korollar 6.45), dass jeder Untervektorraum in einem Vektorraum einen Komplementärraum besitzt. In aller Regel ist dieser nicht eindeutig bestimmt, sondern es gibt viele (üblicherweise unendlich viele) verschiedene Komplementärräume zu einem gegebenen \(U\).
Sei \(K=\mathbb R\) und \(V= \mathbb R^2\). Ist \(U\subseteq V\) eine Gerade durch den Ursprung, so ist \(U\) ein Untervektorraum, wie wir bereits gesehen haben. Jede Ursprungsgerade \(W\subseteq V\), die von \(U\) verschieden ist, ist dann ein Komplementärraum von \(U\). Es ist klar, dass \(U\cap W=0\), da \(U\) und \(W\) verschieden sein sollen. Es ist dann nicht schwer zu sehen (aber auch nicht ganz offensichtlich), dass \(U+W=V\) gilt. Machen Sie sich das geometrisch klar!
Sei \(K=\mathbb Q\), \(n\ge 1\). Seien
Dann sind \(U\) und \(W\) Untervektorräume von \(K^n\) und es gilt \(U \oplus W = K^n\).
Wie ist es, wenn \(K\) ein anderer Körper ist?
Sei \(V\) ein \(K\)-Vektorraum, und seien \(U\), \(W\) Untervektorräume von \(V\). Dann sind äquivalent:
Es gilt \(U\oplus W = V\).
Jedes Element \(v\in V\) lässt sich als Summe \(v = u+w\) mit \(u\in U\) und \(w\in W\) schreiben und \(u\) und \(w\) sind dabei eindeutig bestimmt.
(i) \(\Rightarrow \) (ii). Weil \(U+W=V\) gilt, ist klar, dass sich jedes Element \(v\in V\) als Summe \(v=u+w\) mit \(u\in U\) und \(w\in W\) schreiben lässt. Gilt \(v=u+w=u^\prime +w^\prime \) mit \(u,u^\prime \in U\), \(w, w^\prime \in W\), so folgt \(u-u^\prime = w-w^\prime \), und dieses Element liegt in \(U\) (als Differenz zweier Elemente in \(U\)), und auch in \(W\). Weil \(U\cap W=0\), folgt \(u-u^\prime =0\) und \(w-w^\prime = 0\), also \(u=u^\prime \), \(w=w^\prime \). Das beweist die Eindeutigkeit der Darstellung.
(ii) \(\Rightarrow \) (i). Es ist klar, dass \(U+W=V\) gilt. Sei nun \(v\in U\cap W\). Wäre \(v\ne 0\), so erhielten wir die beiden verschiedenen Darstellungen \(v = 0+v = v+0\) im Widerspruch zu (ii). Also muss \(U\cap W=0\) gelten.