Inhalt

6.2 Erzeugendensysteme

Definition 6.16

Unter einer Linearkombination von Vektoren \(v_1, \dots , v_n\) eines \(K\)-Vektorraums \(V\) verstehen wir einen Vektor der Form

\[ a_1v_1 + \cdots + a_nv_n,\quad a_i\in K. \]

Wir können diese Sprechweise auch auf eine möglicherweise unendliche Familie \((v_i)_{i\in I}\) von Vektoren ausdehnen. Eine Linearkombination ist dann eine Summe der Form

\[ \sum _{i\in I} a_i v_i,\quad a_i\in K,\quad \text{nur endlich viele}\ a_i\ne 0. \]

Eine Summe mit unendlich vielen Summanden können wir in einem Vektorraum nicht bilden, aber da alle bis auf endlich viele \(a_i\) verschwinden, handelt es sich hier nur um eine endliche Summe. (In speziellen Konstellationen kann man natürlich auch dem Summensymbol mit unendlich vielen Summanden \(\ne 0\) einen Sinn geben, wie einer konvergenten Reihe in der Analysis. In der linearen Algebra kommen derartige Grenzwertbildungen aber nicht vor.)

Wir sagen, ein Vektor \(v\) lasse sich als Linearkombination der Familie \(v_1, \dots , v_n\) darstellen, wenn \(a_1, \dots , a_n \in K\) existieren mit \(v = a_1v_1 + \cdots + a_nv_n\). Analog kann man davon sprechen, ob ein Vektor sich als Linearkombination einer (möglicherweise unendlichen) Familie \((v_i)_{i\in I}\) darstellen lässt.

Der Nullvektor lässt sich als Linearkombination jeder Familie \((v_i)_{i\in I}\) darstellen, indem man alle Koeffizienten \(=0\) wählt. (Mit der sinnvollen Konvention, dass die Summe über eine leere Indexmenge gleich Null sein soll, gilt das selbst für den Fall \(I=\emptyset \).)

Beispiel 6.17

Der Vektor \((2,4,5)^t\in \mathbb R^3\) lässt sich nicht als Linearkombination der Vektoren \((1,0,-1)^t\) und \((1,1,0)^t\) schreiben. (Warum nicht?)

Er lässt sich aber als Linearkombination von \((1, 0, 1)\) und \((0, 8, 6)\) schreiben. (Warum?)

Definition 6.18

Seien \(K\) ein Körper und \(V\) ein \(K\)-Vektorraum. Eine Familie \(B = (b_i)_{i\in I}\) von Elementen von \(V\) heißt Basis von \(V\), falls jedes Element \(v\in V\) in eindeutiger Weise (also für genau eine Wahl von Koeffizienten) als Linearkombination von Elementen aus \(B\) dargestellt werden kann.

Beispiel 6.19

Sei \(n\ge 1\). Die Familie

\[ e_1 = \left( \begin{array}{c} 1 \\ 0 \\ 0 \\ 0 \\ \vdots \\ 0 \end{array} \right),\quad e_2 = \left( \begin{array}{c} 0 \\ 1 \\ 0 \\ 0 \\ \vdots \\ 0 \end{array} \right),\quad e_3 = \left( \begin{array}{c} 0 \\ 0 \\ 1 \\ 0 \\ \vdots \\ 0 \end{array} \right),\quad \dots , \quad e_n = \left( \begin{array}{c} 0 \\ 0 \\ 0 \\ \vdots \\ 0 \\ 1 \end{array} \right),\quad \]

ist eine Basis von \(K^n\) und wird als die Standardbasis von \(K^n\) bezeichnet. Die Vektoren \(e_i\) nennen wir die Standardbasisvektoren. Manchmal spricht man auch von den kanonischen Einheitsvektoren.

Es ist klar, dass \(e_1, \dots , e_n\) tatsächlich eine Basis von \(K^n\) bilden, denn ist \(v = (x_i)_i\in K^n\) gegeben, so gilt \(v = x_1e_1 + \cdots x_n e_n\), und die \(x_i\) sind die einzigen Koeffizienten, für die die zugehörige Linearkombination den Vektor \(v\) liefert.

Beispiel 6.20

Ist \(V\) der Nullvektorraum über dem Körper \(K\), so ist (per Definition) die leere Menge eine Basis von \(V\), denn der Nullvektor kann als die »leere Linearkombination« geschrieben werden.

Beispiel 6.21

Sei \(K\) ein Körper, \(V\ne 0\) ein \(K\)-Vektorraum und \(v\in V\) irgendein Element \(\ne 0\). Dann ist \(U=\{ av;\ a\in K\} \) ein Untervektorraum von \(V\) und jedes Element \(\ne 0\) von \(U\) bildet eine Basis von \(U\).

Wenn \(K\) mehr als zwei Elemente hat, dann hat \(U\) also mehrere verschiedene Basen.

Wie das Beispiel zeigt, ist eine Basis eines Teilraums fast nie eindeutig bestimmt.

Sei \(K\) ein Körper. Wir haben gesehen, dass die Lösungsmenge eines homogenen linearen Gleichungssystems in \(n\) Unbestimmten ein Teilraum von \(K^n\) ist. Ist das Gleichungssystem durch eine Matrix \(A\) in reduzierter Zeilenstufenform gegeben, so liefert die Methode, die wir kennengelernt haben, um die Lösungsmenge abzulesen, auch eine Basis dieses Vektorraums:

Satz 6.22

Sei \(A\in M_{m\times n}(K)\) die Koeffizientenmatrix eines homogenen linearen Gleichungssystems. Wir nehmen an, dass \(A\) reduzierte Zeilenstufenform hat. Seien \(r\) die Anzahl der Spalten von \(A\), die eine führende Eins enthalten, und seien \(j_1^\prime {\lt} \cdots {\lt} j^\prime _{n-r}\) die Indizes der anderen Spalten.

Sei für \(\lambda = 1, \dots , n-r\) der Vektor \(b_\lambda = (b_{\lambda j})_j\in K^n\) der eindeutig bestimmte Lösungsvektor mit

\[ b_{\lambda j} = \begin{cases} 1 & j = j^\prime _\lambda \\ 0 & j \in \{ j_1^\prime , j_2^\prime , \dots , j_{n-r}^\prime \} \setminus \{ j_\lambda ^\prime \} \end{cases} \]

(die Werte \(b_{\lambda j}\) für \(j\not \in \{ j_1^\prime , \dots , j_{n-r}^\prime \} \) ergeben sich dann eindeutig aus der Bedingung, dass \(b_\lambda \) ein Lösungsvektor des gegebenen Gleichungssystems ist, siehe Satz 5.18).

Dann bilden die Vektoren \(b_1,\dots , b_{n-r}\) eine Basis der Lösungsmenge des Gleichungssystems \(Ax=0\).

Beweis

Das folgt unmittelbar aus der Beschreibung der Lösungsmenge in Satz 5.18, vergleiche auch Beispiel 5.19.

Mit anderen Worten: Die Vektoren, mit denen wir nach der üblichen Methode die Lösungsmenge eines homogenen linearen Gleichungssystems aufschreiben (vergleiche das Ende von Beispiel 5.19 (2)) bilden eine Basis dieses Teilraums von \(K^n\).

Bemerkung 6.23

Machen Sie sich an einem Beispiel klar, dass es zwar nach Satz 5.17 zu gegebener Lösungsmenge nur eine Matrix in reduzierter Zeilenstufenfrom gibt, die diese Lösungsmenge ergibt, und wir demnach aus dem vorherigen Satz eine Basis der Lösungsmenge erhalten, ohne weitere Wahlen zu treffen, dass aber die Lösungsmenge meistens noch viele andere Basen hat (die eben nicht auf diese Art und Weise entstehen).

Bemerkung 6.24

Wir können aus unseren Ergebnissen über lineare Gleichungssysteme auch ein Kriterium dafür ableiten, wann eine Familie \(v_1, \dots , v_n\in K^n\) eine Basis bilden. Dass es so ist, heißt genau, dass die Gleichung

\[ X_1 v_1 + X_2 v_2 + \cdots + X_n v_n = b \]

für jedes \(b\in K^n\) eine eindeutige Lösung \((x_i)_i\in K^n\) hat. Wenn wir die \(v_i\) als Spalten in eine Matrix \(A\) schreiben, so bedeutet das genau, dass für alle \(b\in K^n\) das lineare Gleichungssystem \((A\mid b)\) eindeutig lösbar ist. Wir haben gesehen, dass das dazu äquivalent ist, dass die Matrix \(A\) invertierbar ist.

Es ist auch nicht schwierig, die Theorie der linearen Gleichungssysteme zu benutzen, um zu zeigen, dass eine Basis von \(K^n\) immer aus genau \(n\) Elementen bestehen muss. Weil wir dieses Ergebnis aber auch in Kürze aus der allgemeinen Theorie erhalten, verzichten wir hier auf eine genauere Analyse. Siehe auch Ergänzung 6.47.

Definition 6.25

Sei \(V\) ein Vektorraum.

  1. Seien \(v_1, \dots , v_n\in V\). Der von \(v_1, \dots , v_n\) aufgespannte Untervektorraum ist die Teilmenge aller derjenigen Vektoren von \(V\), die sich als Linearkombination der \(v_i\) darstellen lassen. Er wird mit \(\langle v_1, \dots , v_n \rangle \) bezeichnet:

    \[ \langle v_1, \dots , v_n \rangle = \left\{ \sum _{i=1}^n a_i v_i;\ a_i\in K \right\} . \]
  2. Ist allgemeiner \(M\subseteq V\) irgendeine (möglicherweise unendliche) Teilmenge, so ist der von \(M\) aufgespannte Untervektorraum von \(V\) die Teilmenge aller derjenigen Elemente aus \(V\), die sich als Linearkombination von Elementen aus \(M\) darstellen lassen. Er wird mit \(\langle M \rangle \) bezeichnet:

    \[ \langle M \rangle = \left\{ \sum _{i=1}^n a_i v_i;\ n\ge 1, a_i\in K, v_i\in M \right\} . \]

Man spricht auch vom von \(v_1, \dots , v_n\) (bzw. von \(M\)) erzeugten Untervektorraum, von der linearen Hülle oder vom Spann der Vektoren \(v_1, \dots , v_n\) bzw. der Menge \(M\).

Wie in der Definition angedeutet, ist \(\langle v_1,\dots , v_n\rangle \) und allgemeiner \(\langle M \rangle \) ein Untervektorraum von \(V\). Das prüft man leicht anhand der Definition nach.

Satz 6.26 Charakterisierung der linearen Hülle

Seien \(K\) ein Körper, \(V\) ein \(K\)-Vektorraum und \(M\subseteq V\) eine Teilmenge. Dann gilt:

  1. \(\langle M \rangle \) ist der Durchschnitt aller Untervektorräume, die \(M\) enthalten.

  2. \(\langle M \rangle \) ist der kleinste Untervektorraum von \(V\), der \(M\) enthält, das bedeutet: \(\langle M\rangle \) ist ein Untervektorraum, und ist \(U\subseteq V\) irgendein Untervektorraum mit \(M\subseteq U\), so gilt \(\langle M \rangle \subseteq U\).

Beweis

Zu (1). Sei \(U\) der Durchschnitt aller Untervektorräume, die \(M\) enthalten. Dies ist ein Untervektorraum von \(V\) (Beispiel 6.8). Er enthält \(M\) und damit auch alle Linearkombination von Elementen aus \(M\), d.h. \(\langle M\rangle \subseteq U\). Andererseits ist \(\langle M \rangle \) ein Untervektorraum, der \(M\) enthält, also gilt auch \(U\subseteq \langle M\rangle \).

Zu (2). Das folgt direkt aus Teil (1), denn der Durchschnitt aller Untervektorräume, die \(M\) enthalten, ist natürlich in jedem solchen Untervektorräume enthalten.

Beispiel 6.27

Wir betrachten den \(\mathbb R\)-Vektorraum \(V = \mathbb R^3\), den wir anschaulich mit dem uns umgebenden Raum identifizieren. Ist \(v\in V\), \(v\ne 0\), so ist \(\langle v\rangle \) die eindeutig bestimmte Gerade durch den Ursprung, die \(v\) enthält. Ist \(v^\prime \in V\) ein Vektor, der nicht auf der Gerade \(\langle v\rangle \) liegt, so ist \(\langle v, v^\prime \rangle \) die eindeutig bestimmte Ebene, die den Ursprung, \(v\) und \(v^\prime \) enthält.

Beispiel 6.28

Sei \(K\) ein Körper, \(n\ge 1\). Sei

\[ U = \left\{ (x_1, \dots , x_n)\in K^n;\ \sum _{i=1}^n x_i = 0 \right\} , \]

dies ist ein Untervektorraum von \(K^n\). (Vergleiche Beispiel 6.14.) Dann gilt

\[ U = \left\langle \left( \begin{array}{r} 1 \\ -1 \\ 0 \\ 0 \\ \vdots \\ 0 \end{array} \right), \left( \begin{array}{r} 0 \\ 1 \\ -1 \\ 0 \\ \vdots \\ 0 \end{array} \right), \dots , \left( \begin{array}{r} 0 \\ \vdots \\ 0 \\ 0 \\ 1 \\ -1 \end{array} \right) \right\rangle \]

und diese Elemente bilden sogar eine Basis von \(U\).

Um den Begriff der Basis besser zu verstehen, ist es nützlich, die zwei Aspekte der Definition – die Existenz einer Darstellung als Linearkombination einerseits, und die Eindeutigkeit andererseits – separat zu untersuchen. Der Begriff des Erzeugendensystems, den wir nun definieren, isoliert den Aspekt der Existenz solcher Darstellungen. Im nächsten Abschnitt behandeln wir dann mit dem Begriff der linearen Unabhängigkeit den Aspekt der Eindeutigkeit der Darstellung.

Definition 6.29

Seien \(K\) ein Körper und \(V\) ein \(K\)-Vektorraum. Eine Teilmenge \(M\) von \(V\) heißt Erzeugendensystem von \(V\), falls \(\langle M \rangle = V\), d.h. wenn zu jedem \(v\in V\) eine Zahl \(N\ge 0\) und Elemente \(m_1, \dots , m_N\in M\) und \(a_1, \dots , a_N\in K\) existieren, so dass \(v = \sum _{i=1}^N a_im_i\).

Definition 6.30

Ein \(K\)-Vektorraum \(V\) heißt endlich erzeugt, wenn ein Erzeugendensystem von \(V\) existiert, das nur endlich viele Elemente hat.

Die Vektorräume \(K^m\), \(m\in \mathbb N\) sind endlich erzeugt, denn es gibt ein Erzeugendensystem (sogar eine Basis) mit \(m\) Elementen. Seien \(v_1,\dots , v_n\in K^m\) und sei \(A\in M_{m\times n}(K)\) die Matrix mit den Spalten \(v_1, \dots , v_n\). Dass \(v_1,\dots v_n\) ein Erzeugendensystem von \(K^m\) bilden, bedeutet genau, dass für alle \(b\in K^m\) das lineare Gleichungssystem \((A\mid b)\) lösbar ist.

Die Begriffe Erzeugendensystem und endlich erzeugt können wir auch auf Untervektorräume eines Vektorraums anwenden (denn jeder Untervektorraum ist ja selbst auch ein \(K\)-Vektorraum).

Beispiel 6.31 Beispiel eines nicht endlich erzeugten Vektorraums

Sei \(K\) ein Körper und sei \(V\) der Vektorraum aller Folgen \((a_i)_{i\in \mathbb N}\) mit \(a_i\in K\), also \(V=\prod _{i\in \mathbb N} K\), mit der komponentenweisen Addition und Skalarmultiplikation. Es ist leicht zu überprüfen, dass es sich tatsächlich um einen \(K\)-Vektorraum handelt. (Wir können diesen Vektorraum auch als den Vektorraum \(\operatorname{Abb}(\mathbb N, K)\) aus Beispiel 6.2 betrachten. Vergleiche auch Abschnitt 6.6.)

Die Teilmenge \(U\subset V\), die aus allen Folgen mit nur endlich vielen Einträgen \(\ne 0\) besteht, ist ein Untervektorraum. Auch das lässt sich leicht nachrechnen. (Mit der Notation von Abschnitt 6.6 ist \(U=K^{(\mathbb N)}\).)

Der Vektorraum \(U\) ist nicht endlich erzeugt. Denn sind \(u_1, \dots , u_n\in U\), so haben nach Definition von \(U\) alle \(u_i\) nur endlich viele von \(0\) verschiedene Einträge. Sei \(N\in \mathbb N\) der höchste Index, bei dem in irgendeinem der \(u_i\) ein Eintrag \(\ne 0\) steht. Der Vektor, der an der Stelle \(N+1\) eine \(1\) und sonst überall Nullen hat, ist ein Element von \(U\), das nicht in \(\langle u_1,\dots , u_n\rangle \) liegt.

Es ist richtig, aber weniger offensichtlich, dass auch der Vektorraum \(V\) nicht endlich erzeugt ist. Siehe Satz 6.44.

Beispiel 6.32

Sei \(K\) ein unendlicher Körper. Der \(K\)-Vektorraum \(U\) aller Polynomfunktionen \(K\to K\) (Abschnitt 4.3 und Beispiel 6.2) ist nicht endlich erzeugt. Denn für jede Polynomfunktion \(f\colon K\to K\), die nicht die Nullfunktion ist, ist die Darstellung \(f(x) = \sum _{i=0}^n a_ix^i\) mit \(a_n \ne 0\) eindeutig bestimmt. Die Zahl \(n\) bezeichnet man dann als den Grad von \(f\). Sind \(f_1,\dots , f_r\) Polynomfunktionen vom Grad \(\le n\), so hat auch jede Linearkombination der \(f_i\) Grad \(\le n\). Da Polynomfunktionen von beliebig großem Grad existieren, folgt aus dieser Überlegung, dass \(U\) nicht endlich erzeugt ist.

(Betrachtet man die Koeffizienten \(a_0, \dots , a_n\) als eine unendliche Folge von Elementen in \(K\), deren weitere Glieder alle \(=0\) sind, so kann man dieses Beispiel mit dem vorherigen identifizieren.)

Ist \(K\) endlich, so gibt es nur endlich viele Polynomfunktionen \(K\to K\), und insbesondere ist der Vektorraum aller dieser Polynomfunktionen eine endliche Menge und erst recht endlich erzeugt.