11.4 Die trigonometrischen Funktionen
Als nächstes möchten wir zeigen, dass es für jede Zahl \(\alpha \in [0, 2\pi )\) genau einen Punkt \(P\) auf dem Einheitskreis gibt, so dass die Länge des Kreisbogens von \(0\) nach \(P\) (gegen den Uhrzeigersinn) gleich \(\alpha \) ist. Dann können wir Funktionen \(\cos \colon [0, 2\pi )\to \mathbb R\), \(\sin \colon (0, 2\pi )\to \mathbb R\) definieren durch
d.h. \(\cos (\alpha )\) und \(\sin (\alpha )\) sind die Koordinaten dieses Punktes \(P\), der einen Kreisbogen der Länge \(\alpha \) vom Punkt \((1,0)^t\) aus markiert. Wir nennen die Funktionen \(\cos \colon [0, 2\pi )\to \mathbb R\) und \(\sin \colon [0, 2\pi )\to \mathbb R\) die Kosinus- und Sinusfunktion.
Dann werden wir sagen, dass der positive Teil der \(x\)-Achse und die Halbgerade durch \(0\) und \(P\), also die Menge aller nicht-negativen Vielfachen von \(P\), den Winkel \(\alpha \) einschließen.
Wir können die Funktionen \(\cos \) und \(\sin \) dann durch \(\cos (x+2k\pi ) := \cos (x)\), \(\sin (x+2k\pi ):=\sin (x)\) für alle \(k\in \mathbb Z\) periodisch fortsetzen und erhalten so die übliche Kosinus- und Sinusfunktion.
Es gibt grundsätzlich zwei mögliche Ansätze, um dieses Programm durchzuführen:
Man definiert zunächst die Sinus- und Kosinusfunktionen auf »analytischem« Wege und zeigt, dass es sich um differenzierbare Abbildungen handelt, berechnet ihre Ableitungen und daraus weitere Eigenschaften, und zeigt dann, mithilfe von Satz 11.32, dass die Länge des Kreisbogens von \(0\) bis zum Punkt \((\cos (\alpha ), \sin (\alpha ))^t\) gleich \(\alpha \) ist (für \(\alpha \in [0, 2\pi )\)).
Je nach Geschmack ist ein gefühlter Nachteil dieses Ansatzes, dass die Definition von Sinus und Kosinus nicht geometrisch motiviert ist sondern ein bisschen »vom Himmel fällt«. Mit der unten vorgestellten Definition mit der komplexen Exponentialfunktion bleibt man aber ziemlich nah an der geometrischen Anschauung. Mit einem gewissen Aufwand ist es verbunden zu zeigen, dass die Sinus- und Kosinusfunktionen überhaupt periodisch sind. Alle weiteren gewünschten Eigenschaften ergeben sich ohne größere Schwierigkeiten.
Alternativ kann man den Weg \([-1, 1]\to \mathbb R^2\), \(t\mapsto (t, \sqrt{1-t^2})^t\), der den Halbkreis des Einheitskreises oberhalb der \(x\)-Achse parametrisiert, und seine Varianten benutzen (mit denen wir schon gezeigt haben, dass der Einheitskreis ein Jordanbogen ist), um die Sinus- und Kosinusfunktionen zu definieren. Während dieser Ansatz auf den ersten Blick natürlicher erscheint, ist er in der Durchführung an mehreren Stellen lästiger. Unter anderem deshalb, weil der dieser Weg bei \(1\) und \(-1\) nicht differenzierbar ist.
11.4.1 Geometrie der komplexen Zahlenebene
Es wird im folgenden nützlich sein, die reelle Ebene \(\mathbb R^2\) mit der komplexen Zahlenebene zu identifizieren. Wir betrachten die komplexen Zahlen \(\mathbb C\) als zweidimensionalen \(\mathbb R\)-Vektorraum. Im folgenden fixieren wir die Basis \(1\), \(i\) von \(\mathbb C\), mit anderen Worten den \(\mathbb R\)-Vektorraum-Isomorphismus \(\iota \colon \mathbb C\to \mathbb R^2\), der \(1\) auf \(e_1\) und \(i\) auf \(e_2\) abbildet. Eine komplexe Zahl \(a+bi\) wird also auf den Vektor \((a,b)^t\) abgebildet. (Das entspricht ja auch genau unserer ursprünglichen Konstruktion der komplexen Zahlen.)
Die Multiplikation mit \(z=a+bi\), also die Abbildung \(\mathbb C\to \mathbb C\), \(x\mapsto zx\), ist ein Homomorphismus von \(\mathbb R\)-Vektorräumen, der bezüglich der Basis (\(1\), \(i\)) durch die Matrix
beschrieben wird. Vergleiche Bemerkung 5.42.
Die Spiegelung an der Gerade \(\mathbb R\subset \mathbb C\) ist dann die Abbildung \(a+bi\mapsto a-bi\); wir bezeichnen sie als die komplexe Konjugation und nennen \(a-bi\) die zu \(a+bi\) komplex konjugierte Zahl. Üblicherweise wird die zu \(z\in \mathbb C\) komplex konjugierte Zahl mit \(\overline{z}\) bezeichnet.
Für eine komplexe Zahl \(z\) heißt die Länge des Vektors \(\iota (z)\in \mathbb R^2\), also der Abstand \(d(0,\iota (z))\) von \(\iota (z)\) zum Ursprung, der komplexe Absolutbetrag von \(z\). Explizit gilt für \(z=a+bi\), dass \(\lVert z\rVert = \sqrt{a^2+b^2}\), was wir auch als \(\sqrt{z\overline{z}}\) schreiben können. Meist schreibt man \(\lvert z\rvert \) statt \(\lVert z\rVert \) für den Betrag von \(z\).
Den Einheitskreis können wir dann als die Menge aller komplexen Zahlen vom Betrag \(1\) betrachten.
Ist \(z = a+bi\) eine komplexe Zahl mit \(\lvert z \rvert = 1\), dann ist \(a^2+b^2 = 1\). Die Multiplikation mit \(z\) ist dann eine Drehung. Im allgemeinen können wir jede komplexe Zahl \(z\ne 0\) schreiben als \(\lvert z\rvert \cdot \frac{z}{\lvert z\rvert }\), und \(\frac{z}{\lvert z\rvert }\) hat Betrag \(1\). Die Multiplikation mit \(z\) ist also die Verkettung der zu \(\frac{z}{\lvert z\rvert }\) gehörigen Drehung und der Streckung um den (reellen) Faktor \(\lvert z\rvert \).
11.4.2 Die trigonometrischen Funktionen und die komplexe Exponentialfunktion
Am elegantesten (und am schnellsten, wenn man hinreichende Vorkenntnisse über die komplexen Zahlen hat) lassen sich die trigonometrischen Funktionen mithilfe der komplexen Exponentialfunktion einführen. Dies soll hier skizziert werden, und wir beginnen mit der Definition der Exponentialfunktion als
Die hier auftretende Reihe ist für jedes \(x\in \mathbb C\) absolut konvergent.
Es ist \(\exp (0)=1\).
Die Funktion \(\exp \) ist auf ganz \(\mathbb C\) komplex differenzierbar, d.h. für alle \(x\in \mathbb C\) existiert der Grenzwert \(\lim _{h\to 0} \frac{\exp (x+h)-\exp (x)}{h}\), wobei \(h\in \mathbb C\) ist. Als Ableitungsfunktion erhalten wir
\[ \exp ^\prime (x) = \exp (x), \]die Exponentialfunktion ist also gleich ihrer Ableitung.
(Funktionalgleichung) Für alle \(x, y\in \mathbb C\) gilt
\[ \exp (x+y) = \exp (x)\, \exp (y). \]Insbesondere gilt \(\exp (x)\in \mathbb C^\times \) für alle \(x\in \mathbb C\) und \(\exp \colon \mathbb C\to \mathbb C^\times \) ist ein Gruppenhomomorphismus.
Für \(t\in \mathbb R\) gilt \(\lvert \exp (it)\rvert = 1\).
zu (1). Das folgt direkt aus der Definition von \(\exp \) als Reihe.
zu (2). Um die Differenzierbarkeit zu zeigen, kann man, ähnlich wie im Reellen, das Restglied der Reihe geeignet abschätzen, um zu zeigen, dass man die Ableitung der »Potenzreihe« \(\sum _{n\ge 0} \frac{x^n}{n!}\) summandenweise bilden darf, obwohl es sich um eine unendliche Reihe handelt. Damit ist dann auch klar, dass \(\exp ^\prime = \exp \) gilt.
zu (3). Als erstes leiten wir die Funktion \(x\mapsto \exp (x)\exp (-x)\) ab. Als Ableitung erhalten wir (wegen (2), der Produktregel und der Kettenregel, die auch für komplex differenzierbare Funktionen gelten) die Nullfunktion. Das impliziert, dass die betrachtete Funktion konstant ist, und indem wir \(x=0\) einsetzen, sehen wir, dass der Wert für alle \(x\in \mathbb C\) gleich \(1\) ist. Wir haben damit bewiesen, dass \(\exp (-x)=\exp (x)^{-1}\) und insbesondere \(\exp (x)\ne 0\) für alle \(x\in \mathbb C\) gilt.
Wir fixieren nun \(y\in \mathbb C\) und betrachten die Funktion
von der wir gerne zeigen möchte, dass sie konstant ist und den Wert \(\exp (y)\) hat. Die Funktion ist komplex differenzierbar und hat bei \(x=0\) wegen Teil (1) den gewünschten Wert \(\exp (y)\). Es genügt daher zu zeigen, dass die Ableitung dieser Funktion die Nullfunktion ist. Für die Ableitung erhalten wir nach (2) und unter Verwendung von Quotienten- und Kettenregel
Alternativ kann man die Funktionalgleichung auch direkt anhand der Reihendarstellung beweisen, indem man ein geeignetes Ergebnis über das Produkt von unendlichen Reihen heranzieht.
Teil (4) folgt direkt aus Teil (3), denn
wobei wir auch noch benutzt haben, dass \(\overline{\exp (z)} = \exp (\overline{z})\) für alle \(z\in \mathbb C\) gilt. Das liegt daran, dass die komplexe Konjugation eine stetige Abbildung \(\mathbb C\to \mathbb C\) ist und daher mit der Grenzwertbildung der unendlichen Reihe, die die Exponentialfunktion definiert, vertauscht werden darf.
Die Kosinusfunktion ist definiert als
\[ \cos \colon \mathbb R\to \mathbb R,\quad t\mapsto \cos (t) := \text{Realteil von}\ \exp (it). \]Die Sinusfunktion ist definiert als
\[ \sin \colon \mathbb R\to \mathbb R,\quad t\mapsto \cos (t) := \text{Imaginärteil von}\ \exp (it). \]
Für alle \(t\in \mathbb R\) gilt also \(\exp (it) = \cos (t)+i\sin (t)\).
Indem man die entsprechenden Eigenschaften der komplexen Exponentialfunktion, eingeschränkt auf Argumente der Form \(it\), \(t\in \mathbb R\), in ihren Real- und Imaginärteil »zerlegt«, erhält man:
Für alle \(x\in \mathbb R\) gilt
\[ \cos (x)^2 + \sin (x)^2 = 1. \]Die Funktionen \(\sin \) und \(\cos \) sind auf ganz \(\mathbb R\) differenzierbar und es gilt
\[ \sin ^\prime (x) = \cos (x),\qquad \cos ^\prime (x) = - \sin (x). \]Additionstheoreme. Für alle \(s,t\in \mathbb R\) gilt
\begin{align*} & \cos (s+t) = \cos (s)\cos (t) - \sin (s)\sin (t),\\ & \sin (s+t) = \cos (s)\sin (t) + \sin (s)\cos (t). \end{align*}
Wir erhalten hier eine weiter Rechtfertigung dafür, Winkel als Zahl in \([0, 2\pi )\) zu messen (und nicht etwa als Zahl zwischen \(0\) und \(360\)). Natürlich kann man zwischen beiden Systemen einfach umrechnen, indem man mit \(2\pi /360\) bzw. mit \(360/(2\pi )\) multipliziert. Für die Kosinus- und Sinusfunktion würde eine derartige Umskalierung aber bedeuten, dass auch in den Formeln für die Ableitung von \(\sin \) und \(\cos \) der entsprechende Faktor auftreten würde.
Es gilt \(\exp (i\pi /2) = i\).
Der Kern des Gruppenhomomorphismus \(\mathbb R\to \mathbb C^\times \), \(t\mapsto \exp (it)\), ist die Untergruppe \(2\pi \mathbb Z\subseteq \mathbb R\) aller Vielfachen von \(2\pi \).
Die Abbildung \([0, 2\pi )\to S^1\), \(t\mapsto \exp (it)\), ist eine Bijektion vom Intervall \([0, 2\pi )\) auf den Einheitskreis \(S^1\).
Wir zeigen zuerst, dass es eine reelle Zahl \(c\) mit \(\exp (ic)=i\) gibt. Das ist der Schlüssel dazu, zu zeigen, dass die Abbildung \(\mathbb R\to S^1\), \(t\mapsto \exp (it)\), surjektiv ist. Die Existenz von \(c\), die dazu äquivalent ist, dass die Kosinusfunktion eine Nullstelle hat, kann man rein analytisch zeigen, etwa durch geeignete Abschätzung der Reihendarstellung oder durch Argumente mit den Ableitungen von \(\cos \) und \(\sin \). Man könnte auf diesem Wege die Zahl \(\pi \) erst definieren, und nachträglich zeigen, dass sie die Länge des halben Einheitskreisbogens misst (oder für einen großen Teil der Theorie einfach darauf verzichten, diese Interpretation als Länge zu beweisen und die Zahl \(\pi \) sowie die trigonometrischen Funktionen einfach benutzen). Siehe zum Beispiel [ Fo ] §14, [ Hi ] Abschnitt 3.5 oder [ Gr ] 13.3.
Wir wollen hier, unserer Motivation entsprechend, ein geometrisches Argument skizzieren, das direkter mit der Bogenlänge arbeitet, auch wenn es etwas länger ist. (Es hat schon gute Gründe, dass meist der rein analytische Zugang bevorzugt wird.)
Angenommen, die Kosinusfunktion hätte keine Nullstelle. Dann wäre der Kern des Homomorphismus \(t\mapsto \exp (it)\) trivial, diese Abbildung mithin injektiv. Denn für \(C\ne 0\) mit \(\exp (Ci)=1\) folgt \(\exp (Ci/2) \in \{ 1, -1\} \). Ist \(C {\gt} 0\) minimal mit \(\exp (Ci)=1\), so muss \(\exp (Ci/2) = -1\) gelten und es folgt \(\exp (Ci/4) \in \{ i, -i\} \) und damit \(\cos (C/4) = 0\).
Weil \(\lvert \exp ^\prime (it)\rvert = \lvert i\exp (it)\rvert = 1\) für alle \(t\) gilt, erhalten wir für den Weg \([0, x]\to \mathbb C\), \(t\mapsto \exp (it)\) nach Satz 11.32 die Länge
die wir wegen der Injektivität auch als Bogenlänge interpretieren können. Unter der Annahme, dass \(\cos (t)\) niemals Null ist, müsste diese Länge, also \(x\), für alle \(x\) kleiner als ein Viertel des Umfangs des Einheitskreises sein, was absurd ist.
Wir haben damit gezeigt, dass \(\cos \) eine Nullstelle in \(\mathbb R_{{\gt} 0}\) besitzt und definieren \(c\) als das Infimum aller Nullstellen von \(\cos \) in \(\mathbb R_{{\gt} 0}\). Aus der Stetigkeit von \(\cos \) und weil \(\cos (0)=1\) gilt, folgt \(c {\gt} 0\).
Dass eine reelle Zahl \(x\) eine Nullstelle des Kosinus ist, ist dazu äquivalent, dass \(\lvert \sin (x)\rvert = 1\) gilt. Wir wollen begründen, dass \(\sin (c) = 1\) ist. Wegen der Minimalität von \(c\) ist die Kosinusfunktion auf \([0, c)\) positiv, und wegen \(\sin ^\prime = \cos \) ergibt sich, dass die Sinusfunktion auf diesem Intervall streng monoton steigend ist, so dass nicht \(\sin (c) = -1\) gelten kann.
Damit ist gezeigt, dass \(\exp (ic) = i\) gilt. Um den Beweis von Teil (1) abzuschließen, müssen wir noch zeigen, dass \(c = \pi /2\) gelten muss. Die Minimalität von \(c\) impliziert, dass \(\exp (it)\) auf \([0, c]\) injektiv ist. Denn sonst gäbe es in \([0, c]\) auch ein Element \(x\) mit \(\exp (ix)=1\), und für das minimale solche \(x\) in \((0, c)\) müsste \(\exp (ix/2) = -1\) und deshalb \(\exp (ix/4)\in \{ i, -i\} \), also \(\cos (ix/4)=0\), gelten – ein Widerspruch zur Definition von \(c\).
Wir sehen mit dem Zwischenwertsatz, dass \(t\mapsto \exp (it)\) eine Bijektion \([0, c] \to \{ (a,b)^t\in S_1;\ 0\le a \le 1,\ b\ge 0\} \) zwischen dem Intervall \([0, c]\) und dem »Viertel des Einheitskreises«, das im rechten oberen Quadranten liegt, definiert. Mit der oben durchgeführten Berechnung der Bogenlänge sehen wir, dass tatsächlich \(c = \pi /2\) gilt. Damit ist Teil (1) bewiesen.
Aus der Funktionalgleichung folgt nun direkt, dass \(\exp (2\pi i) = 1\) ist, und damit ist klar, dass auch alle Vielfachen von \(2\pi \) im Kern des Homomorphismus \(t\mapsto \exp (it)\) liegen. Wir haben uns außerdem im ersten Teil des Beweises schon überlegt, dass es keine Zahlen \(x\) mit \(0 {\lt} x {\lt} 2\pi \) und \(\exp (ix) = 1\) geben kann. Daraus ergibt sich die Aussage aus Teil (2).
Für Teil (3) bemerken wir zunächst, dass aus dem Zwischenwertsatz und Teil (1) folgt, dass der Kosinus jedenfalls alle Zahlen in \([0,1]\) als Werte annimmt. Daraus und aus der Funktionalgleichung lässt sich nun leicht schließen, dass die Abbildung \(\mathbb R\to S^1\), \(t\mapsto \exp (it)\), surjektiv ist. Dass die Einschränkung \([0, 2\pi )\to S^1\) dann eine Bijektion ist, folgt aus Teil (2).
Teil (3) des Satzes, also die Tatsache, dass wir jede komplexe Zahl mit Betrag \(1\) in der Form \(\exp (it)\), \(t\in [0, 2\pi )\), schreiben können, erlaubt es uns, komplexe Zahlen durch Polarkoordinaten zu beschreiben. Damit ist gemeint, dass jede komplexe Zahl \(z\) in der Form \(z = r\, \exp (it)\) für \(r\in \mathbb R_{\ge 0}\) und \(t\in [0, 2\pi )\) geschrieben werden kann. Wir setzen dafür einfach \(r := \lvert z\rvert \). Ist \(z\ne 0\), dann sind \(r\) und \(t\) eindeutig bestimmt.
Die Multiplikation komplexer Zahlen lässt sich in Polarkoordinaten sehr einfach beschreiben. Es ist \((r\exp (it)) \cdot (r^\prime \exp (it^\prime )) = (rr^\prime ) \exp (i(t+t^\prime ))\). Ist \(t+t^\prime {\gt} 2\pi \), so kann man das Ergebnis umschreiben als \((rr^\prime ) \exp (i(t+t^\prime -2\pi ))\), um zu den Polarkoordinaten des Produkts zu kommen.
Wenn wir die Ableitung im physikalischen Sinne als Geschwindigkeit deuten, heißt die Gleichheit \(\lvert \exp ^\prime (it)\rvert = 1\) für alle \(t\), dass der Weg \(t\mapsto \exp (it)\) den Einheitskreis mit konstanter Geschrindigkeit \(1\) entlangläuft. Im Sinne dieser Anschaung ist klar, dass wir tatsächlich zum Zeitpunkt \(x\) genau Weglänge \(x\) zurückgelegt haben.
Alternativ kann man die Funktionen \(\sin \), \(\cos \) direkt durch ihre Darstellung als (reelle) Potenzreihen definieren,
Das vermeidet die Benutzung der komplexen Zahlen, ist aber etwas weniger »durchsichtig«, insbesondere, was die Herleitung der Additionstheoreme angeht.
Wir wollen kurz einen weiteren möglichen Ansatz skizzieren, um die trigonometrischen Funktionen einzuführen. (Es gibt natürlich auch noch andere Möglichkeiten, siehe zum Beispiel [ Hi ] 3.8 (insbes. S. 293) und 4.1.)
Für einen Punkt \(P\) des Einheitskreises bezeichnen wir mit \(\ell (P)\) die Länge des Kreisbogens von \(e_1 = (1,0)^t\) nach \(P\) (wie üblich entgegen dem Uhrzeigersinn). Dass dieser Kreisbogen ein Jordanbogen ist, überlegt man sich ähnlich wie in Abschnitt 11.3.2. Wir erhalten eine Funktion (den »Arkuskosinus«)
denn für alle \(x\in [-1,1]\) ist ja \((x, \sqrt{1-x^2})^t\) ein Punkt des Einheitskreises. Aus den Eigenschaften der Länge von Jordanbögen folgt, dass die Funktion \(\arccos \) streng monoton wachsend (und insbesondere injektiv) mit Bild \([0, \pi ]\) ist.
Wir würden gerne (vergleiche Satz 11.32) für \(c\colon [-1,1]\to \mathbb R^2\), \(x\mapsto (x, \sqrt{1-x^2})^t\) die Kreisbogenlänge als
schreiben. Der genannte Satz gibt das aber nicht her, weil die Funktion \(c^\prime \), die auf dem offenen Intervall \((-1, 1)\) definiert ist, dort unbeschränkt ist und sich nicht stetig nach \([-1, 1]\) fortsetzen lässt. Dieselbe Problematik hat uns schon in Abschnitt 11.3.2
Man muss (und kann) die Integraldarstellung der Funktion \(\arccos \) daher als uneigentliches Integral auffassen. Wir wollen diese Schwierigkeit, um die Darstellung nicht noch weiter in die Länge zu ziehen, im folgenden stillschweigend ignorieren. Man kann dann zeigen, dass \(\arccos \) auf dem offenen Intervall \((-1, 1)\) differenzierbar ist mit
Gäbe es nicht die (kleine) Schwierigkeit an den Integrationsgrenzen, so würde dies ja direkt aus dem Hauptsatz der Differential- und Integralrechnung folgen.
Weil \(\arccos \) auf \([-1, 1]\) streng monoton wachsend ist, ist die Funktion dort injektiv, also eine Bijektion \([-1, 1]\to [0, \pi ]\). Wir definieren die Abbildung \(\cos \colon [0, \pi ] \to [-1, 1]\) als ihre Umkehrfunktion. Weiterhin definieren wir \(\sin (x) = \sqrt{1-\cos (x)^2}\) für \(x\in [0, \pi ]\), so dass für alle diese \(x\) der Punkt \((\cos (x), \sin (x))^t\) auf dem Einheitskreis liegt. Aus dem Satz über die Ableitung der Umkehrfunktion einer differenzierbaren Funktion erhält man ohne Schwierigkeiten, dass \(\cos ^\prime = -\sin \) gilt. Es folgt dann auch \(\sin ^\prime = \cos \).
Man kann nun die Funktionen \(\cos \) und \(\sin \) von \([0, \pi ]\) auf ganz \(\mathbb R\) fortsetzen und mit ein bisschen zusätzlicher Arbeit zeigen, dass man überall differenzierbare Funktionen mit den gewünschten Eigenschaften erhält. Die Additionstheoreme erhält man aus der Additivität der Länge von Jordanbögen für zusammengesetzte Wege.
Letztlich erhalten wir mit beiden Ansätzen zur Definition von \(\cos \) und \(\sin \) die gewünschte Darstellung des Einheitskreises als Bild des Weges \(t\mapsto (\cos (t), \sin (t))^t\). Wir können damit zum Beispiel auch den Umfang eines Kreises vom Radius \(r\in \mathbb R_{{\gt} 0}\) ausrechnen, denn dieser ist das Bild des Weges \(\gamma \colon [0, 2\pi ]\to \mathbb R\), \(t\mapsto (r\cos (t), r\sin (t))^t\), wir erhalten als Länge also