Beweisarchiv: Arithmetik: Lösungen von Gleichungen: Gleichungen höheren Grades mit einer Variablen: Kubische Gleichungen

Aus testwiki
Version vom 1. Januar 2022, 13:30 Uhr von imported>Psychironiker (Durchführung: (überflüssigen Artikel entfernt))
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen

Beweisarchiv: Arithmetik: TOPNAV

Anzahl und Ordnung reeller Lösung einer kubischen Gleichung

Zielsetzung dieser Darstellung

Die Cardanischen Formeln lösen eine allgemeine kubische Gleichungen vollständig. Herleitung und Darstellung dieser Formeln erfordert die Verwendung komplexer Zahlen. Algebraisch begründete Aussagen über Anzahl und Ordnung der reellen Lösungen einer allgemeinen kubischen Gleichung sind jedoch auch ohne Verwendung komplexer Zahlen möglich. Hier wird ein solcher Zugang zu diesen Aussagen vorgestellt. Die bei Cardano definierte, recht einfach im Gedächtnis zu behaltende Diskriminante der kubischen Gleichung erweist sich interessanterweise auch hier als zur Fallunterscheidung geeignet.

Im folgenden Text verwendet werden Mittel der Kurvendiskussion, der Zwischenwertsatz, die Verwendung von Ableitungen als Monotoniekriterium, der Zusammenhang zwischen Ordnung einer Nullstelle und Funktionswert der Ableitungen, Eigenschaften einer ungeraden Funktion. Gemäß der Aufgabenstellung bezeichnet "Nullstelle" bzw. „Lösung“ ausschließlich eine reelle (nicht echt komplexe) Nullstelle bzw. Lösung. Der im Text eingeführte, sonst nicht allgemein übliche Begriff „Zwillingsfunktion“ vereinfacht die Fallunterscheidung deutlich.

Durchführung

A. Aus der Herleitung der Cardanischen Formeln übernommen wird die Umformung der allgemeinen kubischen Gleichung

g:Ax3+Bx2+Cx+D=0:A0x=zB3A

zur reduzierten Form

z3+pz+q=0;

die Lösungen der reduzierten Gleichung sind genau die Nullstellen der ganzrationalen Funktion

f:,zy=z3+pz+q=f(z).

Wie die angegebenen Äquivalenzumformungen zeigen, lässt sich jede Nullstelle von f(z) in eine Lösung von g überführen und umgekehrt.


B. (1) f(z) hat höchstens drei Nullstellen (wie sich etwa mit Zerlegung in Linearfaktoren begründen lässt).

(2) Hat f(z) drei verschiedenen Nullstellen, so ist mit (1) jede derselben einfach.

(3) Ist von zwei verschiedenen Nullstellen von f(z) eine mehrfach, so ist die mehrfache (mindestens, mit (1) höchstens) doppelt, die andere einfach.

(4) Alle f(z) haben (mindestens) eine Nullstelle z0, denn...

...eine Untersuchung des Verhaltens im Unendlichen ergibt, dass f(z)<0 für ein hinreichend kleines z, aber f(z)>0 für ein hinreichend großes z; mit Zwischenwertsatz hat f(z) eine Nullstelle in .

(5) Die ersten beiden Ableitungen von f(z) sind:

f(z)=3z2+p
f(z)=6z

(6) Der Graph von f(z) ist eine nach oben geöffnete, zur y-Achse symmetrische Parabel (zweiter Ordnung) mit dem Scheitel (0|p).

(7) Die Ableitung f(z) habe die Nullstelle z=u. Das Intervall I sei eine echte Obermenge von [u,u]. Sei (überall) sgn(f(z))0 im (nicht abgeschlossenen) Intervall {xI,x<u} bzw. {xI,x>u}. Dann ist f(z) streng monoton im (abgeschlossenen) Intervall {xI,xu} bzw. {xI,xu}, denn...

… das Teilintervall [u,u] des abgeschlossenen Intervalls {xI,xu} bzw. {xI,xu} ist kein echtes Intervall im Sinne des hier verwendeten Monotoniekriteriums.

(8) fq(z)=z3+pzq wird in diesem Text als Zwillingsfunktion von fq(z)=z3+pz+q bezeichnet.

fq(z) hat genau dann die Nullstelle z=u, wenn fq(z) die Nullstelle z=u hat, denn...

...in der Zerlegung f(z)=fq=0(z)+q ist die Summandenfunktion f0(z) ungerade. Also ist

0=fq(u)=f0(u)q=f0(u)q=(1)(f0(u)+q)0=f0(u)+q=fq(u).

Die Nullstelle z=u von fq(z) ist genau dann einfach bzw. mehrfach, wenn die Nullstelle z=u von fq(z) einfach bzw. mehrfach ist, denn...

...mit (5) hängt f(z) nicht von q ab, sodass fq(u)=fq(u) (anschaulich mit (6)).

(9) Der Graph von f(z) ist punktsymmetrisch zu (0|q), denn...

...der Graph der ungeraden Funktion f0(z) ist punktsymmetrisch zum Koordinatenursprung; mit der Zerlegung in (8) geht für vorgegebenes p der Graph von fq(z) aus dem Graphen von f0(z) durch Parallelverschiebung in y-Richtung um q hervor.


Fall 1: p 0

(10) Für p0 zeigt sgn(f(z)) mit (7) auch für p=0,z=0 , dass f(z) in ganz streng monoton wächst, keinen Funktionswert an zwei verschiedenen Stellen annimmt, insbesondere keine von z0 verschiedene Nullstelle hat.

(11) Die Nullstelle z0 ist genau dann mehrfach, wenn außer f(z0)=0 auch f(z0)=0. Für f(z) folgt genau dann aus p0 (mit (6) auch anschaulich) p=0 sowie z0=0; aus f(z0=0)=0 folgt q=0. In Fall 1 ist daher f(z)=z3 die einzige Funktion f(z) mit einer mehrfachen Nullstelle. Diese ist (wegen f(0)=0 mindestens, wegen (1) höchstens) dreifach.


Fall 2: p < 0

(12) Für p>0 hat f(z) die Nullstellen

zM,m=±p3.

f(zM<0) ist mit f(zM)<0 ein lokales Maximum, f(zm>0) mit f(zm)>0 ein lokales Minimum von f(z).

(9) erleichtert die Veranschaulichung der von q abhängigen Unterfälle von Fall 2 für ein beliebiges, aber festes p.


(Unterfall 2.1) Die Summandenfunktion f0(z) aus (8) hat drei einfache Nullstellen, denn...

...z=0 ist eine Nullstelle, da f0(z) eine ungerade Funktion ist. Weiter hat f0(z) ein Minimum mit dem Funktionswert

f0(zm>0)=zm(zm2+p)=p3(p3+p)=p32p3<0,

aber für ein hinreichend großes z>zm ist f0(z)>0; also hat f0(z) mit Zwischenwertsatz eine Nullstelle z1(zm,). Da f0(z) eine ungerade Funktion ist, hat sie eine weitere Nullstelle z1(,zm). Die Nullstellen 0, z1, z1 sind gemäß ihrer Lage zu den angegebenen Intervallen verschieden, mit (2) einfach.


(13) Der Funktionswert des Maximums von f0 ist f0(zM)=f0(zm)=f0(zm)>0.

Für die folgenden Unterfälle 2.2, 2.3 und 2.4 wird q > 0 zusätzlich vorausgesetzt. Dann hat f(z) genau eine einfache Nullstelle z0(,0], denn...

...sgn(f(z)) zeigt mit (7), dass f(z) im Intervall (,zM<0] überall streng monoton wächst und im Intervall [zM,0] überall streng monoton fällt. Da f(z)<0 für hinreichend kleines z<zM, aber f(zM)=f0(zM)+q>f0(zM)>0, hat f(z) im Intervall (,zM) (mit Zwischenwertsatz mindestes und wegen strenger Monotonie höchstens) eine Nullstelle z0. Wegen f(z0(,zM))>0 ist z0 einfach.

Da f(z) im Intervall [zM,0] überall streng monoton fällt, ist dort f(0)=q>0 der kleinste Funktionswert, weswegen f(z) in diesem Intervall keine Nullstelle hat.

Für die Unterfälle 2.2, 2.3 und 2.4 bleibt f(z) noch für z(0,) z > 0 auf Nullstellen zu untersuchen.


(Unterfall 2.2) Für 0<q<f0(zm)q+f0(zm)<0 hat f(z) drei einfache Nullstellen, denn...

...f(0)=q>0, aber f(zm>0)=f0(zm)+q<0; also hat f(z) mit Zwischenwertsatz eine Nullstelle im Intervall (0,zm). Wegen f(zm)<0, aber f(z)>0 für hinreichend großes z>zm hat f(z) mit Zwischenwertsatz auch eine Nullstelle im Intervall (zm,). Mit (2) sind die insgesamt drei verschiedenen Nullstellen der Funktion einfach.

Mit (8) hat jede Zwillingsfunktion einer Funktion f(z) des Unterfalls 2.2 ebenfalls drei einfache Nullstellen.


(Unterfall 2.3) Für 0<q=f0(zm)q+f0(zm)=f(zm)=0 hat f(z) eine einfache und eine doppelte Nullstelle, denn...

...die gemeinsame Nullstelle z=zm>0 von f(z) und f(z) ist eine mehrfache Nullstellen von f(z). Mit (3) ist zm die doppelte der insgesamt zwei verschiedenen Nullstellen von f(z).

Mit (8) und (3) hat jede Zwillingsfunktion einer Funktion f(z) des Unterfalls 2.3 ebenfalls eine einfache und eine doppelte Nullstelle.


(Unterfall 2.4) Für 0<f0(zm)<qq+f0(zm)>0 hat f(z) genau eine einfache Nullstelle, denn...

...sgn(f(z)) zeigt mit (7), dass f(z) im Intervall [0,zm] überall streng monoton fällt und im Intervall [zm,) überall streng monoton wächst. Daher ist f(zm)=q+f0(zm)>0 der kleinste Funktionswert f(z) im Intervall [0,), weswegen f(z) in diesem Intervall keine Nullstelle hat.

Mit (8) hat jede Zwillingsfunktion einer Funktion f(z) des Unterfalls 2.4 ebenfalls genau eine einfache Nullstelle.


C. Die Bedingungen der Fallunterscheidung für die Parameter p,q lassen sich übersichtlicher darstellen.

Für Unterfall 2.2 bzw. 2.3 ist:

f0(zm)q>0
p32p3q2

Da beide Seiten der Gleichung positiv sind, bleibt das Ungleichheitszeichen bei Quadrierung erhalten.

p322p232q2:22q222(1)

Δ:=(p3)3+(q2)20

Δ heißt Diskriminante der reduzierten kubischen Gleichung.

Für Unterfall 2.1 ist wegen p<0,q=0 ebenfalls Δ<0.

Für Unterfall 2.4 ist:

q>f0(zm)>0
q>p32p32
q2>p322p232:22q222(1)
0<(p3)3+(q2)2=Δ

Für Fall 1 ist wegen p0 genau dann Δ=0, wenn p=q=0. Für alle anderen f(z) in Fall 1 ist Δ>0.


D. Aus den (Un)gleichungen für Δ,p in C. folgt direkt die Anzahl der Nullstellen von f(z) sowie deren jeweilige Ordnung, denn...

(14) ...für die Menge M aller Funktionen f(z) lassen sich vier paarweise disjunkte Teilmengen Mi, i=1,2,3,4 so definieren, dass

M1 diejenigen f(z) mit genau einer einfachen Nullstelle,
M2 diejenigen mit drei einfachen Nullstellen,
M3 diejenigen mit einer einfachen und einer doppelten Nullstelle und
M4 diejenigen mit genau einer dreifachen Nullstelle

enthält.

(15) Die Ergebnisse von C. ergeben für die Funktion(en) je einer Menge Mi eine einfache Bedingung Bi so, dass die Bi paarweise unvereinbar sind.

M1 enthält alle Funktionen f(z) des Falls 1, p>0 und des Unterfalls 2.4. Für diese Funktionen ist Δ>0. (B1)
M2 enthält alle Funktionen f(z) des Unterfalls 2.1 und des Unterfalls 2.2. Für diese Funktionen ist Δ<0. (B2).
M3 enthält alle Funktionen f(z) des Unterfalls 2.3. Für diese Funktionen ist Δ=0, p0. (B3)
M4 enthält ausschließlich die Funktion f(z)=z3 des Falls 1. Für diese Funktion ist Δ=0, p=0. (B4)

Wenn eine Menge Mi eine Funktion f(z)=fq>0(z) der Fälle 2.2, 2.3 und 2.4 enthält, dann auch die zugehörige Zwillingsfunktion fq<0(z). Für eine solche Zwillingsfunktion fq<0(z) gilt die gleiche Bedingung Bi wie für fq>0(z), da der Wert von Δ nicht vom Vorzeichen von q abhängt.

Damit ist jede Funktion f(z)M Element genau einer Menge Mi.

(16) Sei eine Funktion f(z) vorgegeben. Dann erfüllen deren Parameter p,q genau eine Bedingung Bi=j. Von allen f(z) erfüllen genau die Elemente von Mi=j die Bedingung Bj. Also ist f(z)Mj, womit die Anzahl der Nullstellen von f(z) und deren jeweilige Ordnung gegeben sind:

Ist Δ>0, so hat f(z) genau eine einfache Nullstelle.
Ist Δ<0, so hat f(z) drei einfache Nullstellen.
Ist Δ=0 und p0, so hat f(z) eine einfache und eine doppelte Nullstelle.
Ist Δ=0 und p=0, so hat f(z) genau eine dreifache Nullstelle.

Dies ist bezüglich reeller Nullstellen der auch bei Cardano angegebene Zusammenhang.