Quantenmechanik/ Hartree-Fock: Unterschied zwischen den Versionen

Aus testwiki
Zur Navigation springen Zur Suche springen
imported>Gluedrop
Neue Seite (vgl. WB:AZ)
 
(kein Unterschied)

Aktuelle Version vom 11. Januar 2021, 09:30 Uhr

Zur Rechentechnik

Für einfachere Formeln in diesem Abschnitt sorgen dimensionslose Längen, Zeiten, Energien. Die Variablen sollen so skaliert werden, dass aus Schrödinger-Gleichungen die Faktoren q2 bzw. q2/(4πϵ0) in SI,2/m, wegfallen. Es kommen ja nur Elektronen vor mit Ladung q und Masse m.

Definiere R=r/a;T=t/b;U=u/c. Dimensionsloses in Großbuchstaben.

uϕ=itϕ=(2/(2m))r2ϕ+(q2/r)ϕ
Uϕ=iTϕ=R2ϕ/2+ϕ/R

Einsetzen von u=cU,t=T/b,r=Ra,r=R/a ergibt

cUϕ=(i/b)Tϕ=(2/m/a2)R2ϕ/2+(q2/a)ϕ/R
c=/b=(2/m/a2)=(q2/a)
Längeneinheit a=2/(mq2), Energie-Einheit c=q2/a=2/(ma2), Zeiteinheit b=/c.

Mit diesen Bohrschen Einheiten sind Ladung und Masse der Elektronen und das Wirkungsquantum im Folgenden rausgeworfen. Symbole wie r,E,t sind dimensionslos und bedeuten r/a und so weiter.

Zur Herleitung einiger Näherungsverfahren des Viel-Fermion-Problems werden Elemente der Funktionalrechnung gebraucht, die auch woanders nützlich sind.

Lagrange-Multiplikatoren

Das Problem, extreme Werte einer glatten Funktion f(x) von n Variablen x=(x1,...,xn) zu finden, führt unweigerlich zur Aufgabe, den Gradienten, also alle partiellen Ableitungen, auf Null zu setzen: if=f/xi=0.
Nun sollen k Nebenbedingungen dazu kommen, etwa g(x)=0,g=(g1,...,gk). Glatte Nebenbedingungen natürlich, dazu nur mit einfachen Nullstellen. Wir Normalmenschen versuchen zuerst, die Sache auf (n-k) unabhängige Variablen umzurechnen und dann wie im uneingeschränkten Fall fortzufahren. Lagrange war schlauer als normale Menschen und fand einen besseren Trick mit (n+k) unabhängigen Variablen. Mehr statt weniger!

Angenommen, bei x=x0 sitzt ein Extremum von f, auf der Teilmenge mit den k Bedingungen gj(x)=0;j=1...k. Dann gibt es mindestens (n-k) linear unabhängige Richtungsvektoren {uh} am Punkt x und (n-k) Geraden zh(t):=x0+tuh als Tangenten der Mannigfaltigkeit {x|g(x)=0}. Für diese verschwinden folgende Ableitungen bei t=0:

0=(d/dt)f(x0+tuh)=iuhiif(x0)
0=(d/dt)gj(x0+tuh)=iuhiigj(x0)

Die Gradienten von f und von den k Bedingungen stehen also senkrecht auf den (n-k) unabhängigen Richtungsvektoren. Insgesamt sind das (k+1) Gradienten der Dimension n. Folglich müssen sie linear abhängig sein und es gibt Faktoren {zj}, so dass if(x0)+jzjigj(x0)=0.

Nun definiert man die Funktion von (n+k) Variablen f¯(x,y):=f(x)+jyjgj(x)
Am Punkt (x,y)=(x0,z) ist ihr Gradient Null, denn:

f¯/xi=if+jzjigj=0;f¯/yj=gj(x)=0.

Es folgt der Lagrange'sche Algorithmus zu Optimierungen und so weiter: Zur Funktion f(x) mit gesuchtem Extremum werden die Nebenbedingungen gj(x) mit Lagrange-Multiplikatoren yj addiert. Dann wird nach unbeschränkten Extrema im Definitionsbereich von (x,y) gesucht.

Multiplikator-Methode mit Funktional-Ableitungen

Für nichtlineare Funktionale gibt es eine Differenzialrechnung und die häufige Suche nach stationären oder extremen Werten. Das Wirkungprinzip für Bahnkurven und für Felder jeder Art ist Anwendungsfall Nummer Eins in der Physik.

Ein Funktional A sei hier eine Abbildung von einem Definitionsbereich von glatten, stark abfallenden Funktionen in den Wertebereich der reellen Zahlen. Die Funktionen sollen vom Typ f:nm sein und die Funktionale sind lokal oder bi-lokal oder komplizierter. Etwa so:

A[f]=dnxL(x,f(x),if(x),ikf(x))
A[f]=dnxdnyM(x,y,f(x),if(x),f(y),if(y))

Die Funktionalableitung wird definiert, so dass sie sich verhält wie die Gradienten einer Funktion y() von mehreren Variablen:

(d/dt)|t=0(y(x+tη))=iiyηi
(d/dt)|t=0(A[f+tη])=jdnxδAδfj(x)ηj(x)

Das heißt, δA/δfj ist ein Integralkern für die lineare Approximation eines Funktionals, wenn zum Argument 'kleine' Abweichungen δf(x) kommen.

Das Extremalproblem, etwa ein Prinzip der stationären Wirkung, führt auf ein Gleichungssystem δAδfj(x)=0. Fürs lokale Funktional des ersten Beispiels ist die Funktionalableitung

δAδfj(x)=LfjixiL(ifj)+i,k2xixk2L(ikfj)

Die alternierenden Vorzeichen kommen über partielle Integration herein.

Sei A[f]=dnxdnyM(f(x),f(y),x,y).
Bezeichne M1i:=M(f,g,x,y)/fi(x);M2i:=M(f,g,x,y)/gi(y).
δAδfi(x)=dny(M1i(f(x),f(y),x,y)+M2i(f(y),f(x),y,x))

Ist M symmetrisch bei Vertauschung (x,f(x))(y,f(y)), dann bekommt man als Integrand 2M1i().

Nebenbedingungen bei der Suche nach Extremalen von A[f] könen zweierlei Form haben. Entweder handelt es sich ebenfalls um Funktionale Bj[f]=0, oder aber es sind wesentlich strengere punktweise Kriterien Cj(f(x),if(x))=0. Der erste Fall ist beispielsweise eine Normalisierung der Lösung f, der zweite Fall ist eine Eichung. Lagrange-Multiplikatoren, die sich an A[f] als weitere Argumente anfügen, sind einfache reelle Variablen bei Funktional- Bedingungen oder neue Funktions-Freiheitsgrade bei punktweisen Bedingungen.

Der Beweis, dass der Multiplikator-Algorithmus bei Funktionalen richtig ist, wäre zum Beispiel als Grenzübergang zu führen: ersetze die Definitions- Mannigfaltigkeit der Funktionen durch N Gitterpunkte. Dann sind die Funktionen einfach hochdimensionale Tupel; das Funktional wird beliebig gut angenähert durch eine Funktion endlich vieler Variablen. Nur bei endlicher Dimension greift das ursprüngliche Argument aus der Linearen Algebra zur Existenz der Multiplikatoren.
Intuitives Argument: Ein Funktional A[f] ist extremal, wenn jegliche Variation ff+δf nur dann den Wert von A linear verändert, wenn δf aus der erlaubten Teilmenge herausführt, also mindestens eines der δBj[f] nicht verschwindet. Das heißt, wenn die Funktionalvariation δF[f] eine Linearkombination ist aus den Variationen der Nebenbedingungen.

Funktional mit Nebenbedingungen: A¯[f,y]=A[f]+jyjBj[f].

A[f] ist stationär für die Funktion f={fi}, wenn es ein Tupel y={yj} so gibt, dass:

δAδfi(x)+jyjδBjδfi(x)=0ix;Bj[f]=0j.

Bei komplexwertigen Funktionen im Funktional greift ein wichtiger Trick aus der Differenzialrechnung: Statt algebraische Ausdrücke mühsam in den partiellen Ableitungen nach dem Realteil und Imaginärteil eines komplexen Arguments z=u+iv zu entwickeln, benutzt man die partiellen Ableitungen nach dem Symbol z und nach seinem Konjugierten z*, zu betrachten als zwei unabhängige Variablen -- mit allen gewöhnlichen Produktregeln und so weiter. Es ergeben sich äquivalente Gleichungssysteme.
Ist ein Funktional ϕF[ϕ] reellwertig und invariant unter einer Symmetrie (ϕi(r)ϕi*(r)), dann reicht es aus für Extremalprinzipien und ähnliches, das Tupel der komplexwertigen Funktionalableitungen ηi(r)=δF/δϕi*(r) auszurechnen.

Beispiel 1: Funktional F=d3rϕ*(r)2ϕ(r)

Einfach nach den Regeln: δF/δϕ*(r)=2ϕ(r)

Beispiel 2: F=d3rd3sv(r,s)ϕi*(r)ϕj(r)ϕk*(s)ϕl(s)

δF/δϕh*(r)=d3s[δihϕj(r)v(r,s)ϕk*(s)ϕl(s)+δkhϕl(r)v(s,r)ϕi*(s)ϕj(s)]

Hartree-Fock-Gleichungen

Die Näherung von Hartree und Fock ist ein Variationsansatz, um das Minimum des Energie-Erwartungswertes für ein System aus n Elektronen zu suchen. Als Wellenfunktionen erlaubt man nur reine Produktfunktionen aus n linear unabhängigen Einteilchen-Wellen, genauer, die Slater-Determinanten. Verschränkte Funktionen werden also ignoriert! Nebenbedingung ist, dass die n Faktorwellen ϕ1,...,ϕn ein Orthonormalsystem bilden. Der Erwartungswert des Hamiltonoperators ist dann ein Funktional auf der Menge der n-tupel von Funktionen {ϕi(x)}. Er hat lokale kinetische und externe Anteile zweiter Ordnung, sowie einen bilokalen vierter Ordnung mit dem Wechselwirkungs-Potenzial. Unter Funktional-Nebenbedingungen wird das Extremalproblem mit Lagrange-Multiplikatoren aufgesetzt. Dies liefert n Integro-Differenzial-Gleichungen für die n Einteilchenwellen.
Die Anwendung auf Atome und Moleküle geschieht in der Approximation von unbeweglich angeordneten Kernen, die das externe Potenzial beisteuern.

Es geht darum, einen reellen Energie-Erwartungswert zu minimieren, mit folgenden Randbedingungen:

  • Die n-Teilchen Wellenfunktion Ψ(r1,...rn) ist eine Slater-Determinante von Einteilchen-Funktionen {ϕi(r);i=i...n}.
  • d3rϕj*(r)ϕk(r)=δjk (Orthonormierung).

Der Erwartungswert sowie die Normierungsbedingungen sind reelle Funktionale auf einer Menge von n-komponentigen Funktion ϕ={ϕ1,...,ϕn} und sind Integrale über algebraische Terme der ϕi und ihrer komplex-Konjugierten. Daher brauchen wir nur die Funktionalableitungen δF/δϕi*(r).

Auszurechnen ist der Energie-Erwartungswert der Slater-Determinanten mit orthonormalen {ϕi}. Die n-Elektronen-Welle hat die Form

Ψ(r1,...,rn)=det[ϕi(rk)]/n!

Die Determinante kann entwickelt werden als Summe über die Permutationen der Indizes von ϕ oder derjenigen von r; hier wird gebraucht:

n!Ψ(r1,...,rn)=pSnsgn(p)ϕp1(r1)ϕpn(rn).

Mit dem externen Atomkerne-Potenzial v(r) und dimensionslosen Variablen ist der Hamilton-Operator H die Summe von:

  • Einteilchen-Kinetischer Energie TΨ=[ii2/2]Ψ
  • Anziehung durch die Kerne VΨ=[iv(ri)]Ψ
  • Coulomb-Abstoßung CΨ=[jk;jk(1/|rjrk|)]Ψ

Die Coulomb-Summe hier zählt alle Paare von Indizes nur einmal, ungeordnet.
Nun zur Kombinatorik des Erwartungswerts H=Ψ|H|Ψ.

Ein Einteilchen-Operator Q(rj) sieht jedes ϕi, wenn es als ϕi(rj) in einem Term der Determinanten auf beiden Seiten auftaucht und wenn beide Terme die exakt gleiche Permutation sind (Orthonormalität). Das macht (n-1)! Kopien von ϕi|Q|ϕi, alle mit positivem Vorzeichen. Insgesamt, weil die Fakultät mit zwei Faktoren 1/n! von Ψ wegschmilzt:

Q:=Ψ|Q|Ψ=(1/n)iϕi|Q|ϕi.

Eine symmetrische Summe von Einteilchen-Operatoren R=jQ(rj) ergibt Ψ|R|Ψ=iϕi|Q|ϕi. Damit folgt der Anteil T+V des Hamilton-Operators

T+V=Ψ|T+V|Ψ=iϕi|2/2+v(r)|ϕi

Eine symmetrischer Zweipunkt-Operator P=P(rj,rk);jk, fängt zwischen zwei Determinanten jedes Paar von Wellenfaktoren (ϕl,ϕm) viermal ein, mit Minuszeichen für die vertauschten Terme:

ϕl*(rj)ϕl(rj)Pϕm*(rk)ϕm(rk)+ϕm*(rj)ϕm(rj)Pϕl*(rk)ϕl(rk)
ϕl*(rj)ϕm(rj)Pϕm*(rk)ϕl(rk)ϕm*(rj)ϕl(rj)Pϕl*(rk)ϕm(rk);

weil jede Paarvertauschung eine Permutation mit Vorzeichen Minus ist. Für jeden Term fallen (n-2)! Kopien an für die Permutationen der anderen Indizes außer j,k. Nur gleich permutierte Terme beider Slater-Determinanten lassen dabei wegen Orthonormalität den Faktor 1 durch. Alles zusammengefasst mit Integralvariablen r,s und einem Faktor 2*(n-2)!:

Ψ|P|Ψ=2/n/(n1)lm;lmd3rd3s[ϕl*(r)ϕl(r)P(r,s)ϕm*(s)ϕm(s)ϕl*(r)ϕm(r)P(r,s)ϕm*(s)ϕl(s)]

Das Ergebnis hängt nicht von den Indizes (j,k) ab. Die Summe geht über die Menge der (ungeordneten) Paare und ist nicht als Doppelsumme über zwei Laufindizes zu lesen. Vertauschte Ordnung eines Paares (lm) verändert keines der zwei Integrale, weil jeweils zu kompensieren mit rs. Die Symmetrie P(r,s)=P(s,r) wird ja vorausgesetzt.

Der Coulomb-Operator ist nun die Summe von n(n-1)/2 genau solchen Zweipunkt-Termen. Alle erzeugen sie Gleiches, also gilt da der letzte Ausdruck. Der Faktor vor der Summe hebt sich weg, und P(r,s)=1/(|rs|). Schreibweise des Coulomb-Funktionals mit Blick auf baldige Funktionalableitung:

C=Ψ|C|Ψ=lm;lmd3rϕl*(r)[d3s(ϕm*(s)ϕm(s)ϕl(r)(ϕm*(s)ϕm(r))ϕl(s))/|rs|],
C=:DX.

Hier unterscheiden wir den direkten Anteil D und den Austausch-Teil X, der all die Terme mit Minuszeichen aufsaugt.

Zusammengefasst. Der Hamilton-Operator-Erwartungswert ist also ein Funktional auf einem Raum der Wellen-Tupel

ϕ={ϕ1,...ϕn}E[ϕ]=Ψ|T+V+C|Ψ

mit der Bedingung, dass Wellentupel orthonormal sind. Gesucht wird ein Minimum des Funktionals.

Das Energie-Funktional E[ϕ] wird nun mit Lagrange-Faktoren ergänzt zu

F[ϕ]:=E[ϕ]j,kϵjkϕj|ϕk.

F=F* muss reell sein wie E, bei unbeschränkter Variation von ϕ. Daraus folgt eine hermitesche Multiplikator-Matrix ϵjk=ϵkj*. Außerdem ist F invariant unter den unitären Matrixtransformationen:

ϕi=jUijϕj;ϕi*=jUij*ϕj*;ϵjk=hlUjhϵhlUlk;UU=UU=𝟏

Denn die Summen j,kϵjkϕj*(r)ϕk(r) bleiben gleich und die Slater-Determinanten

detSdet{Sik}=det[ϕi(rk)]

transformieren sich zu det[jUijϕj(rk)]=(detU)(detS). Wegen Unitarität ist (detU) ein konstanter Faktor vom Betrag 1, der die Erwartungswerte von hermiteschen Operatoren nicht ändert.
Es kann nun jede hermitesche Matrix ϵjk unitär auf Diagonalform gebracht werden. Nach einer solchen Symmetrietransformation hat das Funktional F eine Darstellung mit einem physikalisch gleichen Zustand, der wesentlich einfacher aussieht:

F[ϕ]=E[ϕ]jϵjϕj|ϕj;(ϕj|ϕj=d3rϕj*(r)ϕj(r))

Wird so die unitäre Redundanz rausgeworfen, reduziert sich das Variationsproblem damit auf n reelle Lagrange-Faktoren ϵi und n Gleichungen für die Einteilchenfunktionen:

δF/δϕi*=0δE/δϕi*(r)=ϵiϕi(r).

Die Funktionalableitungen von E[ϕ]=T+V+DX wurden schon ziemlich vorgekaut, weil oben bewusst die Teile von E als Integrale von ϕi* mal irgendwas vorkommen. Man liest direkt die Anteile (T+V) und Q=(D-X) ab.

δ(T+V)/δϕi*(r)=(2/2+v(r))ϕi(r)

Beim Q-Anteil wird wegen der besprochenen Paarsymmetrie aus der Summe lm für die Ableitung Nummer i nur l=i ausgewählt, der andere Index durchläuft alle Werte ungleich i. Daher mit P(r,s)=1/|rs|

δQ/δϕi*(r)=d3sm;miϕm*(s)ϕm(s)P(r,s)ϕi(r)
d3sm;miϕm*(s)ϕm(r)P(r,s)ϕi(s)

Noch ein Trick: Nun wird formal auch m=i in den Summen zugelassen, weil sich diese Terme aufheben. Die zwei Teile des effektiven Potenzials saugen jeweils einen Selbstenergie-Term auf.

Die Dichte der Elektronenwolke ist folgende Summe von Betragsquadraten

ρ(r)=mϕm*(r)ϕm(r)=m|ϕm(r)|2.
Es gilt d3rρ(r)=n.

Eine Zweipunkt-Korrelation sei definiert als

ζ(r,s)=mϕm*(s)ϕm(r);(ζ(s,r)=ζ*(r,s)).

Dann liest sich die Ableitung von Q als ein klassisches lokales Potenzial mit der Ladungsdichte ρ minus ein nichtlokales Potenzial mit der Korrelation.

δQ/δϕi*(r)=u1(r)ϕi(r)d3su2(r,s)ϕi(s)
u1(r)=d3sρ(s)/|rs|
u2(r,s)=ζ(r,s)/|rs|

Der Teil u1 als Coulomb-Potenzial überrascht nicht. Der andere Teil heißt Austausch-Wechselwirkung -- ein Quanteneffekt für gleiche Fermionen.

Der Erwartungswert C kann als Funktion von ρ ausgedrückt werden, wenn man Anteile l=m dazu zählt und mit der halben Doppelsumme hantiert.

C=Ψ|C|Ψ=lm;lmd3rd3s[ϕl*(r)ϕl(r)ϕm*(s)ϕm(s)ϕl*(r)(ϕm*(s)ϕm(r)ϕl(s)]/|rs|.

Weil für l=m die Termpaare gleich sind, funktioniert die Transformation

lm;lm[*]12lm[*]C=DX
D=12lmd3rd3s(1/|rs|)ϕl*(r)ϕl(r)ϕm*(s)ϕm(s)
=12d3rd3sρ(r)ρ(s)/|rs|.
X=12lmd3rd3s(1/|rs|)ϕl*(r)ϕm(s)ϕm*(s)ϕl(r)
=12d3rd3s|ζ(r,s)|2/|rs|.

Die Teilsumme D ist die klassische Coulomb-Energie einer Ladungswolke, die andere Summe X zieht davon einen manifest positiven Anteil ab. Wurde aber nicht gesagt, dass gleiche Fermionen sich mehr abstoßen sollen als unterschiedliche Teilchen? Tun sie. Diese Abstoßung ist hier über das Pauli-Prinzip in den gezwungen orthogonalen Einteilchenwellen verpackt; der Austauschterm korrigiert offenbar etwas von dessen Übertreibung.

Das n-Tupel von Variationsgleichungen sind gekoppelte Gleichungen vom zeitunabhängigen Schrödinger-Typ, in denen die Wellen nichtlinear auf das Potenzial rückwirken -- darüber hinaus taucht ein nichtlokaler Integralkern auf. Der effektive Einteilchen-Hamilton-Operator hängt von den Lösungen ab.

H¯ϕ(r)=(2/2+v+u1)ϕ(r)d3su2(r,s)ϕ(s)

Damit sieht der Hartree-Fock-Algorithmus für den Grundzustand etwa so aus: Zuerst errate man zu vorgegebenen Kern-Positionen eines Moleküls eine vorläufige Ladungsdichte ρ und versuche sie anzupassen mit einem n-Tupel von orthonormalen Wellenfunktionen. Eine Möglichkeit, den Motor der Iteration anzukurbeln, ist es, die vereinfachten Hartree-Gleichungen zu lösen, worin der Austauschteil entfällt und Schrödingergleichungen dableiben:

(2/2+v(r)+u1(r))ϕi(r)=ϵiϕi(r);u1(r)=d3sρ(s)/|rs|
Selbstkonsistenz-Bedingung: ρ(r)=i|ϕi(r)|2.

Dann berechne man mit den n niedrigsten Wellenfunktionen die Ladungsdichte neu und die Zweipunkt-Korrelation. Danach finde man n verbesserte Zustände der modifizierten Einteilchen-Schrödinger-Gleichung mit nichtlokalem Potenzial. Mit dem neuen n-Tupel wiederhole man die Prozedur Wellenfunktionen Ladungsdichten, bis hoffentlich Konvergenz erfolgt. Die selbstkonsistene Iteration ist natürlich sehr rechenintensiv und garantiert keine große Präzision. Hartree-Fock ist eine Referenzmethode, auf der zahlreiche verfeinerte Algorithmen für Computereinsatz aufbauen.

Zu beachten. Die Summe der ϵi ist nicht die Energie des Grundzustands.

iϵi=iϕi|H¯|ϕi=T+V+d3rd3s[ρ(r)ρ(s)|ζ(r,s)|2]/|rs|
=T+V+2(DX)=E+DX

Hier kommen Doppelsummen in den Elektronpaar-Wechselwirkungen vor. Sie werden in der Epsilon-Summe doppelt gezählt im Vergleich zu den einfachen Paarsummen im Energie-Funktional.
Zumindest messen die ϵi nicht ganz unrealistisch die Ionisierungs- Energie für Elektronen. Die Energie, die man aufbringen muss, um das eine oder andere Elektron vom Molekül abzutrennen.

Der Spin wurde bis hierhin nicht erwähnt. Er ändert nicht viel an der Theorie. Statt ϕi(r) gibt es ϕi(σ,r) mit einem diskreten Index und jedes Integral wird zu σd3r. Die Coulomb-Wechselwirkung hat in nullter Näherung keine Spin-Abhängigkeit. Slater-Determinanten sind nicht Null, wenn zum Beispiel zwei ϕi die gleiche Ortsfunktion haben, jedoch linear unabhängige Tupel (mit σ indexiert) als Faktoren. Jedes Orbital-Niveau kann von zwei Elektronen mit verschiedenen Spinrichtungen besetzt werden.

Dichtefunktionale nach Hohenberg, Kohn, Sham