Quantenmechanik/ Messungen/ Bayes: Unterschied zwischen den Versionen

Aus testwiki
Zur Navigation springen Zur Suche springen
imported>Gluedrop
Neue Seite (vgl. WB:AZ)
 
(kein Unterschied)

Aktuelle Version vom 4. Januar 2021, 17:39 Uhr

Der Bayesianismus

Der nach Bayes benannte Blickwinkel auf die Wahrscheinlichkeit sieht diese Zahl als das Mittel an zu Vorhersage, Prognose, Schätzung, Orakel, Wette. Die Formel von Bayes enthält den klassischen Algorithmus, mit dem ein Orakel auf den neuesten Stand gehoben wird, immer wenn neue Daten verfügbar sind.
Die Bayes-Interpretation der Quantentheorie besteht grob gesagt darin, das Wort 'Zustand' zu streichen und durch 'Orakel' zu ersetzen. Die Wellenfunktion bewegt sich physikalisch weder unitär noch durch Kollaps. Solche Änderungen der Welle frischen einfach nur die Vorhersage-Informationen auf, die beste derzeitige Einschätzung der Lage. Beispielsweise sagt der Algorithmus Wellenausbreitung-plus-Born-Regel: Ist bekannt, durch welche Öffnung die Teilchen am Doppelspalt gehen, kommen keine Interferenzstreifen. Ist der Weg unbestimmt, gibt es Interferenz bei großen Zahlen von Ereignissen. Im ersten Fall wird zur Vorhersage quadriert und dann addiert, im zweiten Fall wird addiert und dann erst quadriert.

Auch der Eigenwert einer Observablen wird nicht als neue definitive Eigenschaft des System nach einer Messung akzeptiert! Sondern nur als ein weiterer Schätzwert, der die prinzipiell immer noch unzulängliche Kenntnis auffrischt. Die Wahrscheinlichkeit 1 ist so schlecht erreichbar wie Temperatur 0 Kelvin. Bayes-Wahrscheinlichkeiten sind nicht erst nach länglichen Versuchsreihen als eventuelle Grenzwerte von Häufigkeiten definiert. Nein, auch für seltene Ereignisse soll ein brauchbarer Formalismus der Statistik bereit stehen.

Im 'Bayesianismus' ist die Quantenmechanik reine Theorie von Schätzungen, Orakeln, Glaubensvorstellungen. Sie macht genau Null Aussagen über die physikalische Realität. Sie weiß nichts von der Technik der Maschine. Die Physik gibt nur eine Gebrauchsanleitung, ein paar empirische Spielregeln, um sich nicht im Urwald zu verirren. Experten gibts keine, nur laienhafte Endverbraucher. Wie die Mehrheit von uns beim Auto, Klapprechner, Smartphone. Die Bayes-Interpretation ist streng "epistemisch" im Gegensatz zu "ontisch".

Beschränkt sich der Bayesianismus nun auf allgemeines Geplauder, auf eine zugespitzte Version der Denkweise aus Kopenhagen? Nicht ganz, er schlägt einige technisch-formale Mittel vor, um die Theorie ganz in Wahrscheinlichkeits-Maßen zu umschreiben und den Begriff des 'Zustands' völlig rauszuwerfen.

Nach Cox muss jede Bewertung zum Erraten von ungewissen Ereignissen, wenn sie Aristotel'scher Logik folgt, den Regeln gehorchen (AB = Ereignisse A und B):

P(A)+P(A¯)=1;P(AB)=P(A|B)P(B)=P(B|A)P(A).

P(A|B) ist die Wahrscheinlichkeit von A, wenn B vorausgesetzt wird. P() wird dargestellt durch eine Maßtheorie von Mengen, die Teil eines 'Wahrscheinlichkeitsraums' sind. Jedes Ereignis ist sozusagen eine Menge von infinitesimalen, atomaren Mikro-Ereignissen, je mit einem Gewicht versehen. Das Maß m() ist daher additiv für disjunkte Mengen und zu Eins normiert.
Ganz klar mit Mengenmaß m():P(AB)=m(AB);P(A|B)=m(AB)/m(B).

Es folgt die Bayes-Regel, um die Wahrscheinlichkeiten von möglichen kommenden Ereignissen Ai zu aktualisieren, sobald das Ereignis B bekannt wird:

P(Ai)P(Ai|B)=P(Ai)P(B|Ai)/P(B).

Benötigt wird konkret dafür ein Modell, das die Zahlen proportional zu P(B|Ai) liefert. Der Nenner P(B) ist Normalisierung. Ist die Vereinigung der disjunkten Ai der gesamte Ereignisraum, folgt nämlich aus der Maßtheorie:

P(B)=iP(BAi)=iP(Ai)P(B|Ai).

Verteilungen verkleidet als Bornsche Regel

Die Produkt-,Summen- und Bayes-Regeln der Wahrscheinlichkeitsrechnung bleiben unverändert für Quanten-Ereignisse, die auf streng orthogonale Mengen von Wellen abgebildet sind. Andernfalls kommt mit Interferenz-Phänomenen eine Erweiterung der Algorithmen ins Spiel. Die klassische Wahrscheinlichkeit kann als Teilmenge der Quantenmechanik technisch gerechtfertigt werden. Mit Hilfe eines Lemmas von Riesz-Fejér kann jede Verteilung wie die Born-Regel aussehen.

Das Lemma von Fejér und Riesz zeigt, wie man aus einer Wahrscheinlichkeits- Verteilung auf dem Intervall [-π,π] bzw. auf dem Einheitskreis sozusagen die Wurzel zieht. Das heißt, sie lässt sich als Betragsquadrat einer "Wellenfunktion" darstellen. Zu klassischen positiven Funktionen schafft das Lemma einen Unterbau, ein Schema von versteckten Variablen, das wie die Quantenmechanik ausieht.

Behauptung. Gegeben sei eine Funktion w:[π,π]+ und ihre beste trigonometrische Approximation (Fourier-Summe) der Ordnung n:

w(x)=j=0n(ujcos(jx)+vjsin(jx))=j=nncjeijx.

Dann gibt es (in keiner Weise eindeutige) Wellenfunktionen der Ordnung n, ψ:[π,π] mit

w(x)=|ψ(x)|2;ψ(x)=k=0nakeikx;ak.

Beweis mit Konstruktion.

w(x)=w(x)*=j=nncjeijx;(w(x)>0;cj=cj*;cn0)
g(z):=cn*+...+c1*zn1+c0zn+c1zn+1+...+cnz2n

Mit diesem Polynom ist w(x)=enixg(eix);w(x)=|g(eix)|.
z=0 ist keine Nullstelle von g,(cn*0).
Andere Nullstellen haben die Symmetrie

0=g(zk)=cn*+...+cnzk2ng(1/zk*)=[(cn*+...+cnzk2n)zk2n]*=0.

Es gibt also Paare von Nullstellen mit 0<|zk|<1;yk=(1/zk*);|yk|>1,
denn eine Nullstelle g(y)=0;y=eix ergäbe unerlaubtes w(x)=0.

Also folgt: g(z)=cnk=1n(zzk)(z1zk*)

Auf dem Einheitskreis mit |z|=1z=(1/z*), wird ein Faktor davon

(zzk)(z1/zk*)=(zzk)(zzk)*/(z*zk*)|zzk|2.

Der Betrag von g(z)||z|=1 kann dann mit Wurzeln der zk geschrieben werden:

w(x)=|g(z=eix)|=|cnk=1nzzkzk|2.

Der Ausdruck im Betrag ist ein Polynom der Ordnung n in der Variablen z, daher folgt wie behauptet w(x)=|k=0nakeikx|2.

Positive Operatorwertige Maße

Der Formalismus der Urgleichung ersetzt das Rechnen mit Zuständen durch die Manipulation von Verteilungen, ganz im Sinne der Bayes-Interpretation. Vorher müssen hier ein paar technische Definitionen eingeschleppt werden.

Der Einfachheit halber sei der Hilbertraum von endlicher Dimension. Ein System von Orthogonal-Projektions-Operatoren (PVM, projektor-wertiges Maß)

{Pi|Pi:;iPi=𝟏;PiPj=δijPi}

dient dazu, die Wahrscheinlichkeiten von Messungen zu berechnen:

Reine Zustände: W(i)=ψ|Pi|ψ=tr(|ψψ|Pi)
Gemischte Zustände: ρ:=kqk|ψkψk|;W(i)=tr(ρPi).

Der Operator ρ heißt Zustandsoperator, in alter Literatur auch Statistischer Operator, Dichte-Operator, oder gar Dichtematrix genannt. Ein Zustandsvektor enthält nur die reine quantentypische Unschärfe. Ein Zustandsoperator hat eine zusätzlich eingebaute Streubreite wegen Unkenntnis der Einzelheiten; reine Zustände werden verschmiert mit einer klassischen statistischen Verteilung {qk}.

Ein Positiv-Operatorwertiges Maß (POVM) ist eine Menge von Operatoren/Matrizen, die positiv-semidefinit sind und deren Summe Eins ergibt. Dies verallgemeinert etwas die Systeme von Projektoren PVM und die Idee von Quantenmessungen.

{Fi|Fi:;iFi=𝟏;ψ|Fi|ψ0ψ}.

Die Wahrscheinlichkeiten mit Zustandsoperator ρ sind W(i)=tr(ρFi).

Noch allgemeiner werden projektorwertige und operatorwertige Maße definiert, wenn statt jedes Indexes i eine messbare Menge das Argument wird. Die Menge solcher Mengen bilden eine Sigma-Algebra. Eine Vereinigung disjunkter Mengen wird auf die Summe ihrer Maß-Operatoren abgebildet.

Nach einem Satz von Naimark kann zu einem POVM ein 'größerer' Hilbertraum gefunden werden, auf dem jeder Operator der Familie zu einer Projektion wird. Hier nur die Anfänger-Version mit endlichen Dimensionen: Sei {Fi|i=1...n} ein POVM auf dem Raum , dann gibt es einen Raum , eine Isometrie V: und eine Projektor-Familie {Pi}, so dass Fi=VPiVi.
Isometrie = skalarprodukt-erhaltende lineare Abbildung, nicht immer umkehrbar.
Das nicht gerade sparsamste Beispiel ist mit Orthogonalbasis {u1,...un}:

=n;Pi=𝟏(|uiui|);V=i=1nFi|ui.

Die Operatoren Fi haben nichtnegatives Spektrum und daher Quadratwurzeln.

Die Auswertung von Zustand ρ auf der Familie {Fi} kann dann nach folgendem Schema auf einfache Projektonsmessungen mit der Familie {Gi:=|uiui||i=1...n} reduziert werden.

  • Definiere einen unitären Operator U auf und einen 'Vakuumvektor' |zn so dass V(y)=U(|y|z)y.
  • Präpariere den Zustand des Operators ρ(|zz|) und transformiere ihn mit dem Operator U
  • W(i)=tr(ρFi)=tr[(𝟏Gi)U(ρ(|zz|))U].

Mit einem beliebigen unitären

S:;:Mi:=SFi;V=i=0n(Mi(|uiui|))

machen die Isometrie V und das zugehörige U ebenfalls die Familie Fi zu Projektionen. Ein reiner Zustand |ψ wird so abgebildet

U(|ψ|z)=i=1nMi(|ψ|ui)

Wenn die 'Kollapsmessung' mit dem Projektionsmaß das Ergebnis Pj liefert, kommt |ψ(Mj|ψ)/ψ|MjMj|ψ heraus.

Allgemein auf gemischtem Zustand: ρ(MjρMj)/tr(MjρMj).

Der Kollaps in einem POVM-Modell von Messungen hängt vom willkürlich gewählten S ab. Außerdem sind die Operatoren Mi nicht orthogonal und nicht idempotent wie Projektoren. Daher kann die Wiederholung einer Messung abweichende Resultate ergeben. Die Wahrscheinlichkeit von k nach dem Kollaps auf ein anderes j ist nämlich nicht Null:

W(k|j)=tr(MkMjρMjMk)/tr(MjρMj).

Symmetrische informationell vollständige POVM (SIC-POVM)

Ein IC-POVM ist eine Menge von n positiv semidefiniten Operatoren, so dass

  • die Summe ist der Eins-Operator, dim()=d.
  • die Menge spannt den Raum aller linearen Operatoren auf, also nd2.

Ein SIC-POVM ist eine Basis {Fi|i=1...d2} des Operator-Raums aus genau d2 Operatoren vom Rang 1 mit folgenden Eigenschaften:

  • Fi=Pi/d,
  • Pi ist ein Projektor vom Rang 1, Pi2=Pi;i=1...d2,
  • gleiche paarweise innere Produkte: tr(PiPj)=(dδij+1)/(d+1).

Das SIC-POVM soll theoretische Messungen darstellen, die einen Quantenzustand vollständig und eindeutig charakterisieren. Die Projektionen sind nicht orthogonal, denn d2d, doch sie überlappen sich gleichförmig. Die Erwartungswerte auf einem reinen Zustandsvektor bzw. die Spuren mit einem Zustandsoperator sind eine normierte Wahrscheinlichkeitsverteilung. Die Messungen sind mangels Kommutation nicht gleichzeitig machbar. In einem großen Ensemble von gleich zubereiteten Systemen müsste unabhängig für jeden der Operatoren sein Mittelwert auf einem Teil-Ensemble bestimmt werden.

Exixtieren die SIC-POVM-Mengen? Gibt es Algorithmen, um sie herzustellen? In Dimension 2 ja. 4 Vektoren auf der Blochkugel, die an den Ecken eines regulären Tetraeders sitzen, definieren ein SIC-POVM.

Jedes Pi=|ψiψi| gehört zu einem Einheitsvektor. Man interessiert sich für unitäre Gruppendarstellungen gUg, die als Permutationen auf dieser Vektormenge agieren. Ideal aus einem einzigen Referenzvektor würde die SIC-POVM-Menge erzeugt, {|ψi|i=1...d2}={Ug|ϕ|gG}.
mit der Nebenbedingung |ϕ|Ug|ϕ|2=1/(d+1)Ug𝟏.
Die meisten SIC-POVM sind kovariant unter Darstellungen der abelschen Gruppen G=d×d (Addition modulo d;|G|=d2).
Sei {u1...ud} eine Orthonormalbasis des Vektorraums d. Definiere

Phasen-Operator T:uiziui;z:=e2πi/d,
Schiebe-Operator S:uiu(i+1)mod d

Die Weyl-Operatoren W(p,q):=SpTq erzeugen eine projektive unitäre Darstellung der Gruppe G.

W(p,q)W(p,q)=SpTqTqSp=𝟏,
W(p,q)W(r,s)(ui)=W(p,q)zisui+r=zisz(i+r)qui+r+p=
=zrqzi(s+q)ui+r+p=zrqW(p+r,q+s)(ui), (Addition modulo d).

Numerisch wurden SIC-Mengen gefunden bis d=151, mit Hilfe der Kovarianz unter Aktion der Gruppen d×d. Für gewisse d gibt es einen Bezugsvektor im Raum d, dessen Orbit unter G ein SIC-POVM bildet.

Die Urgleichung

Ein Zustandsoperator definiert eine Wahrscheinlichkeitsverteilung auf einem SIC-POVM {Fi;Pi=dFi;i=1...d2} wegen folgender Gleichung:

ρ=i=1d2[(d+1)W(Fi)(1/d)]Pi;W(Fi)=tr(ρFi).

W(Fi) ist die Born-Wahrscheinlichkeit, das 'Bit' Fi zu messen. Diese Verteilung soll ρ als Informationsträger des Zustands voll ersetzen. Eine beliebige reale Quantenmessung sei durch ein POVM {Dj} vorgegeben und habe die Verteilung W(Dj):=tr(ρDj) auf dem Indexbereich der Operatoren. Jede der (nicht immer vertauschenden?) Observablen Dj müsste einzeln oft genug gemessen werden, um diese Verteilung zu schätzen. Es folgt

W(Dj)=i=1d2[(d+1)W(Fi)(1/d)]W(Dj|Fi);W(Dj|Fi):=tr(PiDj)

Dies ist die Urgleichung. Der letzte Term ist die Verteilung für {Dj}, wenn Pi als Zustandsoperator angesehen wird. Die bedingte Wahrscheinlichkeit also in Kaskaden, wenn häufig wiederholt zuerst das Bit 1 fürs Element Pi des SIC-POVM gefunden wird, danach ein Element des POVM gemessen. In der Urgleichung verschwindet der Zustand ρ zu Gunsten der Verteilung {W(Fi)}.
Die Urgleichung ist anders als die konventionelle Wahrscheinlichkeitsregel Wc(Dj)=i=1d2W(Fi)W(Dj|Fi)!
Quantentheorie Wc(Dj)W(Dj) macht eine dimensionsabhängige affine Transformation der klassischen Wahrscheinlichkeit. Die Gleichung für Wc(Dj) würde eine kohärente Kaskade aus zwei Messungen beschreiben; erst sollte eines der Fi gefunden werden und diese Fi wären disjunkt, orthogonal. In der Urgleichung aber sitzen Wahrscheinlichkeiten, für welche keines der Fi gemessen wird. Die Menge {Fi} fungiert als Algorithmus für eine umkodierte Zustandsinformation.
Die Urgleichung gilt als quantenphysikalische Relation zwischen verschiedenen 'Kontexten' und berücksischtigt Interferenz von unverträglichen Observablen.

Ein Zustand wird also äquivalent beschrieben durch seine Verteilung {W(Fi)}. Diese dient dazu, im Sinne von Bayes neue Wetten und Orakel zu berechnen. Entwicklung mit einem unitären Zeitentwicklungs-Operator U=U(t):

W(t,Fi)=tr[(UρU)Fi]=tr[ρ(UFiU)]

In der zweiten Form, dem Heisenberg-Bild zuzuordnen, wird der konstante Zustand ρ mit dem variablen POVM {Dj(t)=UDJU} gemessen. Die zeitveränderliche Urgleichung enthält die gleiche Information wie die Schrödinger-Gleichung zusammen mit der Born-Regel:

W(t,Dj)=i=1d2[(d+1)W(t,Fi)(1/d)]W(Dj|Fi).

Diese Formel bietet Prognosen jeder Messung als Funktion der Zeit, wenn die zeitveränderliche Verteilung der d2 'informationell vollständigen' Bezugsmessungen vorliegt.

Wigners-Freund-Paradoxon ?