Beweisarchiv: Kombinatorik: Eine verallgemeinerte LYM-Ungleichung

Aus testwiki
Zur Navigation springen Zur Suche springen

Beweisarchiv: Kombinatorik: TOPNAV

In der Spernertheorie, einem Teilgebiete der Kombinatorik, besteht einer der üblichen Ansätze zur Herleitung des Satzes von Sperner darin, zunächst die Lubell-Yamamoto-Meshalkin-Ungleichung - auch kurz LYM-Ungleichung genannt[1] - zu zeigen und daraus dann den spernerschen Satz zu folgern.

Wie sich zeigt, ist bei diesem Ansatz wesentlich, dass bei einer endlichen Potenzmenge   2M   über einer endlichen Grundmenge   M   die Automorphismengruppe   Aut(2M)   mit der symmetrischen Gruppe   SM über M   identifiziert werden kann:

Denn jeder solcher Automorphismus zeichnet sich dadurch aus, dass er die Inklusionsordnung der Potenzmenge strikt erhält, weswegen er stets mit einer Permutation der Atome des booleschen Verbandes   2M   - also der einelementigen Teilmengen von   M   ! - zusammengehört, welche ihn wegen der Verbandseigenschaften von   2M   völlig bestimmt.

Daher ist jeder der zugehörigen Orbits

Aut(2M)X=SMX={g(X):gSM}(XM)

nichts weiter sind als eine der Mächtigkeitsklassen

(Mi)2M(i=0,,|M|)  ,

da nämlich für   XM   die Menge   g(X)   nichts anderes ist als die Menge der   g-Bilder von   X   unter der Permutation g.

Geht man nun von   Aut(2M)   zu beliebigen endlichen Gruppen und allgemeinen Gruppenoperationen über, so erhält man eine Verallgemeinerung der LYM-Ungleichung, welche sogar ganz unabhängig von den Ordnungsbetrachtungen innerhalb der endlichen Potenzmengen Gültigkeit hat.[2]

Formulierung der Verallgemeinerung

Gegeben sei eine endliche (multiplikativ geschriebene) Gruppe (G,) mit neutralem Element e.
S sei eine endliche Menge und hierauf operiere (G,) vermöge der Gruppenoperation
G×SS
(g,s)gs.
Weiter seien eine Teilmenge AS gegeben und eine endliche Familie (ci)iI von Elementen von S, wobei I eine endliche nichtleere Indexmenge sein möge.
Dabei sei für gG
Ig={iI:gciA}   .
Dann gilt  :
iI|GciA||Gci|wimaxgGiIgwi.

Beweis

Schritt 1

Wir setzen

Gi={gG:gciA}   (iI)   .

Damit gilt:

(1) iIGi×{i}=gG{g}×Ig

Wir wenden (1) an, ausgehend von einer gegebenen Zahlenfamilie (wi)iI, auf die reellwertige Funktion

v:G×I,v(g,i)=wi

an.

Aus Disjunktheitsgründen erhalten wir zunächst[3]

(2) iIv[Gi×{i}]=gGv[{g}×Ig]

und daraus unmittelbar die Ungleichung

(3) iIv[Gi×{i}]|G|maxgGv[{g}×Ig]   .

Aus (3) gelangt man sogleich zu der Ungleichung

(4) iI|Gi|wi|G|maxgGiIgwi   .

Mit (4) jedoch ergibt sich sofort die Behauptung, wenn noch für jeden Index iI die folgende Identität (5) gezeigt wird:

(5) |Gi|=|G||GciA||Gci|   .

Schritt 2

Zum Beweis von (5) sei j irgendeiner der Indizes. Der Vereinfachung halber sei c:=cj gesetzt.

Es ist dann

(6) |Gj|=aA|{gG:gc=a}|=a(GcA)|{gG:gc=a}|   .

Nun lässt sich zu jedem a(GcA) ein Gruppenelement hG als fest vorgegeben annehmen, welches die Gleichung hc=a erfüllt .

Damit lässt sich beweisen - siehe Schritt 3 unten! - dass die Gleichung

(7) hGc={gG:gc=a}

besteht.

Und dies reicht aus zum Beweis von (5):

Denn man berücksichtigt erst einmal die Tatsache, dass jede Translation eine Bijektion ist, weswegen man mit (7) zunächst

(8) |Gj|=|Gc||GcA|

hat. Dann wird weiter berücksichtigt, dass in die bisherigen Überlegungen keine speziellen Eigenschaften der Teilmenge AS eingeflossen sind, dass also (8) für jedes AS und dann inbesondere auch für A=S richtig ist. Also folgt sogleich

(9) |G|=|Gc||Gc|   .

Verknüpft man nun (8) und (9), so hat man (5).

Schritt 3

Zum Nachweis von (7) sind die Inklusion von links nach rechts und umgekehrt die Inklusion von rechts nach links zu zeigen.

Zunächst wird erstere gezeigt. Dazu sei g'Gc.

Es gilt dann

(10) (hg')c=h(g'c)=hc=a

und folglich

(11) hGc{gG:gc=a}   .

Zum Nachweis der umgekehrten Inklusion sei gG und dafür die Gleichung gc=a erfüllt.

Dann ist wie stets

(12) g=h(h1g)

und hierbei gilt

(13) (h1g)c=h1(gc)=h1a=h1(hc)=(h1h)c=ec=c .

Also haben wir

(14) {gG:gc=a}hGc   .

(11) und (14) zusammen ergeben (7) .

Korollar: Die klassische LYM-Ungleichung

Ist unter den oben beschriebenen Gegebenheiten die Sitution derart, dass jede der Indexmengen   Ig(gG)   aus höchstens einem einzigen Index besteht, so gilt insbesondere:
iI|GciA||Gci|wimaxiIwi.

Direkte Herleitung der klassischen LYM-Ungleichung aus der verallgemeinerten LYM-Ungleichung

Die verallgemeinerte LYM-Ungleichung umfasst eine Anzahl von Ungleichungen der Spernertheorie und insbesondere auch die klassische Lubell-Yamamoto-Meshalkin-Ungleichung und .[2]

Zur Herleitung der klassischen LYM-Ungleichung aus der verallgemeinerten LYM-Ungleichung betrachtet man irgend eine endliche Menge   M   . Ohne Beschränkung der Allgemeinheit kann angenommen werden, dass   M={1,,n}   für   n   ist.

Man wendet die verallgemeinerte LYM-Ungleichung an für den Fall, dass

S=2M

und

G=Aut(2M)=SM

und dann noch

I={0,1,,n}

ist .

Hierbei wird, wie oben dargelegt, die Automorphismengruppe Aut(2M) mit der symmetrischen Gruppe SM identifiziert.

Wie oben erwähnt, hat man als Operation

SM×2M2M

dabei

(g,X)gX=g(X)(gSM,xM)

vorliegen.

Man legt nun für das obige   A   eine Antikette der Potenzmenge   2M   zugrunde, also ein Mengensystem   𝒜   von Teilmengen von M, welches so beschaffen ist, dass von diesen Teilmengen keine zwei verschiedene einander umfassen.

Bedeutsam ist nun, dass man stets folgende Kette von Teilmengen innerhalb   S=2M   hat:

C0=

sowie für   i=1,,n

Ci={1,,i}   .

Damit hat man für   i=0,,n:

|SMCi|=|(Mi)|=(ni)

und zudem

SMCi𝒜=(Mi)𝒜={X𝒜:|X|=i}   .

Weiter von Bedeutung ist die Klärung der Frage, wie groß für eine Permutation   g   das ihr zugehörige   Ig   sein kann. Dies ist jedoch unmittelbar einsichtig:

Denn da   𝒜   Antikette ist, kann es niemals vorkommen, dass für zwei unterschiedliche   i,j   - etwa   i<j   -   g(Ci),g(Cj)𝒜   gilt, weil nämlich die Inklusion   CiCj   stets die Inklusion   g(Ci)g(Cj)   nach sich zieht (und umgekehrt).

Das heißt jedoch, dass für   gSM   durchgängig

|Ig|1

gilt!

Bezeichnet man nun noch für   i=0,,n   mit   ai   die Anzahl der in   𝒜   vorkommenden Mengen, welche aus exakt   i   Elementen bestehen, so hat man:

ai=|SMCi𝒜|   .

Legt man dann noch die konstante Zahlenfamilie

w0=w1==wn=1  

zugrunde, so folgt aus dem Korollar unmittelbar die LYM-Ungleichung.

Weitere Anwendung: Ein allgemeiner Charakterisierungssatz zur LYM-Eigenschaft

Die oben dargestellte Verallgemeinerung der LYM-Ungleichung kann verstanden werden als ein Teilschritt hin zu einer allgemeinen Charakterisierung der LYM-Eigenschaft, welche diese in Zusammenhang bringt mit dem Konzept der Operation von Gruppen auf Mengen.[4][5]

Hierbei betrachtet man eine endliche teilweise geordnete Menge

P

mit der Ordnungsrelation

.

Dabei sei

𝒪={O1,,Ot}2P(|𝒪|=t)

die Menge der verschiedenen Orbits

Aut(P)x={g(x):gAut(P)}(xP),

welche durch die Operation

Aut(P)×PP,(g,x)gx=g(x)

der Automorphismengruppe Aut(P) auf P entstehen.

Weiter sei

𝒞2P

die Menge der Ketten innerhalb P, also die Menge aller Teilmengen von P mit der Eigenschaft, dass für je zwei darin enthaltene Elemente x,y stets die Relation xy oder die Relation yx erfüllt ist.

Schließlich sei

𝒜2P

die Menge der Antiketten innerhalb P, also die Menge aller Teilmengen von P mit der Eigenschaft, dass für je zwei darin enthaltene Elemente x,y niemals die Relation x<y erfüllt ist.[6]

Formulierung des allgemeinen Charakterisierungssatzes

Unter den oben genannten Voraussetzungen gilt:

(A) Jeder der Orbits Oi(i=1,,t) ist eine Antikette von P:
𝒪𝒜 .
(B) Die folgenden vier Bedingungen sind gleichwertig:
(B1)
Für A𝒜 gilt stets
i=1t|OiA||Oi|1.
(B2)
Jeder der Orbits Oi(i=1,,t) ist eine maximale Antikette, wird also von keiner anderen Antikette von P echt umfasst.
(B3)
In P existiert eine Kette, welche zugleich ein Repräsentantensystem der durch die Orbitmenge 𝒪 gegebenen Partition
P=O1˙O2˙˙Ot
darstellt.
(B4)
Für jede Funktion w:P, bei der sämtliche Restriktionen wO konstante Funktionen sind, gilt
maxA𝒜w[A]=maxi=1,,tw[Oi].

Beweis des Charakterisierungssatzes

Ad (A)

Die Annahme, es würde für xP und gAut(P)

(1) x<g(x)[7]

gelten, führt mittels Iteration zu der Ungleichungskette

(2) x<g(x)<g2(x)<g3(x)<<gn(x)<gn+1(x)< (n) .

Da P endlich ist, jede solche Kette jedoch unendlich, kann (2) nicht gelten und damit ebenso wenig (1).

Folglich ist jeder Aut(P)-Orbit eine Antikette von P .[8]

Ad (B)

Der Beweis wird in einem Ringschluss geführt. Dazu sei I={1,,t} .

(B1) → (B2)

Wenn eine Teilmenge XP einen Orbit Oh echt umfasst, so gilt

(3) XOh˙{y}

für mindestens ein yOj zu einem Orbit OjOh .

Also folgt

(4) i=1t|OiX||Oi||Oh||Oh|+1|Oj|1+1|Oj|>1.

Durch (4) ist die Ungleichung von (B1) verletzt, weswegen im Falle der Gültigkeit von (B1) keine solches XP noch Antikette von P sein kann.

(B2) → (B3)
Schritt 1

Man definiert zunächst eine Hilfsfunktion Γ, die sich infolge der Tatsache ergibt, dass beliebiges xP stets mindestens ein C𝒞  

- nämlich C={x}   -

existiert, so dass

(4) xC,max(C)=x

erfüllt ist.[9]

Also ist vermöge

(5) Γ:P;xΓ(x):=max({|C|:C𝒞,xC,max(C)=x})(xP)

eine sinnvoll erklärte Funktion gegeben.[10][11]

Nun ist die Bildmenge Γ(P) eine nichtleere Teilmenge der natürlichen Zahlen und daher kann man ihre Mächtigkeit abschätzen wie folgt:

(6) |Γ(P)|max(Γ(P)).

Gemäß (5) ergibt sich aus (6) sofort

(7) |Γ(P)|max({|C|:C𝒞}) .

An dieser Stelle ist die wesentliche Tatsache zu berücksichtigten, dass eine Kette und eine Antikette von P stets allerhöchstens ein einziges Element gemeinsam haben.

Deswegen ist vermöge (A) für C𝒞 stets die Abschätzung

(8) |OiC|1(iI)

gegeben.

Da andererseits die Orbits eine Partition von P bilden, zieht (8) durchgängig die wichtige Beziehung

(9) |C|=i=1t|OiC|t(C𝒞)

nach sich.

Verbindet man (7) und (9), so hat man die Ungleichungskette

(10) |Γ(P)|max({|C|:C𝒞})t .
Schritt 2

Es genügt zum Schluss auf (B3) zu zeigen, dass bei Voraussetzung von (B2) stets die Identität

(11) |Γ(P)|=t

besteht.

Denn:

Aus (11) ergibt sich dann in Verbindung mit (10) zunächst

(12) maxC𝒞|C|=t.

D mit P auch 𝒞endlich ist , zieht (12) in Verbindung nach sich, dass für mindestens ein C𝒞 in (9) und dann auch in (8) das Gleichheitszeichen gilt.

Das aber heißt:

Es gibt in P eine Kette, welche zugleich ein Repräsentantensystem für die Orbitmenge 𝒪 darstellt.

Schritt 3

Zur Vollendung des Beweises von (B2) → (B3) bleibt also die Identität (11) zu zeigen.

Dazu sei

(13) n0Γ(P) und Pn0={xP:Γ(x)=n0} .

Pn0 ist offenbar eine Antikette von P und zudem nicht die leere Menge.

Man wählt nun irgendein pPn0 .

Jetzt wird bedeutsam, dass jedes gAut(P) und ebenso die zugehörige inverse Abbildung g1 die Ordnungsstruktur von P streng erhalten.

Das bedeutet:

Es entsprechen unter g diejenigen Ketten, in denen p das Maximum ist, umkehrbar eindeutig denjenigen Ketten, in denen g(p) das Maximum ist.

Dies zieht die Gleichung

(14) Γ(g(p))=Γ(p)=n(gAut(P))

nach sich.

(14) wiederum bedeutet, dass der Orbit, dem p angehört, etwa Oip, ganz in Pn0 enthalten ist:

(15) OipPn0 .

Nun kommt die vorausgesetzte Bedingung (B2) zur Wirkung. Derzufolge kann in (15) nicht die strenge Inklusion gelten.

Man hat also sogar die Identität

(16) Oip=Pn0 .

Ganz gleichartige Überlegungen lassen sich jedoch für alle nΓ(P) anstellen. Folglich gilt insgesamt

(17) {Pn:nΓ(P)}𝒪 .

Nun ist auch {Pn:nΓ(P)} eine Partition von P und zwei Partitionen einer Menge können einander niemals echt umfassen.

Daher verschärft sich (17) zu der Identität

(18) {Pn:nΓ(P)}=𝒪 .

Mit (18) jedoch gilt dann auch die Identität

(19) |Γ(P)|=|{Pn:nΓ(P)}|=|𝒪| .

Die Identität (19) wiederum impliziert die Identität (11) und diese war zu zeigen.

(B3) → (B4)

Es sei w eine reellwertige Funktion, bei der sämtliche Restriktionen wO konstante Funktionen sind. Für ein solches w ist zum Nachweis der Identität (B4) in zwei Schritten zu beweisen, dass dort sowohl von links nach rechts als auch von rechts nach links die entsprechenden Ungleichungen gelten.

Schritt 1

Der erste Schritt ist sehr einfach. Denn es gilt (A) und daher ist selbstverständlich

(20) maxA𝒜w[A]maxiIw[Oi] .
Schritt 2

Also bleibt zum Nachweis von (B4) allein die zu (20) duale Ungleichung herzuleiten.

Dazu sei A eine beliebige Antikette A𝒜. Hierfür ist die Ungleichung

(21) w[A]maxiIw[Oi]

zu zeigen.

Dies geschieht durch Anwendung des Korollars zur verallgemeinerten LYM-Ungleichung.

Dazu wird zunächst einbezogen, dass gemäß Voraussetzung in P eine Kette

(22) C={c1,,ct}mit{ci}=OiC(iI)

enthalten ist.

Es ist damit für iI stets

(23) Oi=Aut(P)ci

gültig und daher für jedes xOi aufgrund der Beschaffenheit von w in Verbindung mit (22) und (23) durchgängig

(24) w(x)=w(ci)=w[Oi]|Aut(P)ci|.

Wegen der Partitionseigenschaften von 𝒪 folgt nun aus (24) sogleich

(25) w[A]=iIw[OiA]=iI|Aut(P)ciA|w(ci)=iI|Aut(P)ciA||Aut(P)ci|w[Oi] .

An dieser Stelle ist zu berücksichtigen, dass für jeden Automorphismus gAut(P) mit C auch stets g(C) eine Kette von P ist.

Folglich gilt wegen der Antiketteneigenschaft von A stets

(26) |g(C)A|1 .

Es kann also immer nur höchstens einen einzigen Index iI geben mit g(ci)A.

Somit folgt schließlich aus (25) und (26) durch Anwendung des Korollars zur verallgemeinerten LYM-Ungleichung die Ungleichung (21) und damit (B4).

(B4) → (B1)

Vermöge

(27) v:P;x v(x):=1|{g(x):gAut(P)}|(xP)

ist eine reelwertige Funktion auf P erklärt, welche die in (B4) genannte Eigenschaft hat.

Denn es ist offenbar für iI und xOi durchgängig

(28) v(x):=1|Oi| .

Folglich ist für iI stets

(29) v[Oi]=|Oi|1|Oi|=1.

Damit aber erhält man unter der Voraussetzung von (B4) für jede Antikette A𝒜

(30) i=1t|OiA||Oi|=iI|OiA|1|Oi|=iIv[OiA]=v[A]maxiIv[Oi]=1 .

Mit (30) jedoch hat man (B1) .

Nachbetrachtung und Beispiele

Aus dem allgemeine Charakterisierungssatz lässt sich ablesen, wie die LYM-Eigenschaft aus einem gruppentheoretischen Gesichtswinkel gedeutet werden kann. Sie bedeutet, wie man insbesondere an (B2) und (B3) abliest, dass die Automorhismengruppe P in besonders einfacher Art und Weise auf P operiert.

An (B4) - mit w(x)=1(xP) - wiederum sieht man, dass für ein solches P stets das Analogon zum Satz von Sperner gilt:[12]

Herausragende Beispiele solcher P sind neben den endlichen Potenzmengen vor allem folgende:[13]

  • die endlichen Ketten
  • die endlichen Antiketten
  • die Unterraumverbände endlichdimensionaler Vektorräume über endlichen Körpern

Quellen und Hintergrundliteratur

  • Vorlage:Literatur MR0892525
  • Vorlage:Literatur MR1429390
  • D. Lubell: A short proof of Sperner's lemma. Journal of Combinatorial Theory, Vol. 1, 2 (1966): 299. Vorlage:DOI, MR0194348
  • L.D. Meshalkin: Generalization of Sperner's theorem on the number of subsets of a finite set. Theory of Probability and its Applications, Vol. 8, 2 (1963): 203–204. Vorlage:DOI, MR0150049
  • Vorlage:Literatur [1]
  • Hans-Josef Scholz: Über die Kombinatorik der endlichen Potenzmengen im Zusammenhang mit dem Satz von Sperner. Dissertation, Universität Düsseldorf (1987).
  • Emanuel Sperner: Ein Satz über Untermengen einer endlichen Menge. Math. Z. 27 (1928): 544–548. MR1544925
  • Koichi Yamamoto: Logarithmic order of free distributive lattice. Journal of the Mathematical Society of Japan, Vol. 6 (1954): 343–353. MR0067086.

Einzelnachweise und Fußnoten

  1. Die Ungleichung wird so bezeichnet, da in den Arbeiten von Lubell (1966), Yamamoto (1954) und Meshalkin (1963) zum ersten Mal - soweit bekannt - der Satz von Sperner auf sie zurückgeführt wurde. In der englischsprachigen Fachliteratur bezeichnet man sie entsprechend als LYM inequality.
  2. 2,0 2,1 Hans-Josef Scholz: Über die Kombinatorik .... 1987, S. 30 ff.
  3. Hier ist zu beachten, dass man in der Kombinatorik bei endlichen Mengen E und einer darauf definierten reellwertigen Funktion v oft abkürzend v[E] schreibt oder auch v(E) oder Ähnliches, wenn man die Summe eEv(e) meint. Hier wird die erstgenannte Abkürzung benutzt und nicht die zweitgenannte, um Konfusionen mit der Bildmengenbezeichnung zu vermeiden.
  4. Hans-Josef Scholz: Über die Kombinatorik .... 1987, S. 11 ff, S. 30 ff.
  5. Ein anderer (jedoch in vielfacher Weise verwandter) Weg, die LYM-Eigenschaft in einem allgemeinen Rahmen zu studieren, wird in der Theorie der teilweise geordneten Mengen mit Rangfunktion (engl. ranked posets) durchgeführt. Diese inzwischen sehr umfassend entwickelte Theorie ist ausführlich in den Monographien von Ian Anderson (Combinatorics of Finite Sets, Oxford 1987) und Konrad Engel (Sperner Theory, Cambridge 1997) dargestellt.
  6. Wie üblich schreibt man für bei zwei Elemente x<y für die verknüpfte Relation xyxy .
  7. In diesem Teil zum allgemeinen Charakterisierungssatz beginnen die Randziffern für die einzelnen Beweisschritte neu mit (1) .
  8. Dieser einfache Beweis stammt von Egbert Harzheim.
  9. In jeder endlichen Kette gibt es stets das eindeutig bestimmte Maximum, welches in der gegebenen Ordnung mit jedem anderen Element der Kette vergleichbar und dabei niemals < als ein solches ist.
  10. Das hintere Maximum wird innerhalb der natürlichen Zahlen gebildet. Anschaulich gesprochen handelt es sich um die Mächtigkeit einer längsten Kette, die in x endet. Dass eine solche längste Kette stets existiert, ergibt sich aus der Endlichkeit von P.
  11. In Kombinatorik und Ordnungstheorie wird die Funktion Γ1 - meist unter Voraussetzung gewisser Regularitätsannahmen - manchmal auch als Höhenfunktion oder Rangfunktion bezeichnet.
  12. Hans-Josef Scholz: Über die Kombinatorik .... 1987, S. 16
  13. Hans-Josef Scholz: Über die Kombinatorik .... 1987, S. 15-16