peer-to-peer-netzwerke - fau · 2007. 6. 28. · peer-to-peer-netzwerke 11 die zipf-verteilung als...
TRANSCRIPT
![Page 1: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten](https://reader035.vdocuments.net/reader035/viewer/2022070216/611d2f8dfea0ce5b5947ee09/html5/thumbnails/1.jpg)
Peer-to-Peer-Netzwerke
PeerPeer--toto--PeerPeer--NetzwerkeNetzwerkeRolf WankaRolf Wanka
Sommersemester 2007Sommersemester 20079. Vorlesung9. Vorlesung26.06.200726.06.2007
[email protected]@cs.fau.de
basiert auf einer Vorlesung vonbasiert auf einer Vorlesung vonChristian SchindelhauerChristian Schindelhauer
an der Uni Freiburgan der Uni Freiburg
![Page 2: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten](https://reader035.vdocuments.net/reader035/viewer/2022070216/611d2f8dfea0ce5b5947ee09/html5/thumbnails/2.jpg)
Peer-to-Peer-Netzwerke
2
InhalteInhalte• Kurze Geschichte der Peer-to-Peer-
Netzwerke• Das Internet: Unter dem Overlay• Die ersten Peer-to-Peer-Netzwerke
– Napster– Gnutella
• CAN• Chord• Pastry und Tapestry• Gradoptimierte Netzwerke
– Viceroy– Distance-Halving– Koorde
• Netzwerke mit geordneterSpeicherung
– P-Grid– Skip-Net und Skip-Graphs
• Selbstorganisation– Pareto-Netzwerke– Zufallsnetzwerke– Topologie-Management
• Sicherheit in Peer-to-Peer-Netzwerken
• Anonymität• Datenzugriff: Der schnellere
Download • Peer-to-Peer-Netzwerke in der
Praxis– eDonkey– FastTrack– Bittorrent
• Peer-to-Peer-Verkehr• Juristische Situation
![Page 3: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten](https://reader035.vdocuments.net/reader035/viewer/2022070216/611d2f8dfea0ce5b5947ee09/html5/thumbnails/3.jpg)
Peer-to-Peer-Netzwerke
3
SelbstorganisationSelbstorganisation in in PeerPeer--toto--PeerPeer--NetzwerkenNetzwerken
I. Die Graphstruktur von GnutellaA. GradB. Durchmesser
II. Selbstorganisation von ZufallsgraphenA. Typen und Eigenschaften von ZufallsgraphenB. Reguläre ungerichtete zusammenhängende ZufallsgraphenC. Reguläre gerichtete zusammenhängende Zufallsgraphen
III. Gesteuerte SelbstorganisationA. Topologie-Management (T-MAN)B. Selbstorganisierendes Chord
![Page 4: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten](https://reader035.vdocuments.net/reader035/viewer/2022070216/611d2f8dfea0ce5b5947ee09/html5/thumbnails/4.jpg)
Peer-to-Peer-Netzwerke
4
II. GnutellaII. GnutellaA. GradA. Grad
• Scalability Issues in Large Peer-to-Peer Networks - A Case Study of Gnutella,�M.A. Jovanovic, F.S. Annexstein, K.A. Berman - University of Cincinnati, 2001
![Page 5: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten](https://reader035.vdocuments.net/reader035/viewer/2022070216/611d2f8dfea0ce5b5947ee09/html5/thumbnails/5.jpg)
Peer-to-Peer-Netzwerke
5
GnutellaGnutella -- Originalversion Originalversion -- AnbindungAnbindung
• Nachbarschaftslisten– Gnutella verbindet direkt mit anderen
Clients– Beim Download wird eine Liste von
Clients mitgeliefert– Diese werden ausprobiert, bis ein
Aktiver sich meldet– Ein aktiver Client gibt dann seine
Nachbarschaftsliste weiter– Nachbarschaftslisten werden immer
weiter verlängert und gespeichert– Die Anzahl aktiver Nachbarn ist
beschränkt (typisch auf fünf)• Die Nachbarschaftslisten sind
abhängig von der jeweils verwendeten Client-Software
![Page 6: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten](https://reader035.vdocuments.net/reader035/viewer/2022070216/611d2f8dfea0ce5b5947ee09/html5/thumbnails/6.jpg)
Peer-to-Peer-Netzwerke
6
VerteilungVerteilung des Grads in Gnutellades Grads in Gnutella
• Modeling Large-scale Peer-to-Peer Networks and a CaseStudy of Gnutella, Mihajlo A. Jovanovic, Master Thesis, 2001
• Die Anzahl der Nachbarn unterliegt einer Pareto-Verteilung(Power Law)
![Page 7: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten](https://reader035.vdocuments.net/reader035/viewer/2022070216/611d2f8dfea0ce5b5947ee09/html5/thumbnails/7.jpg)
Peer-to-Peer-Netzwerke
7
ParetoPareto VerteilungVerteilung
• Diskrete Pareto-Verteilung für x ∈ {1,2,3,…}
mit konstantem Faktor
(auch bekannt als Riemannsche Zeta-Funktion)
• Heavy tail– nicht alle Momente E[Xk] sind definiert– der Erwartungswert existiert nur, wenn α>2– Varianz und E[X2] existieren genau dann, wenn α>3– E[Xk] definiert genau dann, wenn α>k+1
• Dichtefunktion der kontinuierlichen Funktion für x>x0
.
![Page 8: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten](https://reader035.vdocuments.net/reader035/viewer/2022070216/611d2f8dfea0ce5b5947ee09/html5/thumbnails/8.jpg)
Peer-to-Peer-Netzwerke
8
Eingangsgrad und Ausgangsgrad von WebseitenEingangsgrad und Ausgangsgrad von Webseiten
• unterliegen auch einer Pareto-Verteilung
• Experimente von– Kumar et al. 97: 40 Mio. Webpages– Barabasi et al. 99: Domain *.nd.edu (Univ. of Notre Dame) + Web-
Seiten im Abstand 3– Broder et al. 00: 204 Mio. Webseiten (Scan Mai und Okt. 1999)
![Page 9: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten](https://reader035.vdocuments.net/reader035/viewer/2022070216/611d2f8dfea0ce5b5947ee09/html5/thumbnails/9.jpg)
Peer-to-Peer-Netzwerke
9
Zusammenhang von ParetoZusammenhang von Pareto--GraphenGraphen
• William Aiello, Fan Chung, Linyuan Lu, A Random Graph Model for Massive Graphs, STOC 2000
• Ungerichteter Graph mit n Knoten– Die Wahrscheinlichkeit, daß ein Knoten k Nachbarn hat, sei pk
– wobei pk = c k-τ für einen normalisierenden Faktor c.• Theorem
– Für genügend großes n gilt für solche Pareto-Graphen mit Exponenten τ•Für τ < 1 ist der Graph mit Wahrscheinlichkeit 1-o(1) zusammenhängend•Für τ > 1 sind die Graphen mit W’keit 1-o(1) nicht zusammenhängend•Für 1< τ <2 gibt es eine Zusammenhangskomponente der Größe Θ(n)•Für 2< τ <3.4785 gibt es eine Zusammenhangskomponente der Größe Θ(n) und sonst nur kleinere der Größe O(log n)
•Für τ >3.4785: Es gibt mit Wahrscheinlichkeit 1-o(1) keine große Zusammenhangskomponente der Größe Θ(n)
•Für τ >4: Alle Zusammenhangskomponenten gehorchen einer Pareto-Verteilung
![Page 10: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten](https://reader035.vdocuments.net/reader035/viewer/2022070216/611d2f8dfea0ce5b5947ee09/html5/thumbnails/10.jpg)
Peer-to-Peer-Netzwerke
10
ParetoPareto--VerteilungVerteilung (I)(I)
• Beispiele für Pareto-Verteilungen (Power Laws)– Pareto 1897: Verteilung des Wohlstands in der Bevölkerung– Yule 1944: Worthäufigkeit in Sprachen– Zipf 1949: Größe von Städten– Länge von Molekülketten– Dateilänge von UNIX-Systemdateien– ….
![Page 11: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten](https://reader035.vdocuments.net/reader035/viewer/2022070216/611d2f8dfea0ce5b5947ee09/html5/thumbnails/11.jpg)
Peer-to-Peer-Netzwerke
11
Die ZipfDie Zipf--Verteilung als VarianteVerteilung als Variante• George Kinsley Zipf behauptete,
– daß die Häufigkeit des n-häufigsten Wortes mit relativer Häufigkeit f(n)– der Gleichung n f(n) = c genügt.
• Zipf-Wahrscheinlichkeitsverteilung for x ∈ {1,2,3,…}
mit konstanten Faktor c. Nur definiert für konstante Mengen, da
unbeschränkt ist.
• Zipf-Verteilungen beziehen sich auf den Rang– Der Zipf-Exponent α kann auch größer sein als 1, d.h. f(n) = c/nα
• Pareto-Verteilungen beziehen sich auf die absolute Größe– z.B. Einwohnerzahl
![Page 12: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten](https://reader035.vdocuments.net/reader035/viewer/2022070216/611d2f8dfea0ce5b5947ee09/html5/thumbnails/12.jpg)
Peer-to-Peer-Netzwerke
12
II. GnutellaII. GnutellaB. B. DurchmesserDurchmesser
• Beobachtung: Gnutella• Small-World-Networks• Milgrams Experiment• Preferential Attachment
![Page 13: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten](https://reader035.vdocuments.net/reader035/viewer/2022070216/611d2f8dfea0ce5b5947ee09/html5/thumbnails/13.jpg)
Peer-to-Peer-Netzwerke
13
SmallSmall--WorldWorld--PhänomenPhänomen
• Milgrams Experiment 1967– 60 zufällig ausgewählte Teilnehmer in Wichita, Kansas sollten ein
Paket an eine ihnen unbekannte Adresse versenden– Sie durften aber nur an Bekannte das Paket weiterversenden– Ebenso die Bekannten
• Der Großteil der Pakete kam an und das innerhalb von 6 Schritten
• Small-World-Netzwerke– sind Netzwerke deren Knotengrade Pareto-verteilt ist– mit kleinen Durchmesser– und relativ vielen Cliquen
• Small-World-Netzwerke– Internet, World-Wide-Web, Nervensysteme, soziale Netzwerke, etc.
![Page 14: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten](https://reader035.vdocuments.net/reader035/viewer/2022070216/611d2f8dfea0ce5b5947ee09/html5/thumbnails/14.jpg)
Peer-to-Peer-Netzwerke
14
WieWie entstehenentstehen SmallSmall--WorldWorld--NetzwerkeNetzwerke??
• Emergence of scaling in random networks, Albert-Laszlo Barabasi, Reka Albert, 1999
• Preferential Attachment-Modell (Barabasi-Albert):– Ausgehend von einem (kleinen Startgraphen) werden sukzessive Knoten
eingefügt mit jeweils m Kanten– Die Wahrscheinlichkeit, mit einem Knoten verbunden zu werden, ist
proportional zum aktuellen Grad des Knotens• Ergibt ein Pareto-Netzwerk mit Exponenten 2,9 ± 0,1
– Cliquen treten häufiger auf• Watts-Strogatz (1998)
– Starte mit Ring-Netzwerk mit Verbindungen mit den m nächsten Nachbarn– Mit Wahrscheinlichkeit p wird jede Kante durch eine zufällige Kante ersetzt– Ermöglich einen stufenlosen Übergang von Ordnung zu Chaos
• Aufgegriffen von Kleinberg (1999) zur Verifizierung von MilgramsExperiment
![Page 15: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten](https://reader035.vdocuments.net/reader035/viewer/2022070216/611d2f8dfea0ce5b5947ee09/html5/thumbnails/15.jpg)
Peer-to-Peer-Netzwerke
15
Gnutella Gnutella imim VergleichVergleich
• Modeling Large-scale Peer-to-Peer Networks and a Case Study of Gnutella, Mihajlo A. Jovanovic, Master Thesis, 2001
![Page 16: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten](https://reader035.vdocuments.net/reader035/viewer/2022070216/611d2f8dfea0ce5b5947ee09/html5/thumbnails/16.jpg)
Peer-to-Peer-Netzwerke
16
Gnutella Gnutella im Vergleichim Vergleich
• Modeling Large-scale Peer-to-Peer Networks and a Case Study of Gnutella, Mihajlo A. Jovanovic, Master Thesis, 2001
• Vergleich der charakteristischen Pfadlänge– Durchschnitt der Abstände zwischen zwei Knoten
![Page 17: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten](https://reader035.vdocuments.net/reader035/viewer/2022070216/611d2f8dfea0ce5b5947ee09/html5/thumbnails/17.jpg)
Peer-to-Peer-Netzwerke
17
III. III. ZufallsgraphenZufallsgraphenA. A. TypTyp und und EigenschaftenEigenschaften
• Standardmodell G(n,p)• Zufälliger regulärer ungerichteter Graph• Zufälliger regulärer gerichteter Graph
![Page 18: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten](https://reader035.vdocuments.net/reader035/viewer/2022070216/611d2f8dfea0ce5b5947ee09/html5/thumbnails/18.jpg)
Peer-to-Peer-Netzwerke
18
Ist ein Ist ein ParetoPareto--GraphGraph ein Zufallsgraph?ein Zufallsgraph?
• Zufallsgraph G(n,p)– n Knoten– Jede gerichtete Kante erscheint mit Wahrscheinlichkeit p
• Sei X die Anzahl der Kanten, die von Knoten v ausgehen– Xu =1, falls Kante (v,u) vorkommt, und sonst 0
• Dann ist P[Xu=1]=p und P[Xu=0]=1-p
• Für den durchschnittlichen Grad c gilt dann:
![Page 19: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten](https://reader035.vdocuments.net/reader035/viewer/2022070216/611d2f8dfea0ce5b5947ee09/html5/thumbnails/19.jpg)
Peer-to-Peer-Netzwerke
19
• Chernov-Schranke– Für unabhängige Bernoulli-Variablen Xi und mit
– Daraus folgt für
– Die Häufigkeit nimmt exponentiell ab– Daher entspricht der Grad eines Zufallsgraphens keiner Paretoverteilung
Gradverteilung des ZufallsgraphenGradverteilung des Zufallsgraphen
![Page 20: Peer-to-Peer-Netzwerke - FAU · 2007. 6. 28. · Peer-to-Peer-Netzwerke 11 Die Zipf-Verteilung als Variante • George Kinsley Zipf behauptete, – daß die Häufigkeit des n-häufigsten](https://reader035.vdocuments.net/reader035/viewer/2022070216/611d2f8dfea0ce5b5947ee09/html5/thumbnails/20.jpg)
Peer-to-Peer-Netzwerke
Ende der Ende der 9.9. VorlesungVorlesung
PeerPeer--toto--PeerPeer--NetzwerkeNetzwerke