fh-hof der r-baum richard göbel. fh-hof verallgemeinerte suchanfragen form der suchanfrage a l1...

Download FH-Hof Der R-Baum Richard Göbel. FH-Hof Verallgemeinerte Suchanfragen Form der Suchanfrage a l1 column 1 a u1 AND a l2 column 2 a u2... ANDa ld column

Post on 05-Apr-2015

104 views

Category:

Documents

0 download

Embed Size (px)

TRANSCRIPT

  • Folie 1
  • FH-Hof Der R-Baum Richard Gbel
  • Folie 2
  • FH-Hof Verallgemeinerte Suchanfragen Form der Suchanfrage a l1 column 1 a u1 AND a l2 column 2 a u2... ANDa ld column d a ud Werte der relevanten Spalten sind total geordnet (praktisch immer der Fall) Weitere Analyse ausschlielich mit Zahlen (o.B.d.A)
  • Folie 3
  • FH-Hof Eintrge als Punkte im mehrdimensionalen Raum
  • Folie 4
  • FH-Hof Suchbereich im mehrdimensionalen Raum 2 X 4 AND 2 Y 3
  • Folie 5
  • FH-Hof Grundlagen einer Indexstruktur Form der Suchregion Rechteck fr zwei Dimensionen Quader fr drei Dimensionen Hyperquader fr vier oder mehr Dimensionen Knoten der Indexstruktur reprsentieren ebenfalls Regionen im mehrdimensionalen Raum Die Region eines Knoten enthlt die Regionen aller Kinder Verwendung kompatibler Regionen fr die Knoten der Indexstruktur (Hyperquader)
  • Folie 6
  • FH-Hof Beispiel fr einen zweidimensionale Index X Y
  • Folie 7
  • FH-Hof Basis fr ein Suchverfahren Start an der Wurzel der Indexstruktur Suche an Kinderknoten fortsetzen deren Region sich mit der Suchregion berlappt Ausgehend von den Blattknoten wird die Suchbedingung fr die Eintrge berprft
  • Folie 8
  • FH-Hof Wann berlappen sich zwei Regionen? Region a: a l1 c 1 a u1... a ld c d a ud Region b: a l1 c 1 a u1... a ld c d a ud Notwendige und hinreichende Bedingung fr die berlappung: Jede Untergrenzen der Dimension einer Region muss kleiner oder gleich der Obergrenze der zugehrigen Dimension der anderen Region sein. a l1 b u1 b l1 a u1... a ld b ud b ld a ud
  • Folie 9
  • FH-Hof R-Baum A. Guttman 1984: "R-Trees: A Dynamic Index Structure for Spatial Searching, Proc. ACM SIGMOD Conference, Boston, pages 47 - 57, 1984 Viele Verbesserungen und Erweiterungen, z.B.: 1987: Sellis, Roussopoulos, Faloutsos: R + -Tree 1990: Beckmann, Kriegel, Schneider, Seeger: R*-tree 1996: Berchtold, Keim, Kriegel: X-Tree: 1997: Leutenegger, Edgington, Lopez: STR Tree Packing Verschiedene Implementierungen in Datenbanksystemen in den letzten 10 Jahren
  • Folie 10
  • FH-Hof Eigenschaften des R-Baums Baum mit Verzweigungsgrad grer als 2 Knoten des Baumes werden Blcken der Festplatte zugeordnet Der R-Baum ist vollstndig balanciert Algorithmen fr das Einfgen und Lschen sind hnlich wie beim B-Baum Suchverfahren entspricht dem allgemeinen Suchansatz
  • Folie 11
  • FH-Hof Einfgen eines Punktes Bestimme mit Hilfe des Suchverfahrens ein Blattknoten fr den neuen Punkt. Falls verschiedene Pfade existieren (aufgrund von berlappungen) dann whle einen Pfad aus. Falls kein passender Nachfolger bei der Suche gefunden wird: Vergrere den Hyperquader fr den Nachfolger fr den die Vergrerung minimal ist. Falls ein Blattknoten nicht mehr ausreichend Kapazitt enthlt: Spalte den Knoten und ggf. Elternknoten auf.
  • Folie 12
  • FH-Hof Lschen eines Punktes Bestimme mit Hilfe des Suchverfahrens alle Blattknoten fr den zu lschenden Punkt Lsche den Punkt aus einem Blattknoten. Verkleinere bei Bedarf alle Hyperquader auf dem Pfad zu dem betroffenen Blattknoten. Unterschreitet der Blattknoten die minimale Anzahl von Elementen, dann lsche diesen Blattknoten: verteile die Eintrge auf Geschwisterknoten oder fge die betroffenen Punkte neu ein
  • Folie 13
  • FH-Hof Optionen fr die Implementierung Auswahl eines Pfades fr das Einfgen Aufteilen eines Knotens Verteilen der Eintrge fr das Lschen eines Knotens Reorganisation eines Baums?
  • Folie 14
  • FH-Hof Kriterien fr die Optimierung eines R-Baums berlappungen: Anzahl der berlappungen minimieren Volumen der berlappungen minimieren Volumen der Knoten minimieren Abweichungen der Hyperquader von Hyperwrfeln minimieren (gleiche Ausdehnung aller Dimensionen)
  • Folie 15
  • FH-Hof Lineares Verfahren zum Aufspalten eines Knotens nach Ang und Tan Aufspaltung erfolgt bezglich einer Dimension Zunchst wird die Aufteilung fr jede Dimension getestet Whle die gnstigste Dimension: Differenz der Anzahl von Elementen in den beiden neuen Knoten ist klein (Prioritt 1) berlappung zwischen den beiden neuen Knoten ist gering (Prioritt 2) Volumen der neuen Knoten ist gering (Prioritt 3)
  • Folie 16
  • FH-Hof Beispiel fr das Verfahren nach Ang und Tan - Teil 1
  • Folie 17
  • FH-Hof Beispiel fr das Verfahren nach Ang und Tan - Teil 2
  • Folie 18
  • FH-Hof Beispiel fr das Verfahren nach Ang und Tan - Teil 3
  • Folie 19
  • FH-Hof Beispiel fr das Verfahren nach Ang und Tan - Teil 4
  • Folie 20
  • FH-Hof Erweiterung der R-Baums fr Regionen In den Baum werden statt Punkte vollstndige Hyperquader eingefgt Anpassung der Verfahren offensichtlich Interessant fr rumlich ausgedehnte Daten Statt 2d Dimensionen werden nur d Dimensionen bentigt
  • Folie 21
  • FH-Hof Erzeugung eines optimalen R-Baums Analyse einer festen Datenmenge Erzeugung eines R-Baums fr diese Datenmenge Optimierung bezglich eines vorher festgelegtem Kriteriums Typen von Verfahren: Bottom-Up Top-Down
  • Folie 22
  • FH-Hof Bottom-Up-Verfahren Ordne die einzelnen Punkte den Blttern eines R- Baums zu Erzeuge aus den Blttern schrittweise die weiteren Knoten der Indexstruktur Zuordnung von Punkten zu Blttern: ber Sortierfunktion (Interleaving, Hilbertkurve, etc.) Sort Tile Recursive
  • Folie 23
  • FH-Hof Beispiel: Zuordnung ber 2D-Hilbertkurve
  • Folie 24
  • FH-Hof Sort Tile Recursive - Ansatz Idee: Teile jede Dimension in etwa gleich viele Teile auf (Gitterstruktur) Beispiel: Teile eine zweidimensionale Struktur zunchst in (n/v) Segmente auf (v: Kapazitt) Sortiere die Eintrge bezglich der ersten Dimension und verteile die Eintrge auf die Segmente Teile entsprechend jedes Segment in (n/v) Blattknoten auf (Sortierung bezglich der zweiten Dimension)
  • Folie 25
  • FH-Hof Sort Tile Recursive - Beispiel

Recommended

View more >