almacenamiento y estructura de archivos

24
 ALMACENAMIENTO Y ALMACE NAMIENTO Y ESTRUCTURA DE ESTRUCTURA DE ARCHIVOS ARCHIVOS  Jeisson Ariza Arboleda  Jonathan Méndez Universidad Distrital Francisco José de Caldas Bases de Datos II

Upload: daniel-martinez

Post on 06-Oct-2015

14 views

Category:

Documents


0 download

DESCRIPTION

estructura de archivos-capa fisica

TRANSCRIPT

  • ALMACENAMIENTO Y ESTRUCTURA DE ARCHIVOSJeisson Ariza ArboledaJonathan Mndez

    Universidad Distrital Francisco Jos de CaldasBases de Datos II

  • Medios Fsicos de AlmacenamientoCach Memoria PrincipalMemoria flashDiscos MagnticosAlmacenamiento ptico Almacenamiento en cinta

  • Imagen 1.Jerarqua de los dispositivos de almacenamiento

  • Discos MagnticosCaractersticas

  • Rendimiento

    Tiempo accesoTiempo bsquedaVelocidad transferenciaTiempo medio de fallos

  • Optimizacin del acceso a los bloques del disco

    Planificacin Organizacin de archivosRAM no voltil

  • RAID

    RAIDs - Redundant Array of Independent Disks

    Tener un gran nmero de discos en un sistema presenta oportunidades para mejorar la velocidad a la que se pueden leer o escribir los datos si los discos funcionan en paralelo.

    Los sistemas RAID se usan por su mayor fiabilidad y por su mayor velocidad de transferencia de datos, ms que por motivos econmicos.

    *

  • Mejora de Fiabilidad Mediante RedundanciaLa solucin al problema de la fiabilidad es introducir la redundancia.El enfoque ms sencillo (pero el ms costoso) para la introduccin de la redundancia es duplicar todos los discos.Fallos De Suministro Elctrico: son un problema si se est realizando alguna transferencia de datos al disco cuando tienen lugar.

    1, Se guarda informacin adicional que normalmente no se necesita pero que puede utilizarse en caso de fallo de un disco para reconstruir la informacin perdida.

    2. Un disco lgico consiste, por tanto, en dos discos fsicos y cada proceso de escritura se lleva a cabo en ambos discos.

    3. La solucin a este problema es escribir una copia en primer lugar y luego la otra, de modo que siempre sea consistente una de las copias.*

  • Mejora de Rendimiento Mediante ParalelismoCon la creacin de imgenes de los discos la velocidad a la que las solicitudes de lectura pueden procesarse se duplica.Equilibrar la carga de varios accesos de pequeo tamao (accesos a bloque) de manera que la productividad de ese tipo de accesos aumente.Convertir en paralelos los accesos de gran tamao para que su tiempo de respuesta se reduzca.

    1. En su forma ms sencilla la distribucin de datos consiste en dividir los bits de cada byte entre varios discos; esta distribucin se denomina distribucin en el nivel de bit.*

  • Niveles de RAID

    0 - Disposiciones de discos con distribucin en el nivel de bloque pero sin redundancia.1 - Creacin de imgenes del disco con distribucin de bloques.2 - Organizacin de cdigos de correccin de errores tipo memoria. Si uno de los bits del byte se deteriora (un uno se transforma en cero o viceversa) la paridad del byte se modifica y, por tanto, no coincidir con la paridad guardada.3 - Pueden detectar si un sector se ha ledo correctamente. Permite un menor nmero de operaciones de E/S por segundo.4 - Si uno de los discos falla puede utilizarse el bloque de paridad con los bloques correspondientes de los dems discos para restaurar los bloques del disco averiado.5 Divide los datos y la paridad entre los N + 1 discos en vez de guardar los datos en N discos y la paridad en uno.6 - Esquema de redundancia P+Q. Guarda informacin redundante adicional para proteccin contra fallos de disco mltiples.*

  • ALMACENAMIENTO TERCIARIOEn un sistema de bases de datos de gran tamao puede que parte de los datos tenga que residir en almacenamiento terciario.

    Los dos medios de almacenamiento terciario ms frecuentes son los discos pticos y las cintas magnticas.

  • Discos pticosCD, DVD-5, DVD-9, DVD-10, DVD-18.

    Ms lentas que las unidades magnticas (Velocidad de Transferencia).

    La velocidad de transferencia de las unidades pticas se caracteriza por n.

    CD (640 Mb), DVD-5 (4,7 GB), DVD-9 (8,5 GB), DVD-10 (9,4 GB), DVD-18 (17 GB).El dispositivo de cabezas es mucho ms pesado. CD 3 y 6 MB por segundo. DVD 8 y 15 MB por segundo.

    *

  • Cintas MagnticasLentas en comparacin con los discos magnticos y pticos.Se utilizan principalmente para copias de seguridad, para el almacenamiento de la informacin poco utilizada y como medio sin conexin para transferir informacin de un sistema a otro.Distintos Formatos segn la capacidad.

    Las cintas tambin se usan para almacenar grandes volmenes de datos, tales como datos vdeo o de imagen que, o no es necesario acceder rpidamente a ell

    Pocos GB DAT [Digital Audio Tape, cinta de audio digital]), 10 a 40 gigabytes (con el formato DLT [Digital LinearTape, cinta lineal digital]), 100 gigabytes y an ms (con el formato Ultrium), hasta 330 gigabytes (con los formatos de cinta de exploracin helicoidal de Ampex).os.*

  • ACCESO AL ALMACENAMIENTOUno de los principales objetivos del sistema de bases de datos es minimizar el nmero de transferencias de bloques entre el disco y la memoria.La memoria intermedia (buffer) es la parte de la memoria principal disponible para el almacenamiento de las copias de los bloques del disco.

    Unidades de almacenamiento de longitud constante denominadas bloques.Una manera de reducir el nmero de accesos al disco es mantener en la memoria principal todos los bloques que sea posible*

  • Gestor de la Memoria IntermediaRecibe solicitudes cuando se necesita un bloque del disco.

    Las acciones internas del gestor de la memoria intermedia resultan transparentes para los programas que formulan solicitudes de bloques de disco. Si se est familiarizado con los conceptos de los

    Slo se vuelve a escribir en el disco el bloque que se descarta si se modific desde la ltima vez que se escribi en el disco*

  • Gestor de la Memoria IntermediaEstrategia de Sustitucin: Eliminar un bloque de la M.I. antes de que se pueda escribir en l otro nuevo.Bloques Clavados: Limitar las ocasiones en que se puede volver a escribir el bloque en el disco.Salida Forzada de Bloques: escribir el bloque en el disco, aunque no se necesite el espacio de memoria intermedia que ocupa.

    Se vuelve a escribir en el disco y se elimina de la memoria intermedia el bloque al que se ha hecho referencia menos recientemente.

    Un bloque al que no se le permite que se vuelva a escribir en el disco est clavado.

    *

  • Organizacin de los archivosLongitud fija

  • Longitud variable

    Almacenamiento de varios tipos de registros en un

    mismo archivoTipos de registro que permiten longitudes variables

    para uno o varios de los camposTipos de registro que permiten campos repetidos

  • Representacin en cadena de bytes

    Estructura de pginas con ranuras

  • ORGANIZACIN DE LOS REGISTROS EN ARCHIVOSOrganizacin en Montculo: Se puede colocar cualquier registro en cualquier parte del archivo en que haya espacio suficiente.Archivos Secuenciales: Se guardan en orden secuencial, basado en el valor de la clave de bsqueda de cada registro.Asociativa (Hash): Se calcula una funcin de asociacin (hash) de algn atributo de cada registro.

    Generalmente slo hay un archivo por cada relacin.

    *

  • Organizacin de archivos secuencialesEstn diseados para el procesamiento eficiente de los registros de acuerdo con un orden basado en una clave de bsqueda.

    Una clave de bsqueda (Nombre Sucursal) es cualquier atributo o conjunto de atributos. Los registros se vinculan mediante punteros.

    El puntero de cada registro apunta al siguiente registro segn el orden indicado por la clave de bsqueda.

    Problema: Resulta difcil mantener el orden fsico secuencial cuando se insertan y borran registros, dado que resulta costoso desplazar muchos registros como consecuencia de una sola insercin o borrado*

  • ALMACENAMIENTO CON DICCIONARIOS DE DATOSLos nombres de las relacionesLos nombres de los atributos de cada relacinLos dominios y las longitudes de los atributosLos nombres de las vistas definidas en la base de

    datos y las definiciones de esas vistasLas restricciones de integridad (por ejemplo, las

    restricciones de las claves)

    Adems, muchos sistemas guardan los datos siguientesde los usuarios del sistema:Los nombres de los usuarios autorizadosLa informacin de las cuentas de usuariosContraseas u otra informacin usada para autenticar

    a los usuarios

    Adems, se puede guardar informacin estadstica y descriptiva sobre estos asuntos:Nmero de tuplas de cada relacinMtodo de almacenamiento utilizado para cada relacin (por ejemplo, con agrupaciones o sin agrupaciones)

  • Gracias!

  • BibliografaSilberschatz A., Korth H., Sudarshan S,. (2011), Database System Concepts, 6th Ed., New York, Mc Graw Hill (PDF)Silberschatz A., Korth H., Sudarshan S,. (2002), Fundamentos de bases de datos, 4ta Ed., Espaa, Mc Graw Hill (PDF)

    *1, Se guarda informacin adicional que normalmente no se necesita pero que puede utilizarse en caso de fallo de un disco para reconstruir la informacin perdida.

    2. Un disco lgico consiste, por tanto, en dos discos fsicos y cada proceso de escritura se lleva a cabo en ambos discos.

    3. La solucin a este problema es escribir una copia en primer lugar y luego la otra, de modo que siempre sea consistente una de las copias.*1. En su forma ms sencilla la distribucin de datos consiste en dividir los bits de cada byte entre varios discos; esta distribucin se denomina distribucin en el nivel de bit.*0 - Disposiciones de discos con distribucin en el nivel de bloque pero sin redundancia.1 - Creacin de imgenes del disco con distribucin de bloques.2 - Organizacin de cdigos de correccin de errores tipo memoria. Si uno de los bits del byte se deteriora (un uno se transforma en cero o viceversa) la paridad del byte se modifica y, por tanto, no coincidir con la paridad guardada.3 - Pueden detectar si un sector se ha ledo correctamente. Permite un menor nmero de operaciones de E/S por segundo.4 - Si uno de los discos falla puede utilizarse el bloque de paridad con los bloques correspondientes de los dems discos para restaurar los bloques del disco averiado.5 Divide los datos y la paridad entre los N + 1 discos en vez de guardar los datos en N discos y la paridad en uno.6 - Esquema de redundancia P+Q. Guarda informacin redundante adicional para proteccin contra fallos de disco mltiples.*CD (640 Mb), DVD-5 (4,7 GB), DVD-9 (8,5 GB), DVD-10 (9,4 GB), DVD-18 (17 GB).El dispositivo de cabezas es mucho ms pesado. CD 3 y 6 MB por segundo. DVD 8 y 15 MB por segundo.

    *Las cintas tambin se usan para almacenar grandes volmenes de datos, tales como datos vdeo o de imagen que, o no es necesario acceder rpidamente a ell

    Pocos GB DAT [Digital Audio Tape, cinta de audio digital]), 10 a 40 gigabytes (con el formato DLT [Digital LinearTape, cinta lineal digital]), 100 gigabytes y an ms (con el formato Ultrium), hasta 330 gigabytes (con los formatos de cinta de exploracin helicoidal de Ampex).os.*Unidades de almacenamiento de longitud constante denominadas bloques.Una manera de reducir el nmero de accesos al disco es mantener en la memoria principal todos los bloques que sea posible*Slo se vuelve a escribir en el disco el bloque que se descarta si se modific desde la ltima vez que se escribi en el disco*Se vuelve a escribir en el disco y se elimina de la memoria intermedia el bloque al que se ha hecho referencia menos recientemente.

    Un bloque al que no se le permite que se vuelva a escribir en el disco est clavado.

    *Generalmente slo hay un archivo por cada relacin.

    *Una clave de bsqueda (Nombre Sucursal) es cualquier atributo o conjunto de atributos. Los registros se vinculan mediante punteros.

    El puntero de cada registro apunta al siguiente registro segn el orden indicado por la clave de bsqueda.

    Problema: Resulta difcil mantener el orden fsico secuencial cuando se insertan y borran registros, dado que resulta costoso desplazar muchos registros como consecuencia de una sola insercin o borrado*