assessment of long-term forest dynamics in the caribbean database and metadata concepts morning...
TRANSCRIPT
Assessment of Long-Term Forest Dynamics in the Caribbean
Database and Metadata Concepts
Morning• Introduction to the Workshop, Vision and Objectives
• Implementation of the Forest Inventory Program• Database Concepts
Mid-morning • Examples of Caribbean Permanent Plots Afternoon • Examples of Data Analyses • Data Sharing and Regional Synthesis, Working Group Themes• Identifying Forest Research Sites and Plots in the Caribbean;
using Caribbean Foresters website
• Exhibition and Discussion of Country Report Posters
Assessment of Long-Term Forest Dynamics in the Caribbean
Database and Metadata Concepts
• Conceptos básicos sobre bases de datos• Conceptos básicos sobre metadata
http://www.ecoinformatics.org
Créditos y Agradecimientos
Assessment of Long-Term Forest Dynamics in the Caribbean
Database and Metadata Concepts
• ¿Que es una base de datos?• Existen diferentes definiciones, dependiendo del contexto. Para efectos prácticos la
podemos definir:
• Base de datos: - Es una colección de archivos interrelacionados, creados por un
programa especial conocido como “data base management system” (DBMS)
– Estos archivos pueden contener una o mas tablas que guardan datos en una manera estructurada en forma de tablas:
– Es una serie o grupo de tablas• Estas tablas se relacionan entre si• Utiliza un lenguaje de comandos para búsquedas
Assessment of Long-Term Forest Dynamics in the Caribbean
Database and Metadata Concepts
• Las tablas consisten en una serie de columnas (Campos) que representan una característica de un individuo u objeto.
• Cada fila o Registro (colección de campos de iguales o de diferentes tipos) ofrece una descripcion del objeto o individuo.
• La tabla es una colección de registros almacenados siguiendo una estructura homogénea.
Assessment of Long-Term Forest Dynamics in the Caribbean
Database and Metadata Concepts
Fecha Código Altura Diámetro
<solo fechas> <solo texto> <solo nums reales> <solo nums reales>
- Las bases de datos ofrecen un control explicito sobre los tipos de datos (columnas)
Provee• Exactitud• Control de calidad• Desempeño• Facilita el uso
Ejemplo:
Assessment of Long-Term Forest Dynamics in the Caribbean
Database and Metadata Concepts
Fecha Código Altura Diámetro
A
B
C
D
Código
Latitud Longitud Elevación
A
B
C
D
Se establecen relaciones explicitas o implícitas entre las tablas
Existe o se crea una “clave única” o “clave primaria” (primary key) para relacionar las tablas.
Esto permite hacer búsquedas y re-organizar datos de manera rápida y fácil
Assessment of Long-Term Forest Dynamics in the Caribbean
Database and Metadata Concepts
Características de los Datos Ecológicos
Requerimientos de Metadata/Complejidad
Imágenes de Satélite
Volumen de datos(por set de datos)
Baja
Alta
Alta
Datos de Suelos
ProductividadPrimaria
SIG
Datos Poblacionales
Censos de Biodiversidad
Secuencias Genómicas
DatosEmpresariales,Administrativos
EstacionesMeteorológicas La mayoría de los
datos ecológicos
La mayoría de los programas
Assessment of Long-Term Forest Dynamics in the Caribbean
Database and Metadata Concepts
Programas de “Spreadsheets” (como Excel)• Lo bueno
– Son usados comúnmente– Son fácil de aprender– Por lo general están instalados en la mayoría de las computadoras
• Lo no tan bueno– Puede promover malos hábitos de uso, generando datos que no pueden
ser usados fácilmente – No permiten análisis muy complejos– Es difícil “auditarlos”, es decir, ver como se ha cambiado o manipulado los
datos– No facilitan la busqueda efectiva de un subconjunto de los datos
Assessment of Long-Term Forest Dynamics in the Caribbean
Database and Metadata Concepts
• Métodos para diseño efectivo– Dividir los datos en tablas– Determinar el tipo de dato de cada columna– Identificar las relaciones entre las tablas
Assessment of Long-Term Forest Dynamics in the Caribbean
Database and Metadata Concepts
Sitio Piscina Trampa Profundidad Especie Repro Tamaño Colector datos ID
A 1 1 24 ATYA S 15 Karen Hernández 15
A 1 2 12 XIPHO N 22 Karen Hernández 15
A 1 2 33 MACRE N 38 Karen Hernández 15
A 2 3 16 ATYA S 14 Karen Hernández 15
A 2 3 17 ATYA S 19 Karen Hernández 15
Fecha Sitio Colector datos ID
A
B
C
D
Sitio Latitud Longitud Elevación
A
B
C
D
Datos adicionales del sitio de muestreo
Se pueden relacionar en otra tabla
Assessment of Long-Term Forest Dynamics in the Caribbean
Database and Metadata Concepts
Sitio Piscina Trampa Profundidad Especie Repro Tamaño
A 1 1 24 ATYA S 15
A 1 2 12 XIPHO N 22
A 1 2 33 MACRE N 38
A 2 3 16 ATYA S 14
A 2 3 17 ATYA S 19
Fecha Sitio Colector datos ID
15jul2006 A Karen Hernández 28
15jul2006 A Christopher Torres 15
15jul2006 B Karen Hernández 28
16jul2006 C Karen Hernández 28
Código Genero especie
ATYA Atya lanipes
XIPHO Xiphocaris elongata
MACRE Macrobrachium crenulatum
MACOT Macrobrachium otracosii
Datos adicionales de taxonomía
se pueden almacenar en otra tabla
Los datos que se repiten
es mas eficiente que estén en otra tabla
Assessment of Long-Term Forest Dynamics in the Caribbean
Database and Metadata Concepts
• Métodos para diseño efectivo– Dividir los datos en tablas– Determinar el tipo de dato de cada columna– Identificar las relaciones entre las tablas
Assessment of Long-Term Forest Dynamics in the Caribbean
Database and Metadata Concepts
Sitio Piscina Trampa Profundidad Especie Repro Tamaño
A 1 1 24.2 ATYA S 15.1
A 1 2 12.3 XIPHO N 22.3
A 1 2 33.0 MACRE N 38.5
A 2 3 16.3 ATYA S 14.6
A 2 3 17.8 ATYA S 19.2
Datos Numéricos
Integer nums enteros 200
Float nums reales de precisión sencilla (hasta 23 lugares decimales)
3.1415926
Doble precisión doble (hasta 53 lugares decimales)
3.1415926535897932453243853142593435104756237812
Ejemplos de tipos de datos (dependen del programa en uso)
Assessment of Long-Term Forest Dynamics in the Caribbean
Database and Metadata Concepts
Sitio Piscina Trampa Profundidad Especie Repro Tamaño
A 1 1 24 ATYA S 15
A 1 2 12 XIPHO N 22
A 1 2 33 MACRE N 38
Datos de Texto
charchar(n)
carácteres “Plumeria”
varchar(n) Caracteres con un largo variable “heces fecales sin identificar”
text Un pedazo grande de texto Un resumen (abstract)
enum Valores enumerados ‘sur’, ‘oeste’, ’norte’, ‘este’
Set* Un grupo de valores ‘capullo’, ‘flor’, ‘fruto-inmaduro’, ‘fruto-maduro’
Ejemplos de tipos de datos (dependen del programa en uso)
*Set-aquí puede colocarse mas de unode los valores
Assessment of Long-Term Forest Dynamics in the Caribbean
Database and Metadata Concepts
Fechas
DATETIME ‘YYYY-MM-DD HH:MM:SS’ ‘2006-11-28 45:30:15’
DATE ‘YYYY-MM-DD’ ‘2006-11-28’
TIMESTAMP Segundos que han pasado desde t0 38
TIME ‘HH:MM:SS’ ’45:30:15’
YEAR ‘YYYY’ 2006
Ejemplos de tipos de datos (dependen del programa en uso)
Fecha Sitio Colector datos ID
2006-07-15 A Karen Hernández 28
2006-07-15 A Christopher Torres 15
2006-07-15 B Karen Hernández 28
2006-07-16 C Karen Hernández 28
Hay otros tipos de columnas, y mas información sobre estosen http://dev.mysql.com/doc
Assessment of Long-Term Forest Dynamics in the Caribbean
Database and Metadata Concepts
• Métodos para diseño efectivo– Dividir los datos en tablas– Determinar el tipo de dato de cada columna– Identificar las relaciones entre las tablas
Assessment of Long-Term Forest Dynamics in the Caribbean
Database and Metadata Concepts
• Relaciones entre las tablas– Cada dato individual se entra una sola vez– Las columnas pueden corresponder a otras tablas,
y las filas corresponden a registros de datos individuales
Por lo tanto– Cada registro individual en una tabla puede estar
ligado/relacionado a uno o muchos registros en otras tablas
Assessment of Long-Term Forest Dynamics in the Caribbean
Database and Metadata Concepts
Tipos de relaciones-1 a 1(una fila a una fila)
-1 a muchas
-muchos a muchos
Sitio Piscina Trampa Profundidad Especie Repro Tamaño ID
A 1 1 24 ATYA S 15 15
A 1 2 12 XIPHO N 22 28
A 1 2 33 MACRE N 38 28
A 2 3 16 ATYA S 14 28
A 2 3 17 ATYA S 19 28
Fecha Sitio Colector datos ID
15jul2006 A Karen Hernández 28
15jul2006 A Christopher Torres 15
15jul2006 B Karen Hernández 28
16jul2006 C Karen Hernández 28
Código Genero especie
ATYA Atya lanipes
XIPHO Xiphocaris elongata
MACRE Macrobrachium crenulatum
MACOT Macrobrachium otracosii
Datos adicionales de taxonomíaDatos adicionales
Assessment of Long-Term Forest Dynamics in the Caribbean
Database and Metadata Concepts
Sitio Piscina Trampa Profundidad Especie Repro Tamaño ID
A 1 1 24 ATYA S 15 15
A 1 2 12 XIPHO N 22 28
A 1 2 33 MACRE N 38 28
A 2 3 16 ATYA S 14 28
A 2 3 17 ATYA S 19 28
Fecha Sitio Colector datos ID
15jul2006 A Karen Hernández 28
15jul2006 A Christopher Torres 15
15jul2006 B Karen Hernández 28
16jul2006 C Karen Hernández 28
Código Genero especie
ATYA Atya lanipes
XIPHO Xiphocaris elongata
MACRE Macrobrachium crenulatum
MACOT Macrobrachium otracosii
Tipos de relaciones-1 a muchas
Assessment of Long-Term Forest Dynamics in the Caribbean
Database and Metadata Concepts
Sitio Piscina Trampa Profundidad Especie Repro Tamaño ID
A 1 1 24 ATYA S 15 15
A 1 2 12 XIPHO N 22 28
A 1 2 33 MACRE N 38 28
A 2 3 16 ATYA S 14 28
A 2 3 17 ATYA S 19 28
Fecha Sitio Colector datos ID
15jul2006 A Karen Hernández 28
15jul2006 A Christopher Torres 15
15jul2006 B Karen Hernández 28
16jul2006 C Karen Hernández 28
Tipos de relaciones Varias filas en una tabla están relacionadas con varias filas en otra tabla
Tener relaciones entre tablas de ‘muchos a muchos’ puede ser problemático.
En ocasiones es aconsejable crear una tabla adicional para relacionar esas dos tablas
Assessment of Long-Term Forest Dynamics in the Caribbean
Database and Metadata Concepts
Sitio Piscina Trampa Profundidad Especie Repro Tamaño ID
A 1 1 24 ATYA S 15 15
A 1 2 12 XIPHO N 22 28
A 1 2 33 MACRE N 38 28
A 2 3 16 ATYA S 14 28
A 2 3 17 ATYA S 19 28
Fecha Sitio Colector datos ID
15jul2006 A Karen Hernández 28
15jul2006 A Christopher Torres 15
15jul2006 B Karen Hernández 28
16jul2006 C Karen Hernández 28
Tipos de relaciones Varias filas en una tabla están relacionadas con varias filas en otra tabla
ID Colector datos Proyecto Curso
28 Karen Hernández XXXXXXXXX YYYY
15 Christopher Torres XXXXXXXXX YYYY
06 Ana Campos XXXXXXXXX YYYY
25 Marcela Reyes XXXXXXXXX YYYY
Ahora tenemos una relación de 1 a muchas
• Mecanismos diseñados para prevenir la introducción de errores a un grupo de datos: “contaminación de datos” (Michener & Brunt 2000)
Control de calidad de
datos
• Mecanismos que se pueden aplicar luego de que los datos se han colectados y entrados en la computadora para identificar errores de omisión.
Aseguración de calidad de
datos
Assessment of Long-Term Forest Dynamics in the Caribbean
Database and Metadata Concepts
Control de calidad de
datos
Aseguración de calidad de
datos
• Datos incorrectos: errores en los instrumentos
Error por comisión:
• Datos que NO se colectaron o registraron
Error por omisión:
• Histogramas• Box-plots• Scatter plots (x,y)
Gráficos
• Calcular media• Promedio• Valores extremos
Estadísticos
Assessment of Long-Term Forest Dynamics in the Caribbean
Database and Metadata Concepts
Assessment of Long-Term Forest Dynamics in the Caribbean
Database and Metadata Concepts
Genéricos EspecíficosGratis
“web based”
Access
MySQL
EndNote
BIOTA
Google Tables
Referencias
– Cook et al. 2001. Best practices for preparing ecological and ground-based data sets to share and archive. Ecol. Bulletin 82:138-141.
– Michener and Brunt 2000. Ecological Data: Design, management and processing. Blackwell Science.
¿Que es metadata?
Metadata es literalmente “data sobre data” - describen el
contenido, la calidad, condición y otras características de la data.
Escribe de manera sencilla pero incluye
detalles
Se consistente en el uso de estilo y terminología
Algunos conceptos sobre metadata
Nivel 1Título, autor, información de contacto•Quien publica y fecha de publicación•Palabras claves y Resumen
Nivel 2•Cobertura Geográfica•Cobertura Taxonómica•Cobertura Temporal
Nivel 3•Derechos de propiedad intelectual•Proyecto y Métodos•Tabla de datos/atributos
Nivel 4•Se da acceso, el dato “físico”
Assessment of Long-Term Forest Dynamics in the Caribbean
Database and Metadata Concepts
Dife
rent
es n
ivel
es d
e m
etad
ata
Assessment of Long-Term Forest Dynamics in the Caribbean
Database and Metadata Concepts
El reto: La entropía de los datosC
on
ten
ido
de
Info
rmac
ión
Tiempo
Al tiempo de publicación
Detalles específicos
Detalles generales
Accidente
Cambio de projecto
(Michener et al. 1997)
Retiro
Cambio de trabajo
Assessment of Long-Term Forest Dynamics in the Caribbean
Database and Metadata Concepts
A new metadata repository-
Assessment of Long-Term Forest Dynamics in the Caribbean
Database and Metadata Concepts
Morning• Introduction to the Workshop, Vision and Objectives
• Implementation of the Forest Inventory Program• Database Concepts
Mid-morning • Examples of Caribbean Permanent Plots Afternoon • Examples of Data Analyses • Data Sharing and Regional Synthesis, Working Group Themes• Identifying Forest Research Sites and Plots in the Caribbean;
using Caribbean Foresters website
• Exhibition and Discussion of Country Report Posters
Assessment of Long-Term Forest Dynamics in the Caribbean
Basic Database and Metadata Concepts