assessment of long-term forest dynamics in the caribbean database and metadata concepts morning...

30
Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation of the Forest Inventory Program Database Concepts Mid-morning Examples of Caribbean Permanent Plots Afternoon Examples of Data Analyses Data Sharing and Regional Synthesis, Working Group Themes Identifying Forest Research Sites and Plots in the Caribbean; using Caribbean Foresters website Exhibition and Discussion of Country Report Posters

Upload: eloisa-chairez

Post on 07-Mar-2015

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

Assessment of Long-Term Forest Dynamics in the Caribbean

Database and Metadata Concepts

Morning• Introduction to the Workshop, Vision and Objectives

• Implementation of the Forest Inventory Program• Database Concepts

Mid-morning • Examples of Caribbean Permanent Plots Afternoon • Examples of Data Analyses • Data Sharing and Regional Synthesis, Working Group Themes• Identifying Forest Research Sites and Plots in the Caribbean;

using Caribbean Foresters website

• Exhibition and Discussion of Country Report Posters

Page 2: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

Assessment of Long-Term Forest Dynamics in the Caribbean

Database and Metadata Concepts

• Conceptos básicos sobre bases de datos• Conceptos básicos sobre metadata

http://www.ecoinformatics.org

Créditos y Agradecimientos

Page 3: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

Assessment of Long-Term Forest Dynamics in the Caribbean

Database and Metadata Concepts

• ¿Que es una base de datos?• Existen diferentes definiciones, dependiendo del contexto. Para efectos prácticos la

podemos definir:

• Base de datos: - Es una colección de archivos interrelacionados, creados por un

programa especial conocido como “data base management system” (DBMS)

– Estos archivos pueden contener una o mas tablas que guardan datos en una manera estructurada en forma de tablas:

– Es una serie o grupo de tablas• Estas tablas se relacionan entre si• Utiliza un lenguaje de comandos para búsquedas

Page 4: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

Assessment of Long-Term Forest Dynamics in the Caribbean

Database and Metadata Concepts

• Las tablas consisten en una serie de columnas (Campos) que representan una característica de un individuo u objeto.

• Cada fila o Registro (colección de campos de iguales o de diferentes tipos) ofrece una descripcion del objeto o individuo.

• La tabla es una colección de registros almacenados siguiendo una estructura homogénea.

Isabel Pares
ELIMINAR - Esto se puede mencionar en el proximo slide donde esta la tabla
Page 5: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

Assessment of Long-Term Forest Dynamics in the Caribbean

Database and Metadata Concepts

Fecha Código Altura Diámetro

<solo fechas> <solo texto> <solo nums reales> <solo nums reales>

- Las bases de datos ofrecen un control explicito sobre los tipos de datos (columnas)

Provee• Exactitud• Control de calidad• Desempeño• Facilita el uso

Ejemplo:

Page 6: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

Assessment of Long-Term Forest Dynamics in the Caribbean

Database and Metadata Concepts

Fecha Código Altura Diámetro

A

B

C

D

Código

Latitud Longitud Elevación

A

B

C

D

Se establecen relaciones explicitas o implícitas entre las tablas

Existe o se crea una “clave única” o “clave primaria” (primary key) para relacionar las tablas.

Esto permite hacer búsquedas y re-organizar datos de manera rápida y fácil

Page 7: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

Assessment of Long-Term Forest Dynamics in the Caribbean

Database and Metadata Concepts

Características de los Datos Ecológicos

Requerimientos de Metadata/Complejidad

Imágenes de Satélite

Volumen de datos(por set de datos)

Baja

Alta

Alta

Datos de Suelos

ProductividadPrimaria

SIG

Datos Poblacionales

Censos de Biodiversidad

Secuencias Genómicas

DatosEmpresariales,Administrativos

EstacionesMeteorológicas La mayoría de los

datos ecológicos

La mayoría de los programas

Isabel Pares
Este slide esta bueno para empezar la charla porque pone el tema en contexto
Page 8: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

Assessment of Long-Term Forest Dynamics in the Caribbean

Database and Metadata Concepts

Programas de “Spreadsheets” (como Excel)• Lo bueno

– Son usados comúnmente– Son fácil de aprender– Por lo general están instalados en la mayoría de las computadoras

• Lo no tan bueno– Puede promover malos hábitos de uso, generando datos que no pueden

ser usados fácilmente – No permiten análisis muy complejos– Es difícil “auditarlos”, es decir, ver como se ha cambiado o manipulado los

datos– No facilitan la busqueda efectiva de un subconjunto de los datos

Page 9: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

Assessment of Long-Term Forest Dynamics in the Caribbean

Database and Metadata Concepts

• Métodos para diseño efectivo– Dividir los datos en tablas– Determinar el tipo de dato de cada columna– Identificar las relaciones entre las tablas

Page 10: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

Assessment of Long-Term Forest Dynamics in the Caribbean

Database and Metadata Concepts

Sitio Piscina Trampa Profundidad Especie Repro Tamaño Colector datos ID

A 1 1 24 ATYA S 15 Karen Hernández 15

A 1 2 12 XIPHO N 22 Karen Hernández 15

A 1 2 33 MACRE N 38 Karen Hernández 15

A 2 3 16 ATYA S 14 Karen Hernández 15

A 2 3 17 ATYA S 19 Karen Hernández 15

Fecha Sitio Colector datos ID

A

B

C

D

Sitio Latitud Longitud Elevación

A

B

C

D

Datos adicionales del sitio de muestreo

Se pueden relacionar en otra tabla

Page 11: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

Assessment of Long-Term Forest Dynamics in the Caribbean

Database and Metadata Concepts

Sitio Piscina Trampa Profundidad Especie Repro Tamaño

A 1 1 24 ATYA S 15

A 1 2 12 XIPHO N 22

A 1 2 33 MACRE N 38

A 2 3 16 ATYA S 14

A 2 3 17 ATYA S 19

Fecha Sitio Colector datos ID

15jul2006 A Karen Hernández 28

15jul2006 A Christopher Torres 15

15jul2006 B Karen Hernández 28

16jul2006 C Karen Hernández 28

Código Genero especie

ATYA Atya lanipes

XIPHO Xiphocaris elongata

MACRE Macrobrachium crenulatum

MACOT Macrobrachium otracosii

Datos adicionales de taxonomía

se pueden almacenar en otra tabla

Los datos que se repiten

es mas eficiente que estén en otra tabla

Page 12: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

Assessment of Long-Term Forest Dynamics in the Caribbean

Database and Metadata Concepts

• Métodos para diseño efectivo– Dividir los datos en tablas– Determinar el tipo de dato de cada columna– Identificar las relaciones entre las tablas

Page 13: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

Assessment of Long-Term Forest Dynamics in the Caribbean

Database and Metadata Concepts

Sitio Piscina Trampa Profundidad Especie Repro Tamaño

A 1 1 24.2 ATYA S 15.1

A 1 2 12.3 XIPHO N 22.3

A 1 2 33.0 MACRE N 38.5

A 2 3 16.3 ATYA S 14.6

A 2 3 17.8 ATYA S 19.2

Datos Numéricos

Integer nums enteros 200

Float nums reales de precisión sencilla (hasta 23 lugares decimales)

3.1415926

Doble precisión doble (hasta 53 lugares decimales)

3.1415926535897932453243853142593435104756237812

Ejemplos de tipos de datos (dependen del programa en uso)

Page 14: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

Assessment of Long-Term Forest Dynamics in the Caribbean

Database and Metadata Concepts

Sitio Piscina Trampa Profundidad Especie Repro Tamaño

A 1 1 24 ATYA S 15

A 1 2 12 XIPHO N 22

A 1 2 33 MACRE N 38

Datos de Texto

charchar(n)

carácteres “Plumeria”

varchar(n) Caracteres con un largo variable “heces fecales sin identificar”

text Un pedazo grande de texto Un resumen (abstract)

enum Valores enumerados ‘sur’, ‘oeste’, ’norte’, ‘este’

Set* Un grupo de valores ‘capullo’, ‘flor’, ‘fruto-inmaduro’, ‘fruto-maduro’

Ejemplos de tipos de datos (dependen del programa en uso)

*Set-aquí puede colocarse mas de unode los valores

Page 15: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

Assessment of Long-Term Forest Dynamics in the Caribbean

Database and Metadata Concepts

Fechas

DATETIME ‘YYYY-MM-DD HH:MM:SS’ ‘2006-11-28 45:30:15’

DATE ‘YYYY-MM-DD’ ‘2006-11-28’

TIMESTAMP Segundos que han pasado desde t0 38

TIME ‘HH:MM:SS’ ’45:30:15’

YEAR ‘YYYY’ 2006

Ejemplos de tipos de datos (dependen del programa en uso)

Fecha Sitio Colector datos ID

2006-07-15 A Karen Hernández 28

2006-07-15 A Christopher Torres 15

2006-07-15 B Karen Hernández 28

2006-07-16 C Karen Hernández 28

Hay otros tipos de columnas, y mas información sobre estosen http://dev.mysql.com/doc

Page 16: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

Assessment of Long-Term Forest Dynamics in the Caribbean

Database and Metadata Concepts

• Métodos para diseño efectivo– Dividir los datos en tablas– Determinar el tipo de dato de cada columna– Identificar las relaciones entre las tablas

Page 17: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

Assessment of Long-Term Forest Dynamics in the Caribbean

Database and Metadata Concepts

• Relaciones entre las tablas– Cada dato individual se entra una sola vez– Las columnas pueden corresponder a otras tablas,

y las filas corresponden a registros de datos individuales

Por lo tanto– Cada registro individual en una tabla puede estar

ligado/relacionado a uno o muchos registros en otras tablas

Page 18: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

Assessment of Long-Term Forest Dynamics in the Caribbean

Database and Metadata Concepts

Tipos de relaciones-1 a 1(una fila a una fila)

-1 a muchas

-muchos a muchos

Sitio Piscina Trampa Profundidad Especie Repro Tamaño ID

A 1 1 24 ATYA S 15 15

A 1 2 12 XIPHO N 22 28

A 1 2 33 MACRE N 38 28

A 2 3 16 ATYA S 14 28

A 2 3 17 ATYA S 19 28

Fecha Sitio Colector datos ID

15jul2006 A Karen Hernández 28

15jul2006 A Christopher Torres 15

15jul2006 B Karen Hernández 28

16jul2006 C Karen Hernández 28

Código Genero especie

ATYA Atya lanipes

XIPHO Xiphocaris elongata

MACRE Macrobrachium crenulatum

MACOT Macrobrachium otracosii

Datos adicionales de taxonomíaDatos adicionales

Page 19: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

Assessment of Long-Term Forest Dynamics in the Caribbean

Database and Metadata Concepts

Sitio Piscina Trampa Profundidad Especie Repro Tamaño ID

A 1 1 24 ATYA S 15 15

A 1 2 12 XIPHO N 22 28

A 1 2 33 MACRE N 38 28

A 2 3 16 ATYA S 14 28

A 2 3 17 ATYA S 19 28

Fecha Sitio Colector datos ID

15jul2006 A Karen Hernández 28

15jul2006 A Christopher Torres 15

15jul2006 B Karen Hernández 28

16jul2006 C Karen Hernández 28

Código Genero especie

ATYA Atya lanipes

XIPHO Xiphocaris elongata

MACRE Macrobrachium crenulatum

MACOT Macrobrachium otracosii

Tipos de relaciones-1 a muchas

Page 20: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

Assessment of Long-Term Forest Dynamics in the Caribbean

Database and Metadata Concepts

Sitio Piscina Trampa Profundidad Especie Repro Tamaño ID

A 1 1 24 ATYA S 15 15

A 1 2 12 XIPHO N 22 28

A 1 2 33 MACRE N 38 28

A 2 3 16 ATYA S 14 28

A 2 3 17 ATYA S 19 28

Fecha Sitio Colector datos ID

15jul2006 A Karen Hernández 28

15jul2006 A Christopher Torres 15

15jul2006 B Karen Hernández 28

16jul2006 C Karen Hernández 28

Tipos de relaciones Varias filas en una tabla están relacionadas con varias filas en otra tabla

Tener relaciones entre tablas de ‘muchos a muchos’ puede ser problemático.

En ocasiones es aconsejable crear una tabla adicional para relacionar esas dos tablas

Page 21: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

Assessment of Long-Term Forest Dynamics in the Caribbean

Database and Metadata Concepts

Sitio Piscina Trampa Profundidad Especie Repro Tamaño ID

A 1 1 24 ATYA S 15 15

A 1 2 12 XIPHO N 22 28

A 1 2 33 MACRE N 38 28

A 2 3 16 ATYA S 14 28

A 2 3 17 ATYA S 19 28

Fecha Sitio Colector datos ID

15jul2006 A Karen Hernández 28

15jul2006 A Christopher Torres 15

15jul2006 B Karen Hernández 28

16jul2006 C Karen Hernández 28

Tipos de relaciones Varias filas en una tabla están relacionadas con varias filas en otra tabla

ID Colector datos Proyecto Curso

28 Karen Hernández XXXXXXXXX YYYY

15 Christopher Torres XXXXXXXXX YYYY

06 Ana Campos XXXXXXXXX YYYY

25 Marcela Reyes XXXXXXXXX YYYY

Ahora tenemos una relación de 1 a muchas

Page 22: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

• Mecanismos diseñados para prevenir la introducción de errores a un grupo de datos: “contaminación de datos” (Michener & Brunt 2000)

Control de calidad de

datos

• Mecanismos que se pueden aplicar luego de que los datos se han colectados y entrados en la computadora para identificar errores de omisión.

Aseguración de calidad de

datos

Assessment of Long-Term Forest Dynamics in the Caribbean

Database and Metadata Concepts

Isabel Pares
sugerencia de como arreglar el texto para que sea mas explicito
Page 23: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

Control de calidad de

datos

Aseguración de calidad de

datos

• Datos incorrectos: errores en los instrumentos

Error por comisión:

• Datos que NO se colectaron o registraron

Error por omisión:

• Histogramas• Box-plots• Scatter plots (x,y)

Gráficos

• Calcular media• Promedio• Valores extremos

Estadísticos

Assessment of Long-Term Forest Dynamics in the Caribbean

Database and Metadata Concepts

Page 24: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

Assessment of Long-Term Forest Dynamics in the Caribbean

Database and Metadata Concepts

Genéricos EspecíficosGratis

“web based”

Access

MySQL

EndNote

BIOTA

Google Tables

Referencias

– Cook et al. 2001. Best practices for preparing ecological and ground-based data sets to share and archive. Ecol. Bulletin 82:138-141.

– Michener and Brunt 2000. Ecological Data: Design, management and processing. Blackwell Science.

Page 25: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

¿Que es metadata?

Metadata es literalmente “data sobre data” - describen el

contenido, la calidad, condición y otras características de la data.

Escribe de manera sencilla pero incluye

detalles

Se consistente en el uso de estilo y terminología

Algunos conceptos sobre metadata

Isabel Pares
Sustituir los slides 33 y 34 por esta grafica? ahorra espaco y tiempo
Page 26: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

Nivel 1Título, autor, información de contacto•Quien publica y fecha de publicación•Palabras claves y Resumen

Nivel 2•Cobertura Geográfica•Cobertura Taxonómica•Cobertura Temporal

Nivel 3•Derechos de propiedad intelectual•Proyecto y Métodos•Tabla de datos/atributos

Nivel 4•Se da acceso, el dato “físico”

Assessment of Long-Term Forest Dynamics in the Caribbean

Database and Metadata Concepts

Dife

rent

es n

ivel

es d

e m

etad

ata

Isabel Pares
SUGERENCIA de como acomodar los slides del 39 al 44
Page 27: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

Assessment of Long-Term Forest Dynamics in the Caribbean

Database and Metadata Concepts

El reto: La entropía de los datosC

on

ten

ido

de

Info

rmac

ión

Tiempo

Al tiempo de publicación

Detalles específicos

Detalles generales

Accidente

Cambio de projecto

(Michener et al. 1997)

Retiro

Cambio de trabajo

Isabel Pares
Me parece super buena esta grafica pero quizas en otro logar? Es que rompe el tem de los tipos de metadata...
Page 28: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

Assessment of Long-Term Forest Dynamics in the Caribbean

Database and Metadata Concepts

A new metadata repository-

Page 29: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

Assessment of Long-Term Forest Dynamics in the Caribbean

Database and Metadata Concepts

Page 30: Assessment of Long-Term Forest Dynamics in the Caribbean Database and Metadata Concepts Morning Introduction to the Workshop, Vision and Objectives Implementation

Morning• Introduction to the Workshop, Vision and Objectives

• Implementation of the Forest Inventory Program• Database Concepts

Mid-morning • Examples of Caribbean Permanent Plots Afternoon • Examples of Data Analyses • Data Sharing and Regional Synthesis, Working Group Themes• Identifying Forest Research Sites and Plots in the Caribbean;

using Caribbean Foresters website

• Exhibition and Discussion of Country Report Posters

Assessment of Long-Term Forest Dynamics in the Caribbean

Basic Database and Metadata Concepts