aurelio sanabria ([email protected]) analista/desarrollador de software inbio, costa rica buenos...
TRANSCRIPT
Aurelio Sanabria ([email protected])Analista/Desarrollador de softwareINBio, Costa Rica
Buenos Aires (Argentina)28 de setiembre de 2011
Curso capacitación sobre publicación de datos de biodiversidad y fitness-for-use en la Red GBIF.Edición 2011
Introducción a las nuevas opciones para publicar datos de biodiversidad.
Opciones para publicar datos
Glosario
Data Publisher / Data ProviderData Resource / Data setData resource type (e.g., Metadata,
Occurrence, Taxon)Data recordData record element, term, field, column,
property, attribute, concept (e.g., basisOfRecord, scientificName)
Data valueEstándares, Vocabularios
Proveedores de datos
Instituciones con varias unidades organizacionales, cada una con múltiples recursos de datos.
Instituciones, grupos o individuos con varios recursos de datos.
Instituciones o individuos con un solo recurso de datos. (data set).
Tipos de recursos de datos
Datos primarios de biodiversidad (Especímenes, Observaciones, ecología)
• El tipo de datos principal es la occurencia de un organismo.
Catálogos taxonómicos*, y Checklist de especies
• El tipo de datos principal es un Taxon
* Para distingir nuestros esfuersos de los del Catálogo de la vida – GBIF únicamente provee los medios.
Metadatos enriquecidos – Principalmente enfocado en recursos de datos de Occurencias y Taxones.
Registros de datos
Recurso de datos tipo: Taxon
Recurso de datos tipo: Occurrencia
Campos de datos
Recurso de datos tipo: Taxon
Recurso de datos tipo: Occurrencia
Valores de los datos
Recurso de datos tipo: Taxon
Recurso de datos tipo: Occurrencia
Estándares para datos
Datos primarios deBiodiversidad
Datos taxonómicos
Darwin Core
• 172 Términos• Ratificado en el 2009• Archivos de texto• Extensible
Metadatos
Lenguage para metadatos ecológicos (EML)
• Descripciones de recursos de datos• GBIF Profile
Opciones para publicar datos
Opciones para publicar datos
Si TAPIR permite 1000 registros por solicitud.
Para transferir un recurso de datos de 260 000 registros:• 260 solicitudes / Tranferencia total de datos 500MB.• Duración de la recolección: 2 horas.• De esos 500 MB solo 32MB de los datos tranferidos son
"utilizados".
Ejemplo: Tapir
Opciones para publicar datos
Para tranferir un recurso de datos de 260 000 registros:• 1 solicitud / Transferencia total de datos: 3MB.• Duración de la recolección: de minutos a segundos.
Ejemplo: Archivo Darwin Core
ArchivoDarwin Core
Ejemplo: Archivo Darwin Core
ArchivoDarwin Core
Comparado a Tapir/DiGIR/BioCASE:• 260 solicitudes / Transferencia total de datos: 500MB.• Duración de la recolección: 2 horas.
Para tranferir un recurso de datos de 260 000 registros:• 1 solicitud / Transferencia total de datos: 3MB.• Duración de la recolección: de minutos a segundos.
• Utiliza un formato simple (texto plano)
• Almacenamiento eficiente (compressed)
• Recolección eficiente (un archivo)
• Fácil acceso (Sin software especializado)
• Extensible (varios archivos en un solo zip)
Archivos Darwin Core:Beneficios
Este es el formato recomendadopara publicar datos en GBIF
Encontrado los datos
El registro de GBIF
GBIF: Portal de datos
GBIF: Centro de recursos en línea(http://www.gbif.org/orc/)
Bibliografía
Aurelio Sanabria ([email protected])Analista/Desarrollador de softwareINBio, Costa Rica
Buenos Aires (Argentina)28 de setiembre de 2011
Training course on biodiversity data publishing and fitness-for-use in the GBIF Network, 2011 edition
Introducción a las nuevas opciones para publicar datos de biodiversidad.