agrovoc cswb training_2

86
AGROVOC para editores/redactores Unidad #2: Términos y conceptos IIAP, Iquitos June 30, 2010 Caterina Caracciolo [email protected]

Upload: catecara

Post on 28-May-2015

456 views

Category:

Education


3 download

DESCRIPTION

Second lesson of training course for editors of AGROVOC CS

TRANSCRIPT

Page 1: Agrovoc cswb training_2

AGROVOC para editores/redactores

Unidad #2: Términos y conceptos

IIAP, Iquitos June 30, 2010

Caterina [email protected]

Page 2: Agrovoc cswb training_2

2

Temario

Perspectiva sobre este curso

AGROVOC

Historia de AGROVOC CS y WB

AGROVOC CS explicado con el WBAñadir conceptos y terminosFlujo de trabajo

Ejercicios

Page 3: Agrovoc cswb training_2

3

Perspectiva sobre este curso

Page 4: Agrovoc cswb training_2

4

Objetivos

Capacitar futuros capacitadores y redactores de AGROVOC Concept Schema con el AGROVOC Work Bench

– para la revisión de la parte ES-EA

Dar una visión amplia sobre AGROVOC y metadatos en la FAO

– para contribuir en la organización de una red de usuarios de AGROVOC Concept Schema y Work Bench en LatinoAmerica

Page 5: Agrovoc cswb training_2

5

Que necesitamos

Comprensión general del problema (unidad #1)– metadatos en bibliotecas y para la

organización de información electrónica

Temas técnicos sobre ACS y AWB (unidad #2)– modelo de ACS, manejo con AWB– flujo de trabajo

Temas avanzados (unidad #3-4)– formato y modelo

Page 6: Agrovoc cswb training_2

6

Recapitulación: la familia AGROVOC

AGROVOC tesauro multilingua

AGROVOC Concept Schema (ACS)– refinamiento semantico de AGROVOC – ahora: sólo accessible con el AGROVOC WB– futuro: tambien con una GUI read-only

AGROVOC Work Bench (AWB)– herramienta online para el manejo de ACS – futuro: tambien otro vocabularios

Page 7: Agrovoc cswb training_2

7

El futuro de familia AGROVOC

AGROVOC CS será el producto primario

AGROVOC tesauro será un formato de conversión

Page 8: Agrovoc cswb training_2

8

AGROVOC tesauro

Page 9: Agrovoc cswb training_2

9

Recapitulación: usos de AGROVOC

En bibliotecas para indexar libros y publicaciones

En TICs para organizar información– Content management systems (AGRIDrupal)– Tagging (AGROTagger)– AGRIS– FAO-EIMS– sitios web– Geonetwork– próximamente: KDE Linux desktop

Page 10: Agrovoc cswb training_2

10

Relaciones USE y UF No jerárquicas

Entre términos que son sinónimos (o casi)

USE (use): el término preferido– descriptor, preferred term

UF (used for): el término alternativo– non descriptor, non preferred

Ejem. – USE Annuals, UF annual plants

Page 11: Agrovoc cswb training_2

11

Relaciones BT y NTJerárquicas

Entre 2 términos que son unos más generales que otros

– generalidad puede depender del contexto o del punto de vista

BT (broader term): el término más general NT (narrower term): el término más específico

Ejem. – BT Plantas anuales

• NT Plantas hornamentales anuales

Page 12: Agrovoc cswb training_2

12

Relación RTNon jerárquica

Es relación simétrica– si A es RT (related term) B, B es RT B.

Entre 2 términos que son “relacionados”– los dos son preferidos– depende de la perspectiva o punto de vista

Ejem. – USE Contaminantes – RT Polución

Page 13: Agrovoc cswb training_2

13

Estructura de AGROVOC

Representamos:– Términos como boliches – Relaciones BT/NT como lineas– Relaciones RT como lineas

Obtendríamos un grafo

Page 14: Agrovoc cswb training_2

14

Grafo de la estructura de AGROVOC

Page 15: Agrovoc cswb training_2

15

Grafo con términos no preferidos

Recuerda: las relaciones BT/NT y RT sólo juntan términos preferidos

– Los UF están lógicamente conectados con sus USE

Ahora representamos:– Términos preferidos como boliches redondos– Términos no preferidos como boliche oval

Page 16: Agrovoc cswb training_2

16

Grafo con términos no preferidos

Page 17: Agrovoc cswb training_2

17

AGROVOC multilingüe

La estructura es una– No cambia de idioma a idioma – Términos tienen traducciones– Hay casos en que no hay traducción

Cada boliche representa el conjunto de términos preferidos (no preferidos) en todos los idiomas

Page 18: Agrovoc cswb training_2

18

Ejemplo AGROVOC multilingüe

Inglés:

USE Annuals – 28997 descriptor UF Annual Plants – 37199 non descriptor

Español:

USE Plantas annuales – 28997, descriptorUF (null) – 37199, non descriptor

Page 19: Agrovoc cswb training_2

19

AGROVOC multilingüe ejemplo

Page 20: Agrovoc cswb training_2

20

Diversos niveles

Contenido– terminología

Estructura– el grafo es– tiene que ver con las relaciones que se usan

Formato– de almacenamiento: como los datos están

guardados – de intercambio: como los datos son

exportados para otro uso o usuario

ottimo,

Page 21: Agrovoc cswb training_2

21

Formatos electrónicos

Almacenamiento: base de datos relacional (SQL)

Intercambio:– TBX, Term Base eXchange. XML estándar

para datos terminológicos – SKOS, Simple Knowledge Organization

System. Vocabulario para expresar tesauros en RDF

– OWL, Ontology Web Language. Experimental.

ottimo,

Page 22: Agrovoc cswb training_2

22

Como creció AGROVOC

Se fueron añadiendo términos en tanto servían, durante el indexing

Usuario sugería términos a FAO, que revisaba, añadiva y publicaba...

Como lineas guías, metodologías general para tesauros, recursos terminológicos FAO, y lineas guías para AGROVOC

Page 23: Agrovoc cswb training_2

23

Lineas guías para tesauros

Guidelines for the Construction, Format, and Management of Monolingual Controlled Vocabularies, ANSI/ISO Z39.19-2005

Guidelines for the establishment and development of multilingual thesauri, ANSI/ISO 5964-1985

ottimo,

Page 24: Agrovoc cswb training_2

24

Lineas guías y recursos FAO

Basic guidelines for managing AGROVOC

ftp://ftp.fao.org/docrep/fao/010/ai144e/ai144e00.pdf

Adding new terms to AGROVOC

momentáneamente cargado como GoogleDoc

Page 25: Agrovoc cswb training_2

25

Otro recursos FAO

The FAO House style

http://www.fao.org/docrep/004/AC339e/AC339E00.htm

FAOTERM

http://www.fao.org/faoterm/

ottimo,

Page 26: Agrovoc cswb training_2

26

Manejo multilingüa de AGROVOC

1. FAO tiene una copia matriz, un RDB 2. La institución responsable para un idioma recibe una copia3. La institución envia la copia modificada a FAO4. FAO incorpora cambios en la copia matriz 5. FAO publica en linea una nueva versión

Manejo centralizadoInclusión de nuevos términos demoraba

Con el AWB todo eso va a cambiar!

ottimo,

Page 27: Agrovoc cswb training_2

27

De AGROVOC tesauro a AGROVOC CS

Page 28: Agrovoc cswb training_2

28

Historia condensada de AGROVOC

1982 nace el tesauro AGROVOC 1990-2000 gran incremento de idiomas

– necesidad de actualización veloz– 1995-2000+ internet, web semantica,

2005 requisitos para un AGROVOC WB 2006 inicia desarrollo de ACS, AWB

– pruebas con OWL

ottimo,

Page 29: Agrovoc cswb training_2

29

Historia condensada de AGROVOC cont'd

2009 – SKOS es una recomendación W3C – Gran difusión de Linked Data– OWL aparece demaciado “demanding”

2010 – Junio: AWB estrenado – Sigue el trabajo para usar volver AWB en una

interface para el manejo de RDF-SKOS data

ottimo,

Page 30: Agrovoc cswb training_2

30

Multilingüalidad y códigos

Términos tienen códigos para identificación

Términos que son traducciones uno del otro tienen el mismo código

Cada término se puede identificar unívocamente con el conjunto de código y ISO-2 de su idioma

Page 31: Agrovoc cswb training_2

31

Objetivos de AGROVOC WB

Dinamizar la actualización de AGROVOC

Tener una herramienta apropiada a los requisitos de AGROVOC CS

Page 32: Agrovoc cswb training_2

32

Objetivos de AGROVOC CS

Tener una estructura y contenido más usable por las aplicaciones de web semántica y para la organización de contenido electrónico

Page 33: Agrovoc cswb training_2

33

La revisión de AGROVOC

Contenido – Hecha por ICRISAT, FAO– Menos raices– BT/NT han sido simplificados– RT han sido transformados en relaciones

Desarrollo del AWB– Hecho por ICRISAT, IIT Kanpur, MIMOS

Bangkok, FAO

Formato y modelo (FAO+)

Page 34: Agrovoc cswb training_2

34

Características de AWB

Basado en la web

Maneja idiomas y traducciones

Maneja flujo de trabajo distribuido

Permite exportar en varios formatos

Produce estadísticas para análisis

ottimo,

Page 35: Agrovoc cswb training_2

35

Situación actual

AWB tiene sus primeros usuarios ;-)

El master RDB ha sido descontinuado

Copia matriz ahora es en RDF– RDF tambien se almacena como DB– versión SKOS como formato para

exportación

En el futuro SKOS será el formato nativo

ottimo,

Page 36: Agrovoc cswb training_2

36

El AGROVOC CS y WB

Page 37: Agrovoc cswb training_2

37

Elementos del ACS

Conceptos

Términos en varios idiomas

Relaciones entre tèrminos– Más tipos que USE/UF

Relaciones entre conceptos– Más especificas que RT

ottimo,

Page 38: Agrovoc cswb training_2

38

Leyendo la GUI

ottimo,

1

2

3

4 5

6

Page 39: Agrovoc cswb training_2

39

Leyenda

1.Visualizador de jerarquía 2.URI de los conceptos3.Detalles acerca de los conceptos4.Operaciones aplicadas en los conceptos5.Opciones de visualización de los conceptos6.Terminos del concepto

ottimo,

Page 40: Agrovoc cswb training_2

40

La estructura de AGROVOC CS

Grafo simile al anterior, pero ahora los boliches representan conceptos

– Cambiamos tamaños y forma porque un concepto está hecho de términos preferidos y no preferidos

Las relaciones BT/NT se quedan

Ahi relaciones más especificas que RT – Pero se pueden ver como sub-relaciones

ottimo,

Page 41: Agrovoc cswb training_2

41

Grafo de la estructura de AGROVOC CS

Page 42: Agrovoc cswb training_2

42

Conceptos

Page 43: Agrovoc cswb training_2

43

Definición operativaConcepto: conjunto de términos usados en cada idioma para nombrarlo. Información guardada: 1. Posición del concepto en la jerarquía 2. Términos que “forman” el concepto en varios idiomas 3. Definiciónes en varios idiomas 4. Notas adicionales: editorial note, scope note5. Pertenencia a subvocabularios6. Historia de los cambios 7. Imagenes 8. Relaciones nonjerarquicas con otros conceptos

ottimo,

Page 44: Agrovoc cswb training_2

44

Añadir un concepto paso 1

1. Eligir la posición en la jerarquía2. Dar click al ícono “+” en la barra sobre la

jerarquía3. Aparece una ventanita, introducir esta

información1. Una etiqueta (label)2. El idioma de la etiqueta 3. Posición en la jerarquía4. Namespace5. URI

ottimo,

Page 45: Agrovoc cswb training_2

45

Añadir un concepto paso 1

ottimo,

Page 46: Agrovoc cswb training_2

46

Etiquetas de conceptos

Cuando se adiciona un nuevo concepto, la etiqueta se convierte en término preferido en el idioma indicado

– Si el idioma no es inglés, el término necesita un definición en EN

– Se recomienda siempre poner definición

ottimo,

Page 47: Agrovoc cswb training_2

47

Namespace

Namespace = espacio de los nombres– El espacio en el cual un nombre está definido

Ejem. – El nombre Peter en el espacio de los nombres

de este curso– El nombre “plantas” en el espacio de

AGROVOC es distinto de “plantas” en otro contexto

Será http://aims.fao.org/aos/agrovoc/

Page 48: Agrovoc cswb training_2

48

URIs

URI = Universal Resource Identifier– Formado por namespace + nombre (código)

URL = Universal Resource Locator

– Más específico que URI porque tambien es una dirección en el internet

Durante años URI != URL– El URI no tenía que ser tambien dirección – Ahora la tendencia es usar HTTP URI =

URL

ottimo,

Page 49: Agrovoc cswb training_2

49

Códigos para términos y conceptos

ACS incluye nuevas entidades: conceptos. ¿Como nos vamos a referir a ellos?

• Si los términos que lo forman ya existian:– el concepto toma un código basado en el del

término preferido – cada término se queda con su código

• Si el concepto es nuevo– toma un código generado por el sistema

ottimo,

Page 50: Agrovoc cswb training_2

50

Códigos y URI

El “nombre” del concepto que creamos, es un código (números)

– Idea: independencia de los idiomas

Mucha discusión sobre como hacer buenos URIs, sobre todo en el área de Linked Data

– Es importante que el URI corresponde en algo en el internet

ottimo,

Page 51: Agrovoc cswb training_2

51

Añadir un concepto - paso 2

Para añadir más información, utilizar las pestañas en la parte derecha de la interface

ottimo,

Page 52: Agrovoc cswb training_2

52

Añadir un concepto - paso 2

ottimo,

Page 53: Agrovoc cswb training_2

53

Más información sobre un concepto

1. Más terminos (no preferidos)2. Editorial note/scope note1. Se encuentran en la pestaña “Note”2.“Editorial note”: para explicar razón de cambios 3.“Scope note”: para descripciones temáticas

3. Historia de los cambios1. Agregada por el sistema2. Se encuentra en la la pestaña “History”

4.Imagene para explicar el concepto1.Se encuentra en la la pestaña “Image”

ottimo,

Page 54: Agrovoc cswb training_2

54

Más información sobre un concepto

1.Relaciones entre conceptos 1. Se encuentran en la pestaña “Relationship”2. En unidad #3

2. Atributos del concepto 1. Si es parte de un subvocabulario 2. Se encuentra en la pestaña “Attribute”3. En unedad #3

ottimo,

Page 55: Agrovoc cswb training_2

55

Términos

Page 56: Agrovoc cswb training_2

56

Términos

Pueden ser “preferred” o “not preferred”

Sólo un preferido está permitido en cada idioma para cada concepto

Se pueden especificar atributos morfológicos Pueden ser de distintos “tipos”

– O sea, pertenecer a un vocabulario Tienen una historia de cambios

– Agregada automaticamenteTienen códigos

ottimo,

Page 57: Agrovoc cswb training_2

57

Añadir un término - paso 1

1. Elegir el concepto deseado 2. En la pestaña “Terms” dar click “Add new term”3. Se abre un ventanita, ahi poner:1. Término2. Idioma3. Si el término es preferido

ottimo,

Page 58: Agrovoc cswb training_2

58

Añadir un término - paso 1

ottimo,

Page 59: Agrovoc cswb training_2

59

Añadir un término - paso 2Para añadir más información, dar click al término

que acabas de añadir

1. En la pestaña “Terms” dar click al término elegido

2. Se abre una ventanita con varias pestañas:1. History2. Relationship: relaciones terminológica

1.En unedad #33. Attribute: “has term type”

• Más en unedad #34. Note: códigos y información morfológica

ottimo,

Page 60: Agrovoc cswb training_2

60

Añadir un término - paso 2

ottimo,

Page 61: Agrovoc cswb training_2

61

Morfología de términos

Se define en la pestaña “Code”

Singular / plural – Ejem. Arbol, arbolesVariación ortográfica – Ejem. colour, color

– Pueden ser variaciones de idioma nacional: EN-UK, EN-US

– Pero hay mucho más paises que hablan inglés!

Stem form – Ejem. Vas, vamos, vayas – stem: va– Stem != raiz

ottimo,

Page 62: Agrovoc cswb training_2

62

“Tipos” de términos

Se definen en la pestaña “Attribute”

El “tipo” de un término puede ser: – Acrónimo (FAO, IIAP)– Nombre común (Animals, bacteria, fungi,

plants, viruses)– Nombre taxonómico

Término hasTermType (taxonomic term for ....)

ottimo,

Page 63: Agrovoc cswb training_2

63

AGROVOC WB

Flujo de trabajo

Page 64: Agrovoc cswb training_2

64

Flujo de trabajo editorialUsuarios y roles

Para permitir control de calidad

Implica una secuencia de acciones– Sugerencia y revisiones de elementos– validación – Publicación

Comparen con wiki-like publicación

Page 65: Agrovoc cswb training_2

65

GlosarioRights: permiso para ejecutar acciones

– ejem. añadir terminos, borrar relaciones

Rol: función en un flujo de trabajo– Editor, publisher– Cada rol tiene un determinado conjunto de

permisos– Un “publisher” puede aprobar y rechazar

cualquier cambio

Status: estado de un elemento en un flujo de trabajo– e.g. Borrador, publicado

ottimo,

Page 66: Agrovoc cswb training_2

66

User roles

http://aims.fao.org/es/workbench/help/users

1. Visitor2. Non registered users3. Term editor4. Ontology editor5. Validator6. Publisher7. Administrator

ottimo,

Page 67: Agrovoc cswb training_2

67

Page 68: Agrovoc cswb training_2

68

Roles y permisos – 1

Visitor Sólo navegar y buscar

Non registered usersSugerir términos en cualquier idiomaSugerir conceptos Sugerir relaciones

ottimo,

Page 69: Agrovoc cswb training_2

69

Roles y permisos – 2

Term editors Crear nuevos términos sólo en algunos idiomas Editar, borrar términos que ellos mismos crearonSugerir cambios en conceptos

Ontology editors Manejan términos y conceptos Borrar conceptos sólo en su idiomaEditar o borrar conceptos que ellos mismos crearon

ottimo,

Page 70: Agrovoc cswb training_2

70

Roles y permisos – 3

ValidatorsControlar y validar los cambios hecho por term editors y ontology editors based (algunos idiomas)

PublishersTienen permisos en terminos y conceptosPuede validate editores y confirmar el trabajo de validadores

En todos idiomas

ottimo,

Page 71: Agrovoc cswb training_2

71

Roles y permisos – 4

AdministratorsTODO en TODOS los idiomas

ottimo,

Page 72: Agrovoc cswb training_2

72

Estado de elementos – 1

1. Proposed – por guest or by editor2. Revised – by guest or by editor3. Validated4. Published5. Proposed deprecated6. Deprecated

ottimo,

Page 73: Agrovoc cswb training_2

73

Estado de elementos en ACS – 2

Proposed – Cuando algo está propuesto por primera vez

Revised – Elemento ha sido modificado

•En los 2 casos se distingue si el cambio se hizo Por visitante Por usuario registrados

ottimo,

Page 74: Agrovoc cswb training_2

74

Estados de elementos en ACS – 3Validated

Elemento has sido aceptados por un validator

PublishedElementos ha sido aprobado por un publisher

Proposed deprecatedElemento que ha sido borrados

DeprecatedElemento borrado por validators/publishers

ottimo,

Page 75: Agrovoc cswb training_2

75

Para practicar

Page 76: Agrovoc cswb training_2

76

1: Familiarizar con el tesauro

1. Ir al AGROVOC tesauro2. Buscar el término “leguminosae”3. Anotar sus codigos y observar su “word tree”4. Buscar traduciones en ES, EN, FR, IT, PT, AR5. Mirar a su UF6.Visualizar la versión XML/RDF 7.Comparar lo que se visualiza en la página con lo que se ve en la versión XML/RDF

ottimo,

Page 77: Agrovoc cswb training_2

77

2: Entrar como visitante

1. Ingresar como visitor2. Buscar “leguminosae” 3. Oservar cual operaciones son permitidas4. Escoger los idiomas AR, EN (all), ES (all)5. Marcar “Show URI” 6. Marcar “Show also non-preferred terms”7. Observar como cambia la información en la interface

ottimo,

Page 78: Agrovoc cswb training_2

78

3: Roles y permisos

1. Ir a http://aims.fao.org/es/workbench/help/users 2. Comparar lo que se puede / no se puede hacer en la GUI con lo que esta descrito en el documento3. ¿Hay diferencias? ¿Cuales?4. Tomar nota de las diferencias y de eventuales preguntas

ottimo,

Page 79: Agrovoc cswb training_2

79

4: Problemas

1. Ir al issue tracker http://code.google.com/p/agrovoc-cs-workbench/1. Buscar temas sobre “concept”2. Leer un par de temas y observar la estructura del reporte3. Pedir una cuenta a Sachit [email protected]

Page 80: Agrovoc cswb training_2

80

5: Non registered user

1. Ingresar como non registered user 2. Escoger los idiomas AR, EN (all), ES (all)3. Observar cuales menus son activados4. Muestrar URI 5. Muestrar terminos no preferidos6. Observar que se ve en la interface

ottimo,

Page 81: Agrovoc cswb training_2

81

6: Ingresar como term editor – 1

1. Ingresar como “term editor” 2. Escoger los idiomas EN (all), ES (all)3. Buscar “leguminosae” 4. Crear un nuevo concepto “guaba” bajo ello5. Asignar una etiqueta in ES-EA6. Seguir las istructiones 7. Añadir términos en chino8. Observar que se ve en la interface9. Cambiar idioma y agregar chino

ottimo,

Page 82: Agrovoc cswb training_2

82

7: Ingresar como term editor – 2

1. Siguendo el ejercicio precedente, observar cuales menus son activados2. Añadir una definicion in ES al concepto3. Ir a la pestaña “History” y leer lo que hay4. Ir a la pestaña “Note” y agregar una nota editoriale

ottimo,

Page 83: Agrovoc cswb training_2

83

8: Ingresar como concept editor

1.Ingresar como concept editor2.Leer la lista de cambios (“Recente changes”)3.Buscar “guaba”4.Borrar el concepto5.Ir a la la pestaña “History” y leer lo que hay

ottimo,

Page 84: Agrovoc cswb training_2

84

9: Ingresar como publisher

1. Ingresar como publisher2. Ir a “Validation”3. Buscar el ultimo cambio hecho por ti4. Rechazarlo

ottimo,

Page 85: Agrovoc cswb training_2

85

10: Leer la documentación

1. Ir a ftp://ftp.fao.org/docrep/fao/010/ai144e/ai144e00.pdf

2. Leer el documento 3. ¿Que diferencias se notan con lo que hiciste

hasta ahora?

ottimo,

Page 86: Agrovoc cswb training_2

86

Todo claro?

ottimo,