cristina mota encontro do segundo harem universidade de aveiro, 7 de setembro de 2008
TRANSCRIPT
Cristina Mota
Encontro do Segundo HAREMUniversidade de Aveiro, 7 de Setembro de
2008
Opções Adicionais de Anotação
Motivação: durante o processo de anotação mostrou-se necessário esclarecer dúvidas com o grupo propente
Resultado: documentámos a resposta a essas dúvidas
Opções Adicionais de AnotaçãoTEMPO clássico
Extensão da entidade quando incluída numa expressão que toda ela responde adequadamente a "(prep) quando?" ou "quando?"
Extensão da entidade quando a expressão é constituída por DATA e HORA
Classificação como GENERICO
<EM ID="ric-22961-209“ CATEG="TEMPO" TIPO="GENERICO" >nos tempos</EM> em que São Paulo amanhecia mais surpreendente
nasceu <EM ID=" hub-71248-191" CATEG="TEMPO" TIPO="TEMPO_CALEND“ SUBTIPO="HORA">aos 30 segundos</EM> <EM ID="hub-71248-192" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de hoje</EM>
situado <EM ID=" H2-dhy6432-141" CATEG="TEMPO" TIPO="GENERICO">nos dias de hoje</EM> no Paquistão [*quando é que estava [Mehrgarh] situada no Paquistão? / nos dias de hoje]
Opções Adicionais de AnotaçãoTEMPO clássico
Classificação como DURACAO
Classificação de expressões iniciadas por "há“
Ausência de marcação
<EM ID="aa87333-155" CATEG="TEMPO" TIPO="DURACAO">durante um período</EM> de férias
o CCB iniciava, <EM ID="Ntyr-78-400" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">há quinze anos</EM>, a sua actividade é um projeto que vem sendo realizado <EM ID="bob-14949-607" CATEG="TEMPO" TIPO="DURACAO">há mais de dois anos</EM>
"bimestral" em "com periodicidade bimestral""mais uma vez" e "outra vez"
Opções Adicionais de AnotaçãoTEMPO estendido
Expressões compostas por data absoluta e data referencial
Expressões com valor de data sem nenhum dos campos ANO-MES-DIA especificado
<EM ID="hub-18050-209" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA" TEMPO_REF="TEXTUAL" SENTIDO="SIMULT" VAL_DELTA="">a 30 desse mês </EM>
<EM ID="ric-54609-190" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA" TEMPO_REF="ABSOLUTO" VAL_NORM="">nos anos 90</EM>
Opções Adicionais de AnotaçãoTEMPO estendido
Expressões com valor simultâneo
Preenchimento de VAL_DELTA e VAL_NORM na ausência total de informação
<EM ID="aa33715-460" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA" TEMPO_REF="ENUNCIACAO" SENTIDO="SIMULT" VAL_DELTA="">este ano </EM>
<EM ID="aa94781-176" CATEG="TEMPO" TIPO =" DURACAO" VAL_NORM="">Há anos</EM>
CD TEMPO (1)DOCS: 30Parágrafos: 304Palavras: 12992Entidades: 1508Entidades vagas: 118 [21 classes]Entidades TEMPO: 232 [15.38%]
Distribuição de categorias
CD TEMPO (2)
Categorias associadas às entidades
Classes de vagueza
CD TEMPO (3)
Avaliação do TEMPO
N
n
certostnsubtipos
certotntipos
certacncats1
_)1
1(_)1
1(_)1
1(1
M
n
espuriostnsubtipos
espuriotntipos
espuriacncats1
_1
_1
_1
s_certo*
tr_certo*
lim_certo) + M_certo + (H_certo *
lim_certo + ES_certa + M_certo + H_certo + D_certo + A_certo + (E_certa *
vn_certo*
vd_certo*
HAREM Clássico
TEMPO estendido completo
HAREM estendido sem normalização
HAREM estendido só normalização
TEMPO_REF
SENTIDO
VAL_DELTA
VAL_NORM DURACAO
VAL_NORM DATA
VAL_NORM HORA
ParticipantesSistema TEMP
OComTIPO
ComSUBTIPO
SENTIDO
TEMPO_REF
Norm
Cage2
DobrEM
PorTexTO
Priberam
R3M
REMBRANDT
REMMA
SEI-Geo
SeRELeP
XIP-L2F/Xerox
Resultados (1)
Resultados (2)
Comentários finaisAlgum grau de desadequamento em relação
ao modelo semântico do HAREMGENERICO, por exemplo, pode não ter valor
temporal:Dezembro tem 8 letras
Avalição dos atributos estendidos combinada ou separada da avaliação clássica?
O processo de anotação podia ter beneficiado por ter colaboração de um dos proponentes
Agradecimentos
A Linguateca e o HAREM são financiados através do contrato nº 339/1.3/C/NAC, financiado pelo governo português e pela União Europeia, e executado pela FCCN.
15