apresentação artigo mestrado
DESCRIPTION
O presente artigo escrito pela Natalya Noy e Mark Musen, visa demonstrar uma ferramenta de fusão e alinhamento de ontologiaTRANSCRIPT
Fábio Vieira
Orientadora: Profª Drª. Rosario Girardi
PROMPT: Algorithm and Tool for Automated Ontology Merging and Alignment
Natalya Fridman Noy and Mark A. Musen
Recuperação e Filtragem de Informação
Roteiro
• Conceitos e motivação• Algoritmo de fusão de ontologia PROMPT
– Algoritmo incremental (PROMPT)– Algoritmo estatístico (Anchor-PROMPT)
• As ferramentas• Avaliação• Trabalhos futuros
Fábio Vieira- UFMA12 de abril de 2023 2
O que estavamos tentando descobrir
• O benefício que a ferramenta oferece–Benefício da produtividade–Melhoria da qualidade nos resultados da ontologia
–Satisfação do usuário• Precisão e recall de sugestões das
ferramentasFábio Vieira- UFMA12 de abril de 2023 3
Perguntas que fizemos
• Quão boas são as sugestões e estratégias de resolução de conflitos do PROMPT?
• O PROMPT fornece algum benefício quando comparado a uma ferramenta de edição de ontologia genérica (Protégé-2000)?
Fábio Vieira- UFMA12 de abril de 2023 4
Ontologias
O = (C, H, I, R, P, A)– C = CC U CI é
– H = {tipo_de (c1,c2) | c1 CC c2 CC }
– I = {é_um (c1,c2) | c1 CI c2 CC }
– R = {relk (c1,c2,..., cn) | i, ci C}
– P = {propC (ck, tipo) | ck ∈ CC} {propI (ck, valor) | ck ∈ CI}
– A = {condiçãox conclusãoy (c1, c2,..., cn) | j, cj CC}
Fábio Vieira- UFMA12 de abril de 2023 5
Por que nós Precisamos de Ontologias
• Fornece um vocabulário compartilhado para diferentes aplicações em um domínio
• Permite interoperação entre aplicações utilizando fontes de dados diferentes do mesmo domínio
Fábio Vieira- UFMA12 de abril de 2023 6
Ontologias estão em toda Parte
• Ontologias têm sido utilizados em projetos acadêmicos por um longo tempo– Compartilhamento de conhecimento e
reutilização– Reutilização de métodos de resolução de
problemas
• Ontologias estão se tornando amplamente utilizada fora da academia– Categorização de sites Web (Yahoo!, por
exemplo)– Catálogos de produtos
Fábio Vieira- UFMA12 de abril de 2023 7
Necessidade de Fusão das Ontologias
• Existe uma sobreposição significativa em ontologias existentes– Yahoo! e DMOZ Open Directory– Catálogos de produtos para domínios similares
Necessidade de Fusão e Integração das Ontologias
• Workshop sobre "Ontologias e Compartilhamento de Informações" no IJCAI'2001–6 dos 18 trabalhos (1/3) abordaram a fusão e integração das ontologia
Fábio Vieira- UFMA12 de abril de 2023 9
O que é fusão da Ontologia
Fábio Vieira- UFMA12 de abril de 2023 10
Abordagens Existentes
• Design e integração de ontolgia– Correspondência de termos (Stanford SKC, ISI)– Gráficos com base em análises (Stanford SKC)– Operadores de transformação (Ontomorph at
ISI)– Ferramentas de fusão (Chimaera at Stanford
KSL)
Fábio Vieira- UFMA12 de abril de 2023 11
Abordagens Existentes (II)
• Base de Dados– Desenvolver mediadores e providenciar
wrappers– Definir um modelo de dados comum e
mapeamentos– Definir regras de correspondências para
traduzir diretamente
Fábio Vieira- UFMA12 de abril de 2023 12
Roteiro
• Conceitos e motivação• Algoritmo de fusão de ontologia PROMPT
– Algoritmo incremental (PROMPT)– Algoritmo estatístico (Anchor-PROMPT)
• As ferramentas• Avaliação• Trabalhos futuros
Fábio Vieira- UFMA12 de abril de 2023 13
PROMPT
• Nossa abordagem é:– Automação parcial– Algoritmos baseados em
• Conceitos de representação de estrutura• Relações entre conceitos• Ações dos usuários
• Nossa abordagem não é:– Automação completa– Algoritmo para correspondência de nomes
de conceito
Fábio Vieira- UFMA12 de abril de 2023 14
Modelo de Conhecimento
• Um modelo de conhecimento genérico - OKBC (Open Knowledge-Base Connectivity Protocol)– Classes
• Coleções de objetos com propriedades semelhantes• Organizadas em subclasses - uma hierarquia de
superclasses– Instâncias
• É um ser único de uma classe– Slots
• São as relações entre indivíduos ou as propriedades– Facetas
• Restrições sobre os valores slot (cardinalidade, min, max)
Fábio Vieira- UFMA12 de abril de 2023 15
Faça sugestões iniciais
Selecione a próxima operação
Realize atualizações automáticas
Encontre conflitos
Dê sugestões
O Algoritmo PROMPT
Fábio Vieira- UFMA12 de abril de 2023 16
Example: merge-classes
Fábio Vieira- UFMA
Agencyemployee
Agent
Customer
subclass of
agent for
Agent
Employee
Traveler
subclass of
has client
Agencyemployee
Agent
Employee
Customer Traveler
subclass of subclass of
agent for has client
12 de abril de 2023 17
Analisando Propriedades Globais de Localização
• Propriedades globais– Classes que têm os mesmos conjuntos de slots– Classes que se referem ao mesmo conjunto de
classes– Slots que estão ligados à mesma classe
• Contexto local– Análise incremental– Considerar apenas os conceitos que foram
afetados pela última operação
Fábio Vieira- UFMA12 de abril de 2023 18
O Conjunto de Operações do PROMPT
• Extensão das operações do OKBC com as operaçõs de fusões das ontologias– Fusão de classes– Fusão de slots– Fusão de instâncias– Cópia de uma classe
• Profunda ou superficial• Com ou sem subclasses• Com ou sem instâncias
Fábio Vieira- UFMA12 de abril de 2023 19
Depois que um Usuário Realiza uma Operação
• Para cada operação– Executa a operação– Considera possíveis conflitos
•Identifica conflitos•Propõe soluções
– Analiza o contexto local– Cria novas sugestões – Reforça ou menciona sugestões
existentes
Fábio Vieira- UFMA12 de abril de 2023 20
Conflitos
• Conflitos identificados no PROMPT– Conflitos de nomes– Redudância em uma hierarquia de
classes– Valores de slots com restrições que
violam a herança de classes
Fábio Vieira- UFMA12 de abril de 2023 21
Agent Agent
Agent
Exemplo: merge-classes
Fábio Vieira- UFMA12 de abril de 2023 22
Operação para: fusão de classes
• Verificar os slots de uma classe• Modelos de slots• Subclasses e superclasses• Conflitos• Sugestões
Fábio Vieira- UFMA12 de abril de 2023 23
Agent Agent
Agent
agent for
Modelo de Slots
Cópia de modelo de slots que não existe na fusão da ontologia
Fábio Vieira- UFMA
agent for
12 de abril de 2023 24
Agent Agent
Agent
has client
clientclient
Modelo de Slots
Anexar os slots que já foram mapeados
Fábio Vieira- UFMA12 de abril de 2023 25
Employee
Subclasses e Superclasses
Se uma superclasse (subclass) existe, reestabeleça as ligações
Fábio Vieira- UFMA
Agent Agent
Agent
Agencyemployee
superclass
superclass
12 de abril de 2023 26
Agentclient
has client
Sugestões Adicionais: Fusão de Slots
Se os nomes dos slots numa fusão de classes são similares, ele sugere uma fusão de slots
Fábio Vieira- UFMA12 de abril de 2023 27
Agent
Sugestões Adicionais: Fusão de Classes
Se o conjunto de classes referenciadas pela classe fundida é o mesmo que o conjunto de classes referenciada por outra classe, sugere-se uma fusão
Fábio Vieira- UFMA
ReservationClient
hasclients
handlesreservations
Agency employee
12 de abril de 2023 28
Employee Agencyemployee
Agent
Sugestões Adicionais: Fusão de Classes
Se os nomes das superclasses (subclasses) são similares a classe fundida, sugere-se a fusão das classes
Fábio Vieira- UFMA
superclasssuperclass
12 de abril de 2023 29
Resumo• Realizar a operação atual• Para os conceitos (classes, slots, e
instâncias) diretamente ligado à operações de argumentos– Realizar uma análise global para
novas sugestões– Realizar uma análise global para
novos conflitos
Fábio Vieira- UFMA12 de abril de 2023 30
Roteiro
• Conceitos e motivação• Algoritmo de fusão de ontologia PROMPT
– Algoritmo incremental (PROMPT)– Algoritmo estatístico (Anchor-PROMPT)
• As ferramentas• Avaliação• Trabalhos futuros
Fábio Vieira- UFMA12 de abril de 2023 31
Protégé-2000
• Um ambiente para– Desenvolvimento de Ontolgoia– Aquisição de Conhecimento
• Interface de manipulação• Extensibilidade
– Capacidade de conectar novos componentes
32Fábio Vieira- UFMA12 de abril de 2023
Ontologias no Protégé-2000
33Fábio Vieira- UFMA12 de abril de 2023
Ferramenta PROMPT baseado no Protégé
• Protégé-2000– Tem um modelo de conhecimento
compatível com OKBC– Permite a construção de extensões
através de um mecanismo de plugin•Pode funcionar como um servidor de base de conhecimento para os plugins
34Fábio Vieira- UFMA12 de abril de 2023
The PROMPT tool
35Fábio Vieira- UFMA12 de abril de 2023
Características da ferramenta PROMPT
• Definição de uma ontologia preferida• Mantém o foco do usuário• Fornece feedback para o usuário• Preserva as relações originais
– Relações superclasse-subclasse– Adição de slot– Valores facetas
• Ligação direta para manipular o editor da ontologia
• Operações de Logging
36Fábio Vieira- UFMA12 de abril de 2023
Roteiro
• Conceitos e motivação• Algoritmo de fusão de ontologia PROMPT
– Algoritmo incremental (PROMPT)– Algoritmo estatístico (Anchor-PROMPT)
• As ferramentas• Avaliação• Trabalhos futuros
37Fábio Vieira- UFMA12 de abril de 2023
Avaliação
• Sistemas baseado em conhecimento são raramente avaliados
• Podemos usar as abordagens de engenharia de software para avaliar empiricamente as ferramentas
• Precisamos desenvolver medições adicionais para base de conhecimento
38Fábio Vieira- UFMA12 de abril de 2023
Fonte de ontologia para os experimentos
• Duas ontologias de resolução de problemas– Ontologia para linguagem unificada
para o desenvolvimento de métodos de resolução de problemas (UPML)
– Ontologia para linguagem de descrição de métodos (MDL)
39Fábio Vieira- UFMA12 de abril de 2023
Experimento 1: Avaliar a qualidade das sugestões do
PROMPT’s• Métricas
– Precisão– Recall
• Método– Registro
automático– Relatório de
dados automático
Fábio Vieira- UFMA
40
Sugestões que a
ferramenta produziu
Operações que o
usuário realiza
Sugestão que o usuário
seguiu
12 de abril de 2023
Resultados: a qualidade das sugestões do PROMPT’s
41
Fábio Vieira- UFMA
Sugestões que os usuários seguiram
Estratégias de resolução de conflitos que os usuários seguiram
Base de conhecimento gerada automaticamente
90% 75%
74%
12 de abril de 2023
Trabalhos futuros
• Ampliar o conjunto de heurísticas que o PROMPT usa para guiar os especialistas
• Estender as técnicas para o alinhamento das ontologias
• Desenvolver protocolos e métricas para uma avaliação mais detalhada das ferramentas
42
Fábio Vieira- UFMA12 de abril de 2023
http://protege.stanford.edu
http://www.isi.edu/info-agents/courses/iiweb/kushmerick-ijcai97.pdf
http://www.google.com.br/url?sa=t&rct=j&q=prompt
%20algorithm&source=web&cd=1&ved=0CB0QFjAA&url=http%3A%2F%2Finfolab.stanford.edu
%2Finfoseminar.Archive%2FSpringY2001%2Fspeakers%2Fnfridmannoy%2Fslides.ppt&ei=UAy4TsW2MpPUgQfdgsSRBA&usg=AFQjCNG1PEtMGlr4ppxXBcFlDC11F04gHw
&sig2=Ob9zttxkSStigW9KBLCbZw
Referências