1
Agentes Inteligentes, PEAS, Ambientes e Tarefas
Prof. Alexandre Monteiro
Recife
Contatos
Prof. Guilherme Alexandre Monteiro Reinaldo
Apelido: Alexandre Cordel
E-mail/gtalk: [email protected]
Site: http://www.alexandrecordel.com.br/fbv
Celular: (81) 9801-1878
Roteiro
O que é um Agente Racional (Inteligente)?
Qual sua utilidade em IA?
Ambientes e arquiteturas
Aplicações
Estado atual do conceito de agente
4
Agente Racional
Um programa de IA pode ser visto como um Agente Racional.
Agente Racional é aquele que faz tudo certo, ou seja, tudo
certo visando o objetivo.
sensoresAgente
atuadoresa m
b i e
n t
e
Raciocinadormodelo do ambiente
O que é um agente Agente é qualquer entidade que:?
• percebe seu ambiente através de sensores (ex. câmeras, microfone, teclado, finger...)
• age sobre ele através de atuadores (ex. vídeo, auto-falante, impressora, braços, ftp, ...)
Mapeamento: seqüência de percepções => ação
?
6
Medida de Desempenho (MD) Critério que define o grau de SUCESSO de um agente
na realização de uma dada tarefa
• Esta medida deve ser imposta do exterior • Má escolha da MD pode acarretar
comportamento indesejado• Compromissos entre objetivos múltiplos
conflitantes• Resta o problema de saber quando avaliar o
desempenho• Ex. aspirador de pó, provador de teoremas,
filtragem de e-mails, policial de trânsito, avaliador de clima...
7
Agente Racional (McCarthy & Hayes 69, Newell 81) Agente Racional: fazer a melhor coisa possível
• segue o princípio da racionalidade: dada uma seqüência de percepções, o agente escolhe, segundo seus conhecimentos, as ações que satisfazem melhor seu objetivo.
Problema• estado inicial + ações => estado final (objetivo)
Racionalidade ¹ Onisciência, limitações de:• sensores• atuadores• raciocinador (conhecimento, tempo, etc.)• Agir para obter mais dados perceptivos é racional
Racionalidade vs. Onisciência
Racionalidade: maximiza o desempenho esperado.• Medida do desempenho que define o critério de
sucesso• Conhecimento anterior que o agente tem do ambiente.• As ações que o agente pode executar• A sequência de percepções do agente até o momento
Onisciência: maximiza o desempenho real.• O agente sabe o resultado real de suas ações e pode
agir de acordo com ele.
Ex: Avião de Eduardo Campos, improvável noticiar que ele foi idiota por pegar aquele avião.
9
Exploração e Aprendizagem
Exploração
• Tem a finalidade de modificar percepções futuras, chamada de coleta de informações
•Conhecer mais sobre o ambiente Apredizagem
•A partir da coleta de informações se pode aprender
•Conhecimento a priori, não exige percepção nem aprendizagem
10
Autonomia e Utilidade
Autonomia
• Capacidade de adaptação a situações novas, para as quais não foi fornecido todo o conhecimento necessário com antecedência
• Duas implementações: aprendizagem e/ou programação declarativa
• Independência de conhecimento anterior Para construir um sistema inteligente, utilizamos
• linguagem• inferência• conhecimento
11
A metáfora de agente decompõe1) Problema em: • percepções, ações, objetivos e ambiente (e outros agentes)
2) Tipo de conhecimento em:• Quais são as propriedades relevantes do mundo• Como o mundo evolui• Como identificar os estados desejáveis do mundo• Como interpretar suas percepções• Quais as conseqüências de suas ações no mundo• Como medir o sucesso de suas ações • Como avaliar seus próprios conhecimentos
3) Arquitetura e método de resolução de problema
Agente de Policia
Ambiente
Agenteraciocínio
Conhecimento:- leis- comportamento dos indivíduos,...
Objetivo:- fazer com que as leis sejam respeitadas
Ações:- multar- apitar- parar, ...
execuçãopercepção
Exemplos de AgentesAgente Dados
perceptivos Ações MD - Objetivos Ambiente
Diagnóstico médico
Sintomas, paciente, exames
respostas, ...
Perguntar, prescrever exames,
testar
Saúde do paciente, minimizar custos
Paciente, gabinete, ...
Análise de imagens de
satélite
Pixels imprimir uma categorização
categorizar corretamente
Imagens de satélite
Tutorial de português
Palavras digitadas
Imprimir exercícios, sugestões,
correções, ...
Melhorar o desempenho do
estudante
Conjunto de estudantes
Filtrador de mails
mensagens Aceitar ou rejeitar mensagens
Aliviar a carga de leitura do usuário
Mensagens, usuários
Motorista de taxi
Imagens, velocímetro,
sons
brecar, acelerar, dobrar, falar com
passageiro, ...
Segurança, rapidez, economia,
conforto,...
Ruas, pedestres, carros, ...
Músico de jazz Sons seus e de outros músicos,
grades de acordes
Escolher e tocar notas no andamento
Tocar bem, se divertir, agradar
Musicos, publico, grades
de acordes
Ambiente de Tarefa
PEAS (Performance, Environment, Actuators, Sensors) – desempenho, ambiente, atuadores e sensores.
Ex: Táxi automatizado
Tipo de Agente
Medida Desempenho
Ambiente Atuadores Sensores
Motorista de Táxi
Viagem Segura, rápida, dentro da lei, confortável, maximizar lucros
Estradas, outros tipos de tráfego, pedestres, clientes
Direção, acelerador, freio, sinal, buzina, visor
Câmeras, sonar, velocímetro, GPS, hodômetro, sensores do motor, teclado
15
Propriedades de Ambientes de Tarefas
Classes de ambientes• Físico: robôs• Software: softbots• Realidade virtual (simulação do ambiente físico): softbots e avatares
Propriedades de um ambiente• Acessível (completamente observável) x inacessível (parcialmente
observável) • Estático (não muda) x dinâmico (muda) – semidinâmico (ações)• Determinista (conhece próximo estado) x estocástico (ñ-determinista)• Discreto x contínuo• Episódico (só depende das ações anteriores) x não-episódico
(seqüêncial)• tamanho: número de percepções, ações, objetivos,...• Discreto (xadrez) x contínuo (dirigir táxi)• Agente único x multiagente
16
Ambientes: propriedades (1/2) Acessível: quando os sensores do agente
conseguem perceber o estado completo do ambiente.
Determinístico: o próximo estado do ambiente pode ser completamente determinado pelo estado atual e as ações selecionadas pelo agente.
Episódico: a experiência do agente é dividida em episódios. Cada episódio consiste em o agente perceber e então agir. Cada episódio não depende das ações que ocorreram em episódios prévios.
17
Ambientes: propriedades (2/2) Estático: o ambiente não muda enquanto o agente
está escolhendo a ação a realizar. • Semi-dinâmico: o ambiente não muda
enquanto o agente delibera, mas o "score" do agente muda.
Discreto: quando existe um número distinto e claramente definido de percepções e ações em cada turno.
Contínuo: percepções e ações mudam em um espectro contínuo de valores.
Exemplos de AmbientesAgente acessível determinista episódico estático discreto
xadrez sem relógio Sim Sim Não Sim Sim
xadrez com relógio Sim Sim Não Semi sim
gamão sim não não sim sim
motorista de taxi Não Não Não Não Não
médico Não Não Não Não Não
tutor Não Não Não Não Sim
Analisador de imagem Sim Sim Sim Semi Não
Busca na web Não Não Sim Não Sim
Filtrador de mail Sim Não Sim Não Sim
Músico Sim Não Não Não Não
+ O Tamanho do ambiente é dado por:número de percepções, ações e objetivos possíveis
19
Algoritmo Básico
Função agenteSimples (percept) retorna açãomemória := atualizaMemória (memória, percept)
ação := escolheMelhorAção(memória)
memória := atualizaMemória (memória, ação)
retorna ação
Arquiteturas• Agente tabela• Agente reativo simples• Agente reativo baseado em modelos • Agente baseado em objetivos • Agente baseado em utilidade • Agente com aprendizagem autonomia
complexidade
ambiente
sensores
atuadores
Tabelapercepções ações
. .
. .
Agente
Agente Tabela (chave-valor)
Limitações• Mesmo Problemas simples -> tabelas muito grandes
- ex. xadrez 30^100
• Nem sempre é possível, por ignorância ou questão de tempo, construir a tabela
• Não há autonomia nem flexibilidade• Este agente só tem fins didáticos!!! Não vale nem a pena pensar nele
Ambientes• acessível, determinístico, episódico, estático, discreto e minúsculo!
Agente sensores
atuadores
Qual a aparência atual do mundo?
Que ação devo executar agora? Regras “condição-ação”
a m
b i e
n t
e
Agente Reativo Simples (percepção atual)
Vantagens e desvantagens• Regras condição-ação: representação inteligível, modular e eficiente
- ex. Se velocidade > 60 então multar• Não pode armazenar uma seqüência de percepções, pouca
autonomia
Ambientes:• Reflexo imprescindível em ambientes dinâmicos • Acessível, episódico, pequeno
Agente Reativo Baseado em Modelos
sensoresAgente
Qual é a aparência atual mundo?
Regras “condição-ação”
estado: como o mundo era antes
como o mundo evolui
atuadores
Que ação devo executaragora?a
m b
i e
n t
e
impacto de minhas ações
Desvantagem: pouca autonomia• não tem objetivo, não encadeia regras
Ambientes: determinístico e pequeno• Ex. Tamagotchi
Controla o estado atual e depois Agente Reativo Simples
sensoresAgente
Qual a aparência atual domundo?
Objetivos
como o mundo evolui
atuadores
Que ação devo executaragora?
a m
b i e
n t
e
impacto de minhas açõesQual será a aparência se forexecutada a ação A?
estado: como o mundo era antes
Agente Baseado em Objetivo
Vantagens e desvantagens:• Mais complicado e ineficiente, porém mais flexível, autônomo• Não trata objetivos conflitantes
Ambientes: determinístico • ex.: xeque-mate no xadrez
Agente Baseado em Utilidade
Ambiente: sem restrição Desvantagem: não tem adaptabilidade Ex. motorista recifence
ambiente
sensores
atuadores
Agente
Qual a aparência atual domundo?
Que ação devo executar agora?
Função de Utilidade
qual é o impacto de minhas ações
como o mundo evolui
Este novo mundo é melhor?
Qual será a aparência se forexecutada a ação A?
estado: como o mundo era antes
Agente com Aprendizado
sensores
atuadores
Agente
Gerador de problemas
crítico
elemento de aprendizagem
avaliação
objetivos de aprendizagem
elemento de desempenho (agente)
trocas
conhecimento
a m
b i e
n t
e
Ambiente: sem restrição Vantagem: tem adaptabilidade (aprende) Ex. motorista sem o mapa da cidade
t
t+1
t
26
Simulação do Ambiente Às vezes é mais conveniente simular o ambiente
• mais simples• permite testes prévios• evita riscos, etc...
O ambiente (programa)• recebe os agentes como entrada• fornece repetidamente a cada um deles as percepções
corretas e recebe as ações• atualiza os dados do ambiente em função dessas ações
e de outros processos (ex. dia-noite)• é definido por um estado inicial e uma função de
atualização• deve refletir a realidade
27
Simulação de ambiente função simulaAmbiente (estado,
funçãoAtualização,agentes,final)repita
para cada agente em agentes faça
Percept[agente] := pegaPercepção(agente,estado)
para cada agente em agentes faça
Action[agente] := Programa[agente] (Percept[agente])
estado := funçãoAtualização(ações, agentes, estado)
scores := avaliaDesempenho(scores,agente,estado) //opcional
até final
Observação:
• não cair em tentação “roubando” do ambiente a descrição do que aconteceu. Usar a memória do agente!
28
Inteligência Coletiva Porque pensar a inteligência/racionalidade como
propriedade de um único indivíduo?
Não existe inteligência ...• Em um time de futebol? • Em um formigueiro?• Em uma empresa (ex. correios)?• Na sociedade?
Solução: IA Distribuída• Agentes simples que juntos resolvem problemas
complexos tendo ou não consciência do objetivo global• Proposta por Marvin Minsky e em franca expansão...• o próprio ambiente pode ser modelado como um agente
29
1
53
4
8
6
7
2
1
5
3
4
8
6
7
2F 1
53
4
8
6
7
2
IA Distribuída: dois tipos de sistemas Resolução distribuída de problemas
• consciência do objetivo global e divisão clara de tarefas• Exemplos: Robótica clássica, Busca na Web, Gerência de
sistemas distribuídos, ...
Sistemas Multi-agentes• não consciência do objetivo global e nem divisão clara de
tarefas• Exemplos: n-puzzle, futebol de robôs, balanceamento de
carga, robótica, ...
30
Questões
Questões centrais• comunicação• negociação (ex. compra-venda na Web)• estados mentais• crença, ...
Tensão (trade-off)• Quanto mais agentes, mais simples (sub-
dividido) fica o problema • No entanto, mais complexa fica a
comunicação e coordenação entre os agentes
Mundo WUMPUS
Mundo WUMPUS
O mundo de Wumpus é um problema didático onde o objetivo é encontrar um monte de ouro em uma de 16 salas possíveis.
Para isso o agente deve evitar as salas que contém poços sem fundo e a sala onde está o Wumpus. O ambiente do mundo de Wumpus contém:• Wumpus, que é monstro que devora qualquer guerreiro que entrar em sua
sala.• Malha 4×4 de salas conectadas por passagens.• Ouro em alguma sala.• Poços sem fundo nos quais cairá qualquer um que vagar por esta sala,
exceto o Wumpus. • O agente pode matar o Wumpus, porém possui apenas uma flecha para
fazer isso.• O agente sempre começa no quadrado identificado como [1,1] voltado
para a direita. • As posições do Wumpus, ouro e poços são escolhidas ao acaso
Mundo WUMPUS
O agente que vasculhará o mundo de Wumpus em busca do ouros possui as seguintes características:• Medida de desempenho: +1.000 por pegar ouro, -1.000 se
cair em um poço ou for devorado pelo Wumpus, -1 para cada ação executada, -10 pelo uso da flecha
• Atuadores: O agente pode mover-se para frente, virar à esquerda, virar à direita, agarrar um objeto e atirar a flecha
• Sensores: fedor (quadrados adjacentes ao Wumpus, exceto diagonal), brisa (quadrados adjacentes a um poço, exceto diagonal), resplendor (quadrados onde existe ouro), impacto (ao caminhar para uma parede) e audição (percebe o grito do Wumpus ao morrer).
• Agente não conhece a configuração do ambiente.
Mundo WUMPUS
Desenvolva um sistema que implemente um agente que explore autonomamente o Mundo de Wumpus instanciado de acordo com a figura vista no início desta especificação de trabalho. O sistema deverá ter as seguintes características:• Interface gráfica que permita visualizar o mundo de Wumpus e
a movimentação do agente pelo conjunto de 16 salas;• Quando for encontrado o ouro, o agente deverá ir para a sala
que contém o ouro e assim finalizar a execução do programa;• Deverá se levar em consideração as medidas de desempenho
apresentadas nesta descrição de trabalho, de modo que o agente deverá encontrar o ouro escolhendo o caminho com o menor custo possível;
• Deverá ser apresentado ao usuário do sistema as atualizações que serão feitas nos sensores do agente de acordo com as respostas fornecidas a partir de inferências.
35
Evolução da noção de Agente além das fronteiras da IA....
36
Agente: ainda não há uma definição única IBM: Intelligent agents are software entities that carry
out some set of operations on behalf of an user, and in doing so employ some knowledge representation of the user’s goals or desires
KidSim: Agent is a persistent software entity (agents have their own ideas about how to accomplish tasks) dedicated to a specific purpose (smaller than multifunctions applications)
SodaBot: Software agents are programs that engage in dialogs to negotiate and coordinate transfer of information
37
Técnicas & ProblemasAntes....
programas
IA
programas
Agora
agentes móveis,agentes de software,robôs, ...
agentes inteligentes
38
Propriedades Autonomia (IA)• raciocínio, comportamento guiado por
objetivos • reatividade
Adaptabilidade & aprendizagem (IA)
Comunicação & Cooperação (IA)
Personalidade (IA)
Continuidade temporal
Mobilidade
39
Agentes na Internet
Categorias por Tipos de Serviços:• Agentes de Busca e Recuperação (ex.
Altavista) • Agentes que Filtram Informações (ex. KOM)• Agentes de Entrega Off-line (ex. PointCast)• Agentes Notificadores (ex. URL-Minder)• Agentes de Suporte ao Comércio (ex.
BargainBot)• Agente corretor (interoperabilidade - ACL)• Outros...
40
Conclusões Agentes em IA
• Metodologia (metáfora) para projeto de sistemas• Sistemas multi-agentes e robótica
Agentes em computação
• Adoção de uma nova metáfora (antropomórfica e sociológica). Extrapolação de OOP- IA: autômato -> mente- Agentes: objetos -> pessoas
• Integração de técnicas de IA
• Novas tecnologias próprias à Web (ex. mobilidade)
• Marketing (moda)
Agentes: técnica ou metodologia ?
41
Desenvolvimento de software inteligente Projeto:
• Modelar tarefa em termos de ambiente, percepções, ações, objetivos e utilidade
• Identificar o tipo de ambiente• Identificar a arquitetura de agente adequada
ao ambiente e tarefa
Implementação• o gerador e o simulador de ambientes• componentes do agente (vários tipos de
conhecimento)• Testar o desempenho com diferentes
instâncias do ambiente
42
Referências T. Mitchell. Machine Learning. McGraw Hill, New
York, 1997.
Stuart Russell and Peter Norvig, Artificial Intelligence - A Modern Approach. Prentice Hall, 1995.