muestreo bayesiano en robots moviles 0

184
Universidad de Alicante Aplicación del muestreo bayesiano en robots móviles: estrategias para localización y estimación de mapas del entorno Domingo Gallardo López 1999 Tesis de Doctorado Facultad: Escuela Politécnica Superior Directores: Dr. Ramón Rizo Aldeguer Dr. Francisco Escolano Ruiz

Upload: fabianmendoza

Post on 17-Sep-2015

17 views

Category:

Documents


1 download

DESCRIPTION

Uso del teorema de bayes en robot

TRANSCRIPT

  • Universidad de Alicante

    Aplicacin del muestreo bayesiano en

    robots mviles: estrategias para localizacin y estimacin de mapas del

    entorno

    Domingo Gallardo Lpez

    1999

    Tesis de Doctorado Facultad: Escuela Politcnica Superior

    Directores: Dr. Ramn Rizo Aldeguer Dr. Francisco Escolano Ruiz

  • UNIVERSIDAD DE ALICANTE

    Tesis Doctoral

    APLICACIN DEL MUESTREOBAYESIANO EN ROBOTS MVILES:

    ESTRATEGIAS PARA LOCALIZACIN YESTIMACIN DE MAPAS DEL ENTORNO

    Presentada porDomingo Gallardo Lpez

    Dirigida porDr. Ramn Rizo Aldeguer

    Dr. Francisco Escolano RuizDepartamento de Tecnologa Informtica y Computacin

    Mayo de 1999

  • Para Conso

  • Agradecimientos

    En cualquier proyecto de investigacin, y en una tesis doctoral en especial, es fundamentaltener alrededor buenos compaeros con los que compartir el trabajo y las experiencias. Estatesis no hubiera sido posible sin las muchas personas que me han ayudado desde el principio,aportando ideas, propuestas, caminos a seguir o, simplemente, estando ah para discutir ycharlar.

    Me gustara agradecer sinceramente a mi director de tesis, Ramn Rizo, y a mi co-director, Francisco Escolano, por su continuo apoyo, nimo y por todas sus sugerencias. AVicente Botti, Alfons Crespo, Federico Barber y Eva Onainda por lo mucho que aprend enValencia. A Reid Simmons, Rich Goodwin y Hank Wan, por su apoyo y amistad en los mesesen CMU. Por ltimo, a los buenos amigos y compaeros del grupo de investigacin, FaranLlorens, Rosana Satorre, Isabel Alfonso, Pilar Arques y, en especial a Miguel Cazorla yOtto Colomina, por compartir tambin proyectos, ideas y "pizarrn".

    5

  • ndice General

    1 Introduccin 19

    2 Localizacin y mapeado en entornos de oficina 252.1 Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262.2 Modelos del entorno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

    2.2.1 Mapas topolgicos . . . . . . . . . . . . . . . . . . . . . . . . . . 282.2.2 Rejillas de ocupacin . . . . . . . . . . . . . . . . . . . . . . . . . 292.2.3 Modelos geomtricos . . . . . . . . . . . . . . . . . . . . . . . . . 30

    2.3 Aproximaciones al problema de la localizacin . . . . . . . . . . . . . . . 332.3.1 Localizacin local . . . . . . . . . . . . . . . . . . . . . . . . . . 332.3.2 Localizacin global . . . . . . . . . . . . . . . . . . . . . . . . . . 35

    2.4 Aproximaciones al problema del mapeado . . . . . . . . . . . . . . . . . . 362.5 Fundamentos de la localizacin bayesiana . . . . . . . . . . . . . . . . . . 37

    2.5.1 Definiciones y consideraciones previas . . . . . . . . . . . . . . . 382.5.2 Actualizacin de la probabilidad a posteriori . . . . . . . . . . . . 402.5.3 Estimacin de la funcin de densidad a posteriori . . . . . . . . . . 41

    2.6 Fundamentos del mapeado bayesiano . . . . . . . . . . . . . . . . . . . . 432.7 Discusin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

    3 Un modelo estocstico del sonar 473.1 Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 473.2 Caractersticas del sonar . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

    3.2.1 Funcionamiento del transductor de ultrasonidos Polaroid . . . . . . 493.2.2 Errores de medida en las lecturas del sensor de ultrasonidos . . . . 513.2.3 Anillo de sonares . . . . . . . . . . . . . . . . . . . . . . . . . . . 533.2.4 Experimentacin . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

    3.3 Modelo de interaccin del sensor de ultrasonidos . . . . . . . . . . . . . . 583.3.1 Modelo fsico del sensor de ultrasonidos . . . . . . . . . . . . . . . 59

    7

  • 8 NDICE GENERAL

    3.3.2 Extensin del modelo para contemplar mltiples reflexiones . . . . 613.4 Simulacin del sonar mediante trazado de rayos . . . . . . . . . . . . . . . 65

    3.4.1 Trazado de rayos . . . . . . . . . . . . . . . . . . . . . . . . . . . 653.4.2 Simulacin del sonar . . . . . . . . . . . . . . . . . . . . . . . . . 663.4.3 Parmetros del modelo y del algoritmo . . . . . . . . . . . . . . . 703.4.4 Ajuste off-line de los parmetros del modelo . . . . . . . . . . . . 73

    3.5 Modelo estocstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 763.5.1 Sonar nico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 763.5.2 Anillo de sonares . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

    3.6 Discusin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

    4 Modelos para la estimacin bayesiana 814.1 Mapas del entorno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 814.2 Modelo de observacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

    4.2.1 Formulacin general . . . . . . . . . . . . . . . . . . . . . . . . . 844.2.2 Funciones de probabilidad condicional . . . . . . . . . . . . . . . 864.2.3 Experimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

    4.3 Modelo dinmico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 944.4 Discusin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

    5 Localizacin basada en filtros de partculas 975.1 Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 975.2 Filtro bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 985.3 Justificacin terica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1025.4 Aplicacin a la estimacin de elementos topolgicos . . . . . . . . . . . . 1025.5 Aplicacin a la localizacin . . . . . . . . . . . . . . . . . . . . . . . . . . 1115.6 Discusin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

    6 Mapeado basado en el algoritmo EM adaptativo 1256.1 Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1256.2 Enfoque muestral del algoritmo EM . . . . . . . . . . . . . . . . . . . . . 127

    6.2.1 Estimacin de posiciones esperadas . . . . . . . . . . . . . . . . . 1296.2.2 Mapas de mxima verosimilitud . . . . . . . . . . . . . . . . . . . 131

    6.3 Experimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1346.4 Discusin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143

    7 Conclusiones 145

    A Muestreo por rechazo 149

  • NDICE GENERAL 9

    B Algoritmo EM 151B.1 Descripcin del algoritmo EM . . . . . . . . . . . . . . . . . . . . . . . . 151B.2 Aplicacin a la estimacin de k medias . . . . . . . . . . . . . . . . . . . . 152

    C Trayectorias con algoritmos genticos 155C.1 Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155C.2 Planteamiento del problema . . . . . . . . . . . . . . . . . . . . . . . . . 156C.3 Algoritmos genticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158

    C.3.1 Representacin de las soluciones . . . . . . . . . . . . . . . . . . . 158C.3.2 Funcin de evaluacin . . . . . . . . . . . . . . . . . . . . . . . . 159C.3.3 Operadores genticos . . . . . . . . . . . . . . . . . . . . . . . . . 160

    C.4 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161C.4.1 Resultados en distintos entornos sin ruido . . . . . . . . . . . . . . 161C.4.2 Comparacin de resultados con y sin ruido . . . . . . . . . . . . . 161

    C.5 Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162

    D Aprendizaje de conductas locales de navegacin 163D.1 Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163

    D.1.1 Tcnicas previas para el control local . . . . . . . . . . . . . . . . 163D.1.2 Control local basado en reconocimiento estadstico de situaciones . 165

    D.2 Aprendizaje y clasificacin de situaciones . . . . . . . . . . . . . . . . . . 166D.2.1 Anlisis de Componentes Principales . . . . . . . . . . . . . . . . 167D.2.2 Clasificacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168

    D.3 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168D.4 Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169

  • 10 NDICE GENERAL

  • ndice de Figuras1.1 Ejemplo de lecturas de sensores de ultrasonidos en una habitacin. . . . . . 201.2 Muestras que representan la distribucin de probabilidad de la posicin del

    robot. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211.3 PIXIE en un pasillo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221.4 Simulador con el que se ha realizado parte de la experimentacin. . . . . . 23

    2.1 Ejemplo de mapa topolgico de Kuipers. . . . . . . . . . . . . . . . . . . . 292.2 Ejemplo de rejilla de ocupacin (tomado de (Thrun, Burgard, y Fox 1998)). 302.3 Ejemplo de modelo geomtrico del entorno. Las caractersticas geomtricas

    usadas en el modelo son: esquinas, aristas y segmentos de rectas. . . . . . 312.4 Ejemplo de modelo CAD del entorno. . . . . . . . . . . . . . . . . . . . . 322.5 Ejemplo de modelo sensorial del entorno, en el que el entorno es el mismo

    que el modelado por las figuras 2.3 y 2.4. . . . . . . . . . . . . . . . . . . 32

    3.1 PIXIE, robot mvil RWI B-21 con el que se ha realizado la experimentacin:(a) fotografa, (b) esquema mostrando sus elementos. . . . . . . . . . . . . 48

    3.2 Fotografa de uno de los transductores Polaroid con los que se ha realizadola experimentacin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

    3.3 Patrn de intensidad de emisin de ultrasonidos (en dB) en funcin de ladistancia angular al eje de orientacin del transductor. . . . . . . . . . . . . 50

    3.4 Eco de un pulso de ultrasonidos con mltiples reflexiones. . . . . . . . . . 503.5 Tres tipos de errores de medicin del sensor del sensor de ultrasonidos. En

    (a) el eco no se recibe debido a que rebota alejndose del transductor. En(b) se realiza una medida menor de la que existe en realidad debido a laextensin angular del haz de sonido. En (c) se realiza una medida mayor dela que existe en realidad debido a la recepcin de un doble rebote producidopor una esquina. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

    11

  • 12 NDICE DE FIGURAS

    3.6 130 lecturas de un sonar del anillo con el robot girando a una velocidadde 5=s. Se dibujan como rectas aquellas lecturas que no detectan ningnobstculo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

    3.7 Representacin de las lecturas de la figura 3.6 sobre la habitacin en la quese realiz el experimento. . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

    3.8 Lecturas del anillo de sonares de PIXIE obtenidas con el robot movindosea lo largo de un pasillo de 26 metros de largo y 1.6 metros de ancho. . . . . 56

    3.9 Lecturas de los sonares 15 (izquierda) y 18 (derecha) del anillo, con el robotsituado en distintas posiciones (de arriba a abajo) de un recinto. . . . . . . . 57

    3.10 Los modelos del sonar de Barshan (Barshan y Kuc 1990) o Leonard (Leonardy Durrant-Whyte 1992) descomponen un entorno (a) en elementos indivi-duales (b) (aristas,esquinas y segmentos) y simulan la interaccin del sonarcon cada uno de los elementos. . . . . . . . . . . . . . . . . . . . . . . . . 58

    3.11 Representacin de la ecuacin e.242=20 / que define la amplitud del hazde ultrasonidos emitido por un transductor en funcin de la desviacin conrespecto a la normal del propio transductor. . . . . . . . . . . . . . . . . . 59

    3.12 (a) Un par de transductores enfrentados. (b) Un transductor enfrentado auna pared con una inclinacin 4 . . . . . . . . . . . . . . . . . . . . . . . 60

    3.13 Zona de sensibilidad del haz de ultrasonidos. . . . . . . . . . . . . . . . . 613.14 (a) Lecturas procedentes de dobles rebotes. (b) Trayectorias del sonido que

    han producido uno de los dobles rebotes. . . . . . . . . . . . . . . . . . . . 623.15 El reflejo de un pulso de sonido incidente en un obstculo con una amplitud ai

    genera un haz reflejado cuya amplitud ar decae exponencialmente alrededordel rayo reflejado ideal segn la ecuacin ar D aie.242=20 /, siendo 4 elngulo de desviacin con respecto al rayo reflejado ideal. . . . . . . . . . . 63

    3.16 Ejemplo de un rayo de ultrasonidos que se refleja en una superficie con unngulo 41 con el rayo reflejado ideal y en otra con 42. . . . . . . . . . . 64

    3.17 Funcionamiento bsico del trazado de rayos. El rayo que llega desde laescena es una composicin de un rayo reflejado ambiental, un rayo reflejadoespecular y un rayo refractado. . . . . . . . . . . . . . . . . . . . . . . . . 65

    3.18 Ejemplo del funcionamiento del algoritmo de simulacin del sonar. . . . . . 673.19 Resultado, a la izquierda, de la simulacin de 130 lecturas de sonar en un

    entorno idntico al recinto en el que se han realizado las mediciones. A laderecha se muestran los resultados reales de las mediciones. Tanto en lasimulacin como en los datos reales aparecen rodeadas las lecturas productode dobles rebotes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

    3.20 Resultado de la simulacin de 130 lecturas de sonar en el mismo entorno,variando los valores de los parmetros del algoritmo de simulacin. . . . . 71

  • NDICE DE FIGURAS 13

    3.21 Variacin de la lectura del sensor para un ngulo determinado cuando sevara 0 entre 0.05 y 1.5 y 0 entre 0.05 y 1.5. . . . . . . . . . . . . . . . . 72

    3.22 Ejemplo del resultado del ajuste de dos sonares, comparando su simulacincon las lecturas reales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

    3.23 Verosimilitud de 40000 posiciones distribuidas uniformemente alrededordel anillo de sonares. Cuanto ms oscura aparece una posicin, mayor es laverosimilitud de su lectura asociada. . . . . . . . . . . . . . . . . . . . . . 78

    4.1 Ejemplos de mapas poligonales. . . . . . . . . . . . . . . . . . . . . . . . 824.2 Ejemplo de mapa poligonal definido mediante los parmetros d1, d2 y d3. . 834.3 Representacin de la funcin de densidad de las lecturas del sonar, p.zi j x/,

    para una posicin .x; y/ fija del robot en un entorno de final de pasillocentrado en la posicin en la que se han tomado las lecturas. A la izquierdanuestro modelo, a la derecha el modelo de (Burgard, Cremers, Fox, Hahnel,Lakemeyer, Schulz, Steiner, y Thrun 1998). . . . . . . . . . . . . . . . . . 87

    4.4 Situacin de PIXIE en el experimento con el modelo de observacin. . . . . 884.5 Superior: Barrido de 24 lecturas del anillo de sonares en la posicin del

    robot en la que se tom el barrido . Inferior izquierda: posicin de mxi-ma verosimilitud con la funcin propuesta. Inferior derecha: posicin demxima verosimilitud con la funcin simplificada. . . . . . . . . . . . . . . 89

    4.6 Funcin de verosimilitud propuesta. Verosimilitudes marginales de x, y y . Posicin real del robot: x D 190, y D 80, D 180. . . . . . . . . . . . 91

    4.7 Funcin de verosimilitud de Fox. Verosimilitudes marginales de x, y y .Posicin real del robot: x D 190, y D 80, D 180. . . . . . . . . . . . . . 92

    4.8 Funciones de verosimilitud marginal de x e y con respecto a la orientacin.Izquierda: funcin propuesta. Derecha: funcin de Fox. Posicin real delrobot: x D 190, y D 80, D 180. . . . . . . . . . . . . . . . . . . . . . . 93

    5.1 Funcionamiento del algoritmo bootstrap. La figura supone que las muestrasestn estimando un nico parmetro, distribuido en el eje horizontal. Lasmuestras se representan por crculos centrados en el valor del parmetro querepresentan. El rea de los crculos representa el peso de cada muestra. . . . 100

    5.2 Caractersticas topolgicas usadas en el trabajo: pasillos y finales de pasillo.Los pasillos quedan definidos con tres parmetros (distancia a una y otrapared y orientacin) y los finales de pasillo con cuatro (distancias a lasparedes y al final del pasillo y orientacin). . . . . . . . . . . . . . . . . . 103

    5.3 Algunos de los entornos de prueba en los que se han realizado los experi-mentos. El entorno 1 consiste en un pasillo con dos obstculos y el 2 unpasillo con mltiples puertas. . . . . . . . . . . . . . . . . . . . . . . . . . 104

  • 14 NDICE DE FIGURAS

    5.4 Experimento 1. Inicializacin de la caracterstica pasillo en el entorno 1. . 1065.5 Experimento 1. Seguimiento del pasillo movindose el robot en el entorno

    1. El obstculo puede verse como un segmento recto paralelo al pasillo. . . 1075.6 Experimento 2. Seguimiento de finales de pasillo movindose el robot en

    el entorno 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1085.7 Experimento 3. Muestras generadas siguiendo un pasillo en datos reales. . 1095.8 Experimento 3. Posiciones medias estimadas del pasillo. Los puntos re-

    presentan las lecturas realizadas por el robot. . . . . . . . . . . . . . . . . 1105.9 Lecturas y posiciones tomadas del simulador, con las que se han realizado

    los experimentos de localizacin 1 y 2. . . . . . . . . . . . . . . . . . . . . 1135.10 Experimento 1. Localizacin en un pasillo (zona de alta ambiguedad).

    Muestras con un nivel de gris ms oscura indican mayores probabilidadesde que el robot se encuentre en esa posicin. Desviacin absoluta media delas posiciones x, y y la orientacin del robot. Nmero de muestras=1000. 114

    5.11 Experimento 1. Localizacin en un pasillo (zona de alta ambiguedad).Desviacin absoluta media de las posiciones x, y y la orientacin delrobot. Nmero de muestras=343. . . . . . . . . . . . . . . . . . . . . . . . 115

    5.12 Experimento 1. Localizacin en un pasillo (zona de alta ambiguedad).Desviacin absoluta media de las posiciones x, y y la orientacin delrobot. Nmero de muestras=125. . . . . . . . . . . . . . . . . . . . . . . . 116

    5.13 Experimento 1. Entropa de las distribuciones de muestras en cada instantede tiempo en algunos de los experimentos de localizacin 5.15, 5.10 y 5.11,en los que se utilizan 1000, 343 y 125 muestras respectivamente. . . . . . 117

    5.14 Experimento 2. Localizacin en un pasillo (zona de alta ambigedad).Desviacin absoluta media de las posiciones x, y y la orientacin delrobot. Nmero de muestras=125. Muestras escogidas aleatoriamente = 20por ciento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

    5.15 Experimento 3. Localizacin en una zona de alta distinguibilidad. Des-viacin absoluta media de las posiciones x, y y la orientacin del robot.Nmero de muestras=1000. . . . . . . . . . . . . . . . . . . . . . . . . . . 119

    5.16 Experimento 4. Ejemplo de serie temporal que termina en una mala locali-zacin. Nmero de muestras=125. Abajo: representacin de la entropa dela distribucin de muestras en cada instante de tiempo (suavizada con unaventana de 3 instantes de tiempo) . . . . . . . . . . . . . . . . . . . . . . 120

    5.17 Experimento 5. Problemas en situaciones simtricas, en donde se producemultimodalidad. Colapso del filtro de bootstrap. . . . . . . . . . . . . . . . 121

    5.18 Experimento 5. La seleccin de muestras aleatorias no soluciona el pro-blema del colapso. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

  • NDICE DE FIGURAS 15

    5.19 Experimento 6. Lecturas y posiciones reales, con las que se ha realizado elexperimento de localizacin 6. . . . . . . . . . . . . . . . . . . . . . . . . 122

    5.20 Experimento 6. Localizacin global con datos reales de PIXIE. Nmero demuestras = 1000. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

    6.1 Experimento 1. Ejemplo de una serie temporal a la que se le aplicar elalgoritmo de suavizado. Nmero de muestras=125. Abajo: representacinde la entropa de la distribucin de muestras en cada instante de tiempo(suavizada con una ventana de 3 instantes de tiempo) . . . . . . . . . . . . 137

    6.2 Experimento 1. Dos instantneas de la serie temporal antes (arriba) y des-pus (abajo) de aplicar el algoritmo de Kitawa. . . . . . . . . . . . . . . . 138

    6.3 Experimento 1. Seleccin de las 30 mejores muestras de cada instantneade la figura anterior. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138

    6.4 Experimento 1. Arriba: Error absoluto medio en la posicin x del robotde la serie de la figura 6.1 antes (error1) y despus (error2) de aplicar elalgoritmo de Kitawa. Abajo: entropa de la misma serie temporal antes(entropa1) y despus (entropa2) de aplicar el algoritmo de Kitawa. Nmerode muestras=125. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139

    6.5 Experimento 2. Instantnea 29 de la serie temporal mostrada en la figura5.17 antes (arriba) y despus (abajo) de aplicar el algoritmo de Kitawa. A laderecha de cada una las 30 muestras con mayor verosimilitud. El algoritmode Kitawa no elimina la multimodalidad de una distribucin ambigua. . . . 140

    6.6 Experimento 3. Modelo de habitacin del experimento 3, definida mediantelos parmetros d1, d2 y d3. . . . . . . . . . . . . . . . . . . . . . . . . . . 141

    6.7 Experimento 3. Mapa de la habitacin y lecturas y movimientos del robot. 1416.8 Experimento 3. Evolucin del algoritmo EM para estimar los mejores

    parmetros d1, d2 y d3 que definen el mapa de la habitacin. . . . . . . . . 142

    C.1 Resultados sin ruido para distintos entornos. . . . . . . . . . . . . . . . . . 160C.2 Resultados para el entorno pasillo. . . . . . . . . . . . . . . . . . . . . . . 161

    D.1 Una muestra del simulador sobre el que se ha realizado la experimentacindel artculo. En la parte inferior de la figura se incluye el mapa de profundidadcaptado por el robot. Tonos de gris oscuros corresponden con lecturas deprofundidad cercanas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165

    D.2 Ejemplo del conjunto de muestras de entrenamiento de la situacin corres-pondiente a v60 (v 2 T60cm=s; 70cm=sU). Cada fila de la figura correspondeal mapa de profundidad en un instante de tiempo. . . . . . . . . . . . . . . 167

  • 16 NDICE DE FIGURAS

    D.3 Ejemplo del conjunto de muestras de entrenamiento de las situaciones co-rrespondiente a v50, v60 y v70. . . . . . . . . . . . . . . . . . . . . . . . . . 169

    D.4 Mapas de profundidad medios correspondientes a cada una de las distintassituaciones de velocidad lineal. . . . . . . . . . . . . . . . . . . . . . . . . 170

    D.5 Ejemplo de trayectoria seguida por el robot aplicando el algoritmo de controlbasado en reconocimiento estadstico de situaciones. . . . . . . . . . . . . 170

  • ndice de Tablas2.1 Algoritmo de localizacin basado en rejillas de probabilidad. . . . . . . . . 423.1 Algoritmo recursivo base del trazado de rayos . . . . . . . . . . . . . . . . 663.2 Algoritmo de simulacin del sonar . . . . . . . . . . . . . . . . . . . . . . 683.3 Resultados del ajuste de parmetros para los 24 sonares de PIXIE. . . . . . 754.1 Comparacin de la posicin real de PIXIE (primera columna) con de las posi-

    ciones de mxima verosimilitud de nuestro modelo de observacin (segundacolumna) y del modelo de observacin de Fox (tercera columna). . . . . . . 90

    5.1 Filtro bootstrap. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

    6.1 Formulacin del algoritmo estimacin-maximizacin. . . . . . . . . . . . . 1276.2 Versin muestral del algoritmo EM para estimacin de mapas del entorno. . 1286.3 Algoritmo de suavizado de las probabilidades asociadas a las muestras del

    filtro bootstrap. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1336.4 Evolucin del algoritmo EM. Parmetros del mejor mapa obtenido en cada

    iteracin y suma de los logaritmos de las verosimilitudes de las posicionespara ese mapa. Parmetros del mapa correcto: d1 D 250, d2 D 400, d3 D 400.136

    A.1 Algoritmo de rechazo y su versin modificada para mejorar su eficiencia. . 149A.2 Algoritmo de rechazo y su versin modificada para mejorar su eficiencia. . 150C.1 Resultados obtenidos para el entorno pasillo . . . . . . . . . . . . . . . . . 162

    D.1 Esquemas de actuacin susceptibles de ser implementados con cada unode los mtodos de control local. Ver en el texto principal las referenciascorrespondientes a cada uno de los mtodos. . . . . . . . . . . . . . . . . . 164

    17

  • 18 NDICE DE TABLAS

  • Captulo 1

    Introduccin

    En esta tesis se estudian dos de los problemas fundamentales de la navegacin de robotsautnomos, el problema de la localizacin y el de la construccin automtica de mapasdel entorno. Proponemos abordar ambas cuestiones desde un punto de vista de estimacinbayesiana del estado y de bsqueda del modelo de mxima verosimilitud, aplicando tcnicasnovedosas de modelado y de computacin.

    Para ilustrar el alcance de estas tcnicas, describimos a continuacin el comportamientode un robot gua de un museo. Esta tarea es un ejemplo tpico de aplicacin de los robotsmviles.

    El robot gua se encuentra localizado en una determinada posicin de un gransaln en donde se distribuyen diversas obras, no slo en las paredes sino tambinpor el centro del mismo. Una pantalla tctil situada sobre el robot permitea los usuarios escoger la obra a la que se desea ir. Alguien pulsa la obrasituada al otro extremo del saln y el robot, despus de planificar una trayectoriafactible que le llevar de la posicin actual a la posicin objetivo, comienza amoverse, invitando con un sintetizador voz a que le sigan. Utiliza los lectoresde ultrasonidos y de lser para obtener lecturas de alcance del entorno, queprocesa para moverse evitando obstculos y para actualizar de forma correctasu localizacin, compensando los errores introducidos por la odometra. Alcomenzar a moverse, el robot despierta una gran curiosidad y bastantes personasse agrupan a su alrededor, produciendo lecturas errneas y bloqueando el caminoque se haba calculado previamente. El robot corrige la trayectoria, encontrandoun camino alternativo y se mueve para evitar los nuevos obstculos, llegandoal objetivo sin ms problemas. Durante el camino ha ido anunciando las obrasque dejaba a derecha e izquierda. Una vez en el objetivo se detiene, listo paravolver a comenzar.

    19

  • 20 CAPTULO 1. INTRODUCCIN

    LecturaNo lectura

    Figura 1.1: Ejemplo de lecturas de sensores de ultrasonidos en una habitacin.

    En este ejemplo, el robot es capaz de contestar en cada momento a las siguientes trespreguntas: dnde estoy? hacia dnde debo moverme? cmo llegar hasta all?

    Estas tres preguntas sugieren tres problemas fundamentales de la navegacin: el pro-blema de la localizacin, el problema de la planificacin de conductas (trayectorias) y elproblema de la utilizacin de esquemas de actuacin.

    En el problema de localizacin, en concreto, el robot se mueve en un entorno de oficinacuyo mapa se conoce de antemano, y cuenta con unos sensores de ultrasonidos con losque obtiene una percepcin local (y ruidosa) del entorno en el que se encuentra (ver figura1.1). Tambin existen en el robot unos contadores mecnicos que proporcionan informacinmtrica (tambin ruidosa) de los desplazamientos que realiza (odometra).

    Se trata de encontrar, en todo momento, la posicin del robot dentro del mapa conocidoa partir de la informacin de las lecturas del sonar y de las lecturas de odometra. En laversin ms complicada del problema, la localizacin global, se debe estimar la posicindel robot sin conocer su posicin inicial. Frente a este problema, el del seguimiento de lalocalizacin es ms sencillo, ya que se conoce a priori la posicin del robot.

    Las tcnicas de localizacin deben tratar correctamente el problema de los objetos nomodelados en el entorno. Normalmente, el mapa que modela el entorno representa nica-mente las caractersticas principales del mismo. Sin embargo, cuando el robot evolucionapor dicho entorno sus sensores se vern afectados por pequeos objetos no modelados (mobi-liario, por ejemplo), por caractersticas que han cambiado (puertas que se abren o se cierran)o por personas que se mueven en los alrededores. Las tcnicas de localizacin deben ser lo

  • 21

    t = 1

    t = 30

    t = 18

    Figura 1.2: Muestras que representan la distribucin de probabilidad de la posicin del robot.

    suficientemente robustas para contemplar estas diferencias.En el problema de la construccin automtica de mapas del entorno el robot explora un

    entorno y almacena las lecturas de los sensores de ultrasonidos y las lecturas de odometra.Una vez realizada la exploracin, se debe determinar el modelo del entorno que mejor seadapta a las lecturas recogidas. Normalmente, en el mapeado tambin hay que resolver elproblema de localizacin, ya que no se conocen las posiciones desde las que el robot harealizado las lecturas.

    En esta tesis se presenta una solucin al problema de la localizacin global utilizandola estimacin bayesiana. Este paradigma permite derivar una funcin de probabilidad aposteriori de la posicin del robot, dado un mapa conocido del entorno, una secuencia delecturas de los sensores del robot y una secuencia de sus movimientos. Las posicionesms probables sern aquellas que hagan ms verosmiles dichas secuencias de lecturas ymovimientos, dado el mapa del entorno.

    Uno de los problemas ms graves de la aplicacin de este enfoque es que, debido alos problemas de obstculos no modelados y de ambigedad en la percepcin del entorno,la funcin de probabilidad a posteriori es muy compleja y no puede aproximarse a unadistribucin normal (frecuentemente es multimodal). La solucin novedosa que aportamoses la utilizacin del filtro bootstrap que representa la funcin de probabilidad mediante unconjunto de muestras extradas de la misma. Por ejemplo, en la figura 1.2, se representantodas las muestras que definen la probabilidad de localizacin a posteriori en tres instantesde tiempo de un recorrido del robot por un pasillo.

    Para calcular la funcin de probabilidad, y aplicar el algoritmo bootstrap es necesarioformular un modelo de observacin, que define la verosimilitud de las lecturas obtenidaspor los sonares dada una posicin en un determinado entorno, y un modelo de movimientodel robot. Presentamos en la tesis un modelo novedoso de observacin, basado en un

  • 22 CAPTULO 1. INTRODUCCIN

    Figura 1.3: PIXIE en un pasillo.

    modelo realista del comportamiento del sensor de ultrasonidos, que tiene como caractersticasprincipales la robustez frente a obstculos no modelados y la alta efectividad en situacionesque otros modelos ms simples perciben como ambiguas.

    En lo que se refiere al problema del mapeado, proponemos la utilizacin de modelos pa-ramtricos del entorno y de un algoritmo de estimacin-maximizacin (EM) para obtener losparmetros del mapa que maximizan la verosimilitud de las lecturas. Se utiliza como mtodode estimacin el algoritmo de localizacin, al que se aade una fase posterior de suavizadode las muestras para reducir la ambigedad en situaciones ruidosas. La maximizacin seutiliza mediante un sencillo algoritmo de bsqueda adaptativa.

    Se han probado los mtodos con datos obtenidos de un simulador propio (figura 1.4) y dePIXIE (figura 1.3), un robot mvil RWI B-21 con un anillo de 24 sensores de ultrasonidos.

    Una de las caractersticas principales del simulador construido es su flexibilidad. Porejemplo, es posible obtener datos de distintos modelos de entorno, modificar el comporta-miento de las lecturas de los sensores de ultrasonidos, introduciendo distintos tipos de ruidoaleatorio, o aadir ruido en las lecturas de odometra. La utilizacin del simulador permite,en la fase de diseo de los algoritmos, controlar mejor sus distintas variables y proporcionauna enorme flexibilidad por la posibilidad de repetir de forma controlada los experimentos.El robot PIXIE se ha utilizado para tomar datos reales con los que validar el funcionamientocorrecto de los algoritmos propuestos.

    Tanto el filtro bootstrap como los enfoques bayesianos se han popularizado recientemente

  • 23

    Figura 1.4: Simulador con el que se ha realizado parte de la experimentacin.

    en la comunidad cientfica dedicada a la Visin Artificial. Muchas de las ideas aportadas enesta tesis han surgido de la adaptacin de tcnicas recientes de este campo a los mtodos denavegacin.

    El resto de la tesis se organiza de la siguiente forma. El captulo 2 presenta los pro-blemas de localizacin y mapeado, haciendo un repaso de las distintas tcnicas propuestas.Se presenta tambin en el captulo una formalizacin de los problemas en trminos de es-timacin bayesiana que proporciona el marco conceptual del resto de la tesis. El captulo3 presenta la propuesta de modelo del sensor, junto con experimentos que muestran su co-rrecto funcionamiento. En el captulo 4 se proponen los modelos necesarios para utilizarel enfoque bayesiano. Estos modelos son los mapas paramtricos del entorno, el modelode observacin y el modelo de movimiento. El captulo 5 est dedicado a la presentacindel filtro bootstrap y a su aplicacin a la solucin del problema de localizacin global. Porltimo, el captulo 6 propone un algoritmo EM para resolver el problema del mapeado. Eneste captulo se presenta una tcnica para suavizar la probabilidad asociada a las muestrasresultantes del filtro bootstrap y se utiliza una bsqueda adaptativa para encontrar el modeloparamtrico que mejor se adapta a las lecturas obtenidas. En el captulo 7 se resumen todaslas aportaciones de la tesis y se comentan posibles lneas futuras de trabajo.

    Los apndices amplan algunos conceptos importantes y presentan trabajos previos re-lacionados con el tema de la tesis. El primero de ellos describe el mtodo estadstico delmuestreo por rechazo para muestrear funciones de densidad. El apndice B describe el algo-ritmo EM. Los apndices C y D presentan trabajos previos al desarrollo del cuerpo central dela tesis, relacionados con las conductas y las trayectorias de los robots mviles, y que sirvie-

  • 24 CAPTULO 1. INTRODUCCIN

    ron para plantear algunas de las problemticas de las que han surgido esta tesis. En concreto,el apndice 3 propone la utilizacin de algoritmos genticos para resolver el problema de laplanificacin de trayectorias, y el apndice 4 utiliza estas trayectorias como modelos de losque extraer caractersticas comunes que definen conductas locales de navegacin, utilizandoel anlisis de componentes principales (PCA).

  • Captulo 2

    Localizacin y mapeado en entornosde oficina

    La localizacin de un robot mvil en un entorno conocido es uno de los problemas funda-mentales de la robtica mvil, junto con la construccin automtica de mapas del entorno.Se han propuesto un gran nmero de modelos, enfoques y tcnicas para resolver ambosproblemas. Muchas de estas tcnicas presentan soluciones ad-hoc que slo son tiles ensituaciones muy especficas.

    Frente a este tipo de tcnicas, han aparecido recientemente algunas propuestas generalesque utilizan enfoques bayesianos, como por ejemplo los modelos de Markov o las redesbayesianas.

    Presentamos en este captulo una formalizacin del problema de la localizacin y delmapeado que unifica las propuestas recientes y que proporciona una notacin uniforme ycoherente. Esta formalizacin sirve de marco conceptual en el que es posible desarrollardistintas implementaciones y tcnicas.

    Los elementos fundamentales de la formulacin de ambos problemas son la definicinde un modelo de observacin que proporciona la probabilidad de las lecturas de los sensoresdada una posicin en el entorno definido y la definicin de un modelo de movimiento queproporciona la probabilidad de la siguiente posicin del robot, dada la posicin actual y laaccin ejecutada.

    En captulos siguientes presentaremos propuestas concretas para ambos modelos y al-goritmos y tcnicas de localizacin y mapeado basadas en esta formalizacin.

    25

  • 26 CAPTULO 2. LOCALIZACIN Y MAPEADO EN ENTORNOS DE OFICINA

    2.1 IntroduccinPara navegar de forma robusta en entornos de oficina, un robot debe saber dnde se encuentradentro de ese entorno. En los ltimos aos viene existiendo un gran inters en el desarrollode algoritmos para estimar la localizacin del robot a partir de los datos percibidos por sussensores. En el contexto de los robots mviles, el problema general de la localizacin puedeser formulado de la siguiente forma.

    Dado: Un modelo del entorno, como una descripcin geomtrica, un mapa topolgico ouna rejilla de ocupacin.

    Tarea: Estimar la localizacin del robot en el modelo basndose nicamente en observacio-nes efectuadas por el robot. Dichas observaciones suelen consistir en informacin deodometra acerca de los movimientos realizados por el robot y en informacin de dis-tancias a los obstculos ms cercanos obtenidas mediante sensores de alcance (sonar,lser)1. Las observaciones tambin pueden consistir en imgenes obtenidas por unacmara montada en el robot, en cuyo caso estamos ante un problema de localizacinvisual.

    Un problema fuertemente ligado al de localizacin es el de la construccin automticadel mapa del entorno. Tambin en los ltimos aos se han desarrollado mtodos para estimary mantener modelos del entorno de forma autnoma. Este problema se puede formular dela siguiente forma.

    Dado: Una serie de observaciones realizadas por el robot evolucionando por el entorno.Las observaciones, al igual que en el problema de la localizacin, suelen consistir eninformacin de odometra e informacin de lecturas de alcance.

    Tarea: Construir un modelo del entorno que pueda ser utilizado por los algoritmos delocalizacin. Posibles modelos son descripciones geomtricas del entorno, mapastopolgicos o rejillas de ocupacin.

    Los modelos y mtodos propuestos para resolver los problemas de localizacin y ma-peado deben tratar con ciertas limitaciones y restricciones prcticas del funcionamiento delos robots mviles. Algunas de ellas son las siguientes.

    1. Localidad de los sensores. El rango de percepcin de la mayora de sensores (ultra-sonidos, lser, cmaras) est limitado a una zona pequea alrededor del robot. Paraadquirir informacin global, el robot debe explorar activamente su entorno.

    1Es importante resaltar que slo se dispone de informacin local sobre la posicin del robot. Evidentemente,si se contara con informacin global sobre su posicin (mediante un sistema GPS, por ejemplo), el problema dela localizacin no existira.

  • 2.2. MODELOS DEL ENTORNO 27

    2. Ruido en los sensores. Las observaciones realizadas por los sensores son normal-mente ruidosas, y la distribucin estadstica de este ruido no suele ser sencilla demodelar.

    3. Ruido en la posicin. Los movimientos del robot no suelen ser exactos, producindoselos denominados errores de odometra. Estos errores son, adems, acumulativos conla distancia recorrida. Por ejemplo, pequeos errores en la rotacin del robot puedentener efectos importantes en la estimacin de los movimientos de traslacin y en ladeterminacin de la posicin final del robot.

    4. Entornos complejos y dinmicos. Los entornos de oficina en los que evoluciona elrobot suelen ser complejos y dinmicos, haciendo prcticamente imposible mantenermodelos consistentes de los mismos.

    5. Necesidad de tiempo real. Los requisitos de la aplicacin (control de un robot mvil)obligan a procesar la informacin en un tiempo real. Esto limita la complejidad delprocesamiento realizado por los mtodos de localizacin, as como los modelos delentorno.

    En los siguientes apartados revisaremos los distintos aspectos de los problemas de locali-zacin y mapeado. Comenzaremos estudiando los distintos modelos del entorno propuestosen la literatura, a continuacin presentaremos las aproximaciones al problema de la localiza-cin y al problema del mapeado. Se concluir el captulo definiendo formalmente el marcode estimacin bayesiana, aplicado tanto a localizacin como a mapeado.

    2.2 Modelos del entorno

    Un elemento fundamental de la localizacin y el mapeado es el modelo de representacindel entorno. Un modelo o mapa del entorno es una abstraccin con la que se representannicamente aquellas caractersticas del entorno que se consideran tiles para la navegacino la localizacin del robot. Al realizar esta abstraccin se desechan caractersticas de granofino que no se consideran tiles, debido a que pueden ser demasiado variables o no puedenser detectadas con fiabilidad por los sensores.

    La utilidad principal de un modelo del entorno es proporcionar el elemento fundamentalpara la localizacin del robot. En general, los algoritmos de localizacin suelen compararlas lecturas obtenidas por los sensores del robot con el modelo del entorno, actualizandola posicin del robot de forma acorde con el resultado de esta comparacin. La forma derealizar la comparacin depende totalmente del tipo de modelo de entorno y de la propuestarealizada.

  • 28 CAPTULO 2. LOCALIZACIN Y MAPEADO EN ENTORNOS DE OFICINA

    Se han desarrollado dos paradigmas fundamentales de modelado de los entornos de ofi-cina: modelos mtricos y modelos topolgicos. A su vez, los modelos mtricos puedendividirse en modelos basados en rejillas y en modelos geomtricos. En los siguientes apar-tados se revisarn los modelos de entorno ms utilizados en la literatura, analizando lascaractersticas y suposiciones de cada enfoque.

    2.2.1 Mapas topolgicosLa idea central de los mapas topolgicos es representar las caractersticas esenciales delentorno percibidas por el robot mvil utilizando un grafo como un modelo de alto nivel. Losnodos se utilizan para representar lugares del entorno y los arcos caminos entre los luga-res. Los lugares constituyen zonas del entorno (landmarks) con caractersticas sensorialesdistinguibles de forma absoluta, o respecto a sus nodos vecinos.

    Los nodos corresponden a la unidad elemental de localizacin, de manera que toda unazona geomtrica del mapa real se representa por un nico lugar. A partir del mapa topolgicono es posible distinguir localizaciones ms finas que las representadas por los lugares.

    Veamos, como ejemplo, la propuesta de mapas topolgicos de Kuipers (Kuipers y Byun1991)(ver figura 2.1).

    Los nodos corresponden a puntos distintivos del entorno y los arcos a caminos recorridospor el robot. Una posicin del entorno correspondiente a un nodo debe distinguirse local-mente de su vecindad mediante algn criterio definible en trminos de los datos sensoriales.En el caso de los experimentos realizados por Kuipers, la funcin de distincin calcula elnmero de objetos cercanos que se encuentran a igual distancia del robot.

    Los arcos entre los nodos representan caminos que se han seguido para llegar de un nodoa otro utilizando una determinada estrategia de control local (seguir centro de pasillo, seguirpared a la derecha o seguir pared a la izquierda).

    Los mapas topolgicos han sido utilizados, con mltiples variantes, a lo largo de losltimos aos (Mataric 1992; Pierce y Kuipers 1994; Kortenkamp y Weymouth 1994; Shatkayy Kaelbling 1997; Nourbakhsh, Powers, y Birchfeild 1995; Ryu y Yang 1988; Koenig ySimmons 1998; Thrun 1998; Thrun, Burgard, y Fox 1998).

    Un inconveniente de los mapas topolgicos es que la necesidad de distincin sensorialentre lugares hace imposible la representacin de zonas abiertas (habitaciones grandes, halls)en las que el alcance limitado de los sensores no obtiene informacin.

    Otro punto dbil es que la definicin de lugares y la conexin entre los mismos es muydependiente de la aplicacin, no utilizndose normalmente ningn criterio formal para suconstruccin.

    Por ltimo, como se puede comprobar en el ejemplo de la figura 2.1, los mapas cons-truidos dependen excesivamente de la historia de las percepciones del robot al construirlos(por ejemplo, el arco entre P1 y P2 est etiquetado seguir pared izquierda porque esa es

  • 2.2. MODELOS DEL ENTORNO 29

    P1P2

    P3

    P4

    P5P6

    P7

    P1P2

    P3

    P4

    P5 P6

    P7Seguir pared dcha.

    Seguir centro pasillo

    Seguirparedizqda.

    Seguirparedizqda.

    Seguirparedizqda.

    Seguirparedizqda.

    Seguirparedizqda.

    Seguirparedizqda.

    a) b)

    Figura 2.1: Ejemplo de mapa topolgico de Kuipers.

    precisamente la conducta local que el robot sigui para ir de un nodo a otro). Esto los hacemuy sensibles a la aparicin de elementos no modelados (personas, obstculos imprevistos)que proporcionan informacin sensorial muy distinta de la modelada, haciendo que el robotpierda su localizacin.

    Por otro lado, los modelos topolgicos proporcionan ventajas a la hora de realizar unaplanificacin de la trayectoria del robot, facilitan la interfaz con planificadores simbli-cos y proporcionan un interfaz ms natural para la interaccin con instrucciones humanas(posibilitan rdenes del tipo "ir a la habitacin A").

    2.2.2 Rejillas de ocupacinLas rejillas de ocupacin, inicialmente propuestas por Moravec y Elfes (Moravec y Elfes1985), discretizan el entorno en celdillas de igual dimensin. Cada celdilla mantiene laprobabilidad de que la zona del entorno asociada a ella est ocupada. En la figura 2.2 semuestra un ejemplo de una rejilla de ocupacin.

    Es posible utilizar rejillas de ocupacin definidas por el usuario, pero lo usual es que seael propio robot mvil el que realize la construccin de la rejilla de forma autnoma, mediantealgn algoritmo de exploracin (Elfes 1987; Weigl, Siemiatkowska, Sikorski, y Borkowski1993; Thrun, Burgard, y Fox 1998).

    Las rejillas de ocupacin se han utilizado desde entonces en numerosos enfoques delocalizacin (Matthies y Elfes 1988; Courtney y Jain 1994; Schiele y Crowley 1994; Stevens,Stevens, y Durrant-Whyte 1995; Oriolo, Vendittelli, y Ulivi 1995; Daniel Pagac 1996;

  • 30 CAPTULO 2. LOCALIZACIN Y MAPEADO EN ENTORNOS DE OFICINA

    Figura 2.2: Ejemplo de rejilla de ocupacin (tomado de (Thrun, Burgard, y Fox 1998)).

    Yamauchi 1996) normalmente para alinear mapas locales construidos mediante los datos delos sensores con el mapa de ocupacin global.

    En los ltimos aos ha resurgido el inters en las rejillas de ocupacin al apareceralgoritmos que permiten manejar el problema de los errores de odometra en la construccinde rejillas de entornos de gran tamao (ver (Thrun 1998; Thrun, Burgard, y Fox 1998)).

    2.2.3 Modelos geomtricosLos modelos geomtricos definen el entorno mediante sus caractersticas geomtricas (dis-tancias, dimensiones de los elementos que lo componen, posiciones absolutas). La ventajaprincipal de estos modelos es que, si se utilizan junto con un buen modelo del sensor, esposible simular los datos que los sensores del robot obtendran en cualquier posicin delentorno. Esto hace posible comparar los datos percibidos por el robot con los datos quese obtendran en posiciones candidatas, calculndose una actualizacin de la probabilidadasociada a cada posicin.

    Existen distintos tipos de modelos geomtricos. Un primer enfoque define el entor-no mediante un conjunto de caractersticas geomtricas (segmentos de rectas, esquinas) ymediante las relaciones geomtricas entre ellas (distancia, posicin, etc.). Ejemplos de utili-zacin de estos modelos son los trabajos (Drumheller 1987; Neira, Horn, Tardos, y Schmidt1997; Ohya, Nagashima, y Yuta 1994; Chong y Kleeman 1997; Leonard, Durrant-Whyte, yCox 1992; Cox 1991; Ayache y Faugeras 1989).

  • 2.2. MODELOS DEL ENTORNO 31

    Otro enfoque, los modelos geomtricos basados en caractersticas, se relaciona directa-mente con implementaciones de modelos de sensor en las que se utilizan estas caractersticasgeomtricas como elementos base del modelado (Barshan y Kuc 1990; Kuc 1990; McKe-rrow 1993). En la figura 2.3 se muestra un ejemplo de mapa del entorno construido a basede las caractersticas geomtricas definidas por Leonard (Leonard y Durrant-Whyte 1992):esquinas, aristas y segmentos de rectas.

    Figura 2.3: Ejemplo de modelo geomtrico del entorno. Las caractersticas geomtricasusadas en el modelo son: esquinas, aristas y segmentos de rectas.

    Otro conjunto de modelos geomtricos definen el entorno mediante un mapa CAD delmismo (Burgard, Fox, Henning, y Schmidt 1996; Burgard, Cremers, Fox, Hahnel, Lakeme-yer, Schulz, Steiner, y Thrun 1998). Un mapa CAD refleja los elementos del entorno quese desea modelar, recogiendo sus dimensiones y posiciones. En la figura 2.4 se muestra unejemplo de mapa CAD de un entorno.

    Cuanto ms detallado sea el modelo CAD mayor calidad tendrn las simulaciones delas lecturas de los sensores del robot en las posiciones candidatas. Evidentemente, paraobtener simulaciones de lecturas de buena calidad es necesario utilizar un buen modelo delsensor. Burgard (Burgard, Cremers, Fox, Hahnel, Lakemeyer, Schulz, Steiner, y Thrun1998) propone utilizar una simulacin sencilla de sensores de rango, obteniendo la distanciaangular con los obstculos del entorno en una posicin determinada.

    Por ltimo, los trabajos (Weib, Wetzler, y Puttkamer 1994; Lu y Milios 1994; Gutmanny Schlegel 1996; Lu y Milios 1997) proponen utilizar como modelo del entorno los propiosdatos percibidos por los sensores del robot (figura 2.5), aplicndoles el mnimo tratamientoposible (si acaso, una correccin de odometra). El problema principal de esta representacines que no se realiza ningn filtrado para eliminar ruido procedente de lecturas errneas, por

  • 32 CAPTULO 2. LOCALIZACIN Y MAPEADO EN ENTORNOS DE OFICINA

    Figura 2.4: Ejemplo de modelo CAD del entorno.

    Figura 2.5: Ejemplo de modelo sensorial del entorno, en el que el entorno es el mismo queel modelado por las figuras 2.3 y 2.4.

  • 2.3. APROXIMACIONES AL PROBLEMA DE LA LOCALIZACIN 33

    lo que slo es aplicable a sensores muy precisos (sensores de alcance por lser).

    2.3 Aproximaciones al problema de la localizacin

    Una vez revisados los principales tipos de modelos de entorno, pasamos a tratar el problemade la localizacin. Localizacin es el proceso de estimar la posicin de un robot mvil enun mapa que determina un sistema de coordenadas globales. Las fuentes de informacindisponibles para resolver el problema son las observaciones del entorno realizadas por elrobot y sus lecturas de odometra (incrementos de posicin registrados por el robot).

    Otros enfoques ms aplicados utilizan elementos externos incorporados artificialmenteal entorno (como reflectores, marcas visuales, lneas, etc.) para triangular la posicin delrobot (ver el informe de Borenstein (J. Borenstein 1996) para un exhaustivo repaso de estetipo de tcnicas). Descartamos la utilizacin de estos enfoques por la estructuracin artificialque imponen en el entorno.

    Es posible identificar dos variantes del problema general, dependiendo de si se suponeconocida la posicin inicial del robot o de si la desconocemos. Los enfoques de localizacinlocal suponen conocida la posicin del robot y realizan un seguimiento (tracking) de la mismapara estimar la siguiente posicin. Por otro lado, los enfoques de localizacin global intentanestimar la posicin del robot, sin tener un conocimiento a priori de la misma, utilizando lainformacin de las lecturas en varios instantes de tiempo.

    Revisaremos en este apartado distintas aproximaciones al problema de localizacin.

    2.3.1 Localizacin local

    El problema de la localizacin local se puede formular como el problema de realizar unseguimiento del estado del robot que compense los errores de odometra mediante el uso deobservaciones del entorno.

    Mtodos basados en landmarks

    Un conjunto de tcnicas atacan el problema mediante la identificacin de landmarks enlas observaciones. Las posiciones de estos landmarks son conocidas, y con ellas puedecorregirse la posicin del robot. Ejemplos de algoritmos que han implementado con xitoestas tcnicas son (Kuipers y Byun 1991; Kortenkamp y Weymouth 1994; Nourbakhsh,Powers, y Birchfeild 1995; Koenig y Simmons 1998; Ryu y Yang 1988).

  • 34 CAPTULO 2. LOCALIZACIN Y MAPEADO EN ENTORNOS DE OFICINA

    Mtodos basados en emparejamiento de caractersticasSe han propuesto distintos algoritmos basados en el siguiente esquema genrico: (1) estimarcaractersticas locales a partir de las ltimas observaciones y (2) encontrar la mejor correccina la posicin actual del robot maximizando la correlacin entre las caractersticas locales yel mapa del entorno.

    Por ejemplo, Weib (Weib, Wetzler, y Puttkamer 1994) construye histogramas locales apartir de barridos de sensores lser, que despus se correlacionan con histogramas almace-nados. Yamauchi (Yamauchi 1996) aplica una tcnica similar, pero utilizando rejillas deprobabilidad (Moravec y Elfes 1985) como elementos de emparejamiento.

    Mtodos basados en el filtro de Kalman

    El enfoque ms usado para resolver el problema de la localizacin local es la utilizacindel filtro de Kalman (Sorenson 1970), una conocida tcnica para integrar informacin en eltiempo. Este mtodo fue inicialmente propuesto por Kalman (Kalman 1960) para estimarel estado de un proceso dinmico lineal arbitrario. Cada variable que describe el estado delproceso se representa mediante una distribucin normal. Los parmetros de la distribucin(media y varianza) se actualizan siempre que se aplica un comando de control al sistema ysiempre que los sensores realizan nuevas mediciones. Estas dos actualizaciones del estadose suelen denominar prediccin y correccin. En la fase de prediccin, se modela el cambiodel estado debido a las acciones de control. En la fase de correccin se combina la estimacindel estado producida por la fase anterior con las lecturas realizadas por los sensores. Tal ycomo se ver, estas dos fases tambin estn presentes en la estimacin bayesiana. De hecho,se ha demostrado que el filtro de Kalman puede verse como un caso particular del enfoquede estimacin bayesiana (Barker, Brown, y Martin 1994).

    La aplicacin del filtro de Kalman a la localizacin de robots mviles estima la posi-cin .x; y; / del robot en el entorno mediante una distribucin normal. La covarianza deesta distribucin representa la incertidumbre local en la posicin estimada. Siempre que semueve el robot, la posicin estimada se desplaza segn la distancia medida por la odometradel robot. Las observaciones realizadas por los sensores se utilizan para actualizar la distri-bucin de probabilidad de la localizacin, buscando la nueva distribucin que maximiza laverosimilitud de las lecturas.

    La mayora de algoritmos que aplican el filtro de Kalman utilizan modelos de movimientosimilares, pero difieren en cmo se calcula la verosimilitud de las lecturas de los sensores.Existen dos grupos principales de tcnicas: basadas en caractersticas y basadas en rejillasde ocupacin.

    Entre las primeras, Leonard (Leonard, Durrant-Whyte, y Cox 1992) busca emparejarcaractersticas extraidas de las lecturas de sonar con caractersticas predichas a partir de un

  • 2.3. APROXIMACIONES AL PROBLEMA DE LA LOCALIZACIN 35

    mapa geomtrico del entorno. Las caractersticas son planos, cilindros y esquinas basadosen regiones de profundidad constante estimadas a partir de las lecturas del sonar. Cox (Cox1991) utiliza distancias medidas por sensores de rango de infrarrojos y las compara conuna descripcin del entorno basada en segmentos de rectas. Gutmann (Gutmann y Schlegel1996) extiende este trabajo a modelos del mundo aprendidos en una fase de exploracinprevia.

    Entre las segundas, Schiele (Schiele y Crowley 1994) compara distintas estrategias deseguimiento de la posicin del robot basadas en rejillas de ocupacin y en sensores deultrasonidos. En esta propuesta se construye una rejilla de ocupacin local que se se emparejacon la rejilla global para producir una posicin estimada que se combina con estimacionesprevias mediante el filtro de Kalman.

    Como conclusin, todas las implementaciones de tcnicas basadas en el filtro de Kalmansuponen que la posicin del robot puede representarse mediante una funcin de densidadnormal. Esta limitacin hace que estas tcnicas no sean robustas a ruido no modelado, ya quenicamente permiten representar una nica posicin posible del robot (funcin de densidadunimodal).

    En condiciones normales, el ruido en las observaciones (clutter) producido por obstcu-los no modelados har de distractor del filtro y podr ocasionar que el robot pierda totalmentesu localizacin.

    La suposicin de localizacin gaussiana hace tambin difcil tratar el problema de lalocalizacin global, ya que no se dispone de una estimacin inicial para la localizacin.Adems, debido a la ambigedad en la percepcin del entorno (distintas zonas del entornopueden generar mediciones similares), es necesario utilizar una funcin de distribucinmultimodal para representar la posible localizacin del robot.

    2.3.2 Localizacin globalTradicionalmente se ha supuesto que para solucionar el problema de la localizacin globalson necesarias tcnicas basadas en bsqueda, como la propuesta por Drumheller (Drumheller1987).

    El mtodo de Drumheller obtiene un conjunto de caractersticas (segmentos de rectas)a partir de las lecturas de los sonares del robot y busca el mejor emparejamiento entreestas caractersticas y el modelo del entorno, utilizando un algoritmo de emparejamiento decaractersticas propuesto por Grimson (Grimson 1990). Como hace notar Leonard (Leonardy Durrant-Whyte 1992), el uso de tcnicas de bsqueda no es lo suficientemente eficientepara un modo de funcionamiento continuo de un robot mvil. El enfoque de bsqueda fueabandonado por la comunidad de robtica mvil, y el problema de la localizacin global hapermanecido sin solucin hasta la utilizacin de enfoques bayesianos (Nourbakhsh, Powers,y Birchfeild 1995; Simmons y Koenig 1995; Kaelbling, Cassandra, y Kurien 1996; Burgard,

  • 36 CAPTULO 2. LOCALIZACIN Y MAPEADO EN ENTORNOS DE OFICINA

    Fox, Henning, y Schmidt 1996). Estos enfoques se pueden dividir en dos grandes grupos:los que utilizan modelos topolgicos y los que usan rejillas de probabilidad. Revisaremosambos mtodos despus de introducir los fundamentos de la localizacin bayesiana.

    2.4 Aproximaciones al problema del mapeado

    Al igual que los modelos del entorno, podemos distinguir dos enfoques fundamentales alproblema del mapeado, a saber, enfoques mtricos y enfoques topolgicos.

    Enfoques mtricos

    Uno de los mtodos ms antiguos y usados de construccin de mapas del entorno son lasrejillas de ocupacin. Las rejillas de ocupacin fueron propuestas inicialmente por Elfes yMoravec (Moravec y Elfes 1985; Elfes 1987), y desde entonces se han adaptado en numero-sos sistemas robticos (Borenstein y Korem 1991; Yamauchi 1996; Burgard, Fox, Henning,y Schmidt 1996; Thrun, Bucken, Burgard, Fox, Frohlinghaus, Hennig, Hofmann, Krell, ySchmidt 1998). Constituyen uno de los primeros enfoques probabilsticos capaces de fusio-nar distintas observaciones realizadas por el robot, adems de resaltar el papel fundamentaldel modelo del sensor en la construccin de los mapas. Su principal problema es la au-sencia de mecanismos correctores de los errores de odometra, por lo que no es factible laconstruccin de mapas de tamao medio. Este problema ha sido atacado por Thrun (Thrun1998) mediante la utilizacin de la hiptesis de ortogonalidad y paralelismo de las paredesdel entorno.

    Otros enfoques mtricos utilizan modelos geomtricos del entorno. Por ejemplo, Chatilay Laumon (Chatila y Laumond 1985), en una propuesta similar a la planteada en nuestro tra-bajo, proponen representar el entorno mediante polgonos en un sistema de referencia global.En la propuesta se sugiere descomponer el espacio libre en un pequeo nmero de celdascorrespondientes a habitaciones, pasillos, puertas, etc. Sin embargo, aunque el enfoquecontiene elementos muy atractivos, no se detalla el mismo ni se presentan experimentos quedemuestren su aplicabilidad. Leonard (Leonard y Durrant-Whyte 1992) propone la cons-truccin iterativa, mediante un filtro de Kalman, de una interpretacin del entorno basada encaractersticas elementales como segmentos y esquinas. Thrun (Thrun 1997) construye ma-pas geomtricos de forma incremental a base de concatenar segmentos de rectas detectadosen secuencias temporales de mediciones de sonar.

    Por ltimo, un conjunto de mtodos suponen que se parte de ciertos modelos a priori delentorno e intentan ajustar distintos parmetros del modelo mediante las lecturas realizadaspor el robot. Es el caso de los trabajos de Koenig y Simmons (Koenig y Simmons 1996)y Shatkay (Shatkay y Kaelbling 1997), que utilizan el algoritmo EM (tambin conocido

  • 2.5. FUNDAMENTOS DE LA LOCALIZACIN BAYESIANA 37

    como Baum-Welch) (Rabiner y Juang 1986) para realizar la estimacin. Recientemente,Thrun (Thrun 1998) ha formulado el problema de la construccin de mapas del entornoen trminos bayesianos (como detallaremos en el apartado 2.6). Sin embargo, ha aplicadoesta formulacin al problema ms restringido de encontrar el mejor mapa del entorno queexplica una secuencia de observaciones de n tipos de landmarks, observaciones que han sidorecogidas de forma manual.

    Enfoques topolgicos

    Los enfoques topolgicos definen los mapas como grafos, con los nodos correspondiendo alugares y los arcos a acciones genricas que mueven el robot de un lugar a otro. A menudose aade a estos grafos informacin mtrica que facilita la navegacin de un lugar a otro.Intentan resolver, sobre todo, el problema del mapeado global.

    Uno de los primeros trabajos en esta lnea fue el de Kuipers y Byun (Kuipers y Byun 1988;Kuipers y Byun 1991). Los nodos de su propuesta se corresponden con lugares distinguiblesdel entorno mediante alguna funcin genrica aplicada a los datos percibidos por los sensores.En concreto, proponen utilizar como medida de distincin de los lugares el nmero deobstculos equidistantes. De esta forma los nodos de sus grafos topolgicos representanmximos locales de esta medida de distincin. Los arcos corresponden a conductas denavegacin que el robot utiliza para moverse de un lugar a otro (como "seguir pared", o"seguir pasillo") junto con informacin mtrica adicional sobre la conducta de navegacinseguida. El robot explora el entorno y construye el mapa topolgico de forma incremental,conforme va encontrando nuevos lugares distinguibles. Sin embargo, estas propuestas slohan sido comprobadas en entornos simulados y, en estas simulaciones, el robot contaba conuna brjula que eliminaba los errores de odometra en la orientacin.

    Un enfoque similar fue propuesto por Mataric (Mataric 1992). Su algoritmo utiliza comonodos topolgicos landmarks predefinidos como segmentos rectos, puertas o esquinas. Loslugares topolgicos vecinos que va encontrando el robot se conectan mediante aristas querepresentan tambin conductas de navegacin junto con informacin mtrica que ayuda alocalizar al robot. La propuesta fue probada en un robot real evolucionando en una pequeahabitacin. Los problemas del mtodo propuesto residen en la dificultad de tratar mapas demayor tamao y en la sensibilidad del mismo a falsas detecciones de landmarks.

    2.5 Fundamentos de la localizacin bayesianaLa localizacin bayesiana proporciona un potente marco probabilstico general para estimarla posicin de un robot mvil en a partir de las observaciones realizadas por el robot y a lasacciones realizadas.

  • 38 CAPTULO 2. LOCALIZACIN Y MAPEADO EN ENTORNOS DE OFICINA

    Se han realizado distintas propuestas e implementaciones de este paradigma (Nourbak-hsh, Powers, y Birchfeild 1995; Simmons y Koenig 1995; Kaelbling, Cassandra, y Kurien1996; Burgard, Fox, Henning, y Schmidt 1996). En el captulo 5 aportaremos una nue-va propuesta, basada en la utilizacin de mtodos estocsticos de muestreo, que mejora laeficiencia y la precisin de las implementaciones realizadas hasta el momento.

    Formularemos en esta seccin el enfoque bayesiano utilizando una notacin general en laque tendrn cabida distintas implementaciones especficas. Estas implementaciones (filtrosde Kalman, rejillas de probabilidad y mtodos topolgicos) se revisarn posteriormente.

    2.5.1 Definiciones y consideraciones previas

    Para definir formalmente la localizacin bayesiana, sea .x1; x2; : : : ; xt / una secuencia de va-riables aleatorias que representan el estado del robot mvil en sucesivos instantes de tiempo.La variable aleatoria x puede estar definida sobre el espacio paramtrico de configuraciones.x; y; / del robot (siendo x e y coordenadas cartesianas en un mapa global del entorno y la orientacin del robot) o puede tomar valores en el espacio discreto de nodos topolgicosque representan el entorno.

    En cada instante de tiempo t el robot realiza una observacin zt del entorno y realiza unaaccin at . La variable aleatoria z puede ser una tupla con valores de distancias medidas porsonares o por sensores lser, o puede ser una imagen del entorno tomada por una cmara.La accin at proporciona informacin sobre el siguiente estado xtC1 del robot y puede tomarvalores en el espacio de velocidades .v; !/ del robot (donde v es la velocidad lineal y ! laangular), puede tambin representar incrementos de posicin .4x;4y;4/ obtenidos delos mecanismos de odometra del robot, o puede representar un valor tomado de un espaciodiscreto de comandos (moverse en la direccin , seguir pared o girar a la derecha).

    El enfoque bayesiano nos permite estimar la funcin de densidad de la posicin del robotxt en el instante t , dadas las observaciones y acciones realizadas hasta ese instante y dada laprobabilidad a priori p.x1/. Esta funcin de densidad representa la probabilidad a posterioridespus de t instantes de tiempo, y se formula matemticamente como

    p.xt j z1; : : : ; zt ; a1; : : : ; at1/: (2.1)Veremos a continuacin una formulacin recursiva que permite la actualizacin de la

    funcin de densidad en el instante t , p.xt / a partir de la densidad en el instante anterior,p.xt1/, de los datos medidos en el instante t , zt , y de la accin previa at1.

    Para llegar a esta formulacin es necesario considerar dos suposiciones, a saber, la con-dicin de Markov del modelo dinmico y la independencia de las observaciones. Tratamoscada suposicin por separado.

  • 2.5. FUNDAMENTOS DE LA LOCALIZACIN BAYESIANA 39

    Condicin de Markov

    El modelo dinmico del robot determina la informacin que las acciones y los estados previosproporcionan sobre el estado actual. La formulacin de este modelo se expresa como unafuncin de probabilidad condicional

    p.xt j x1; : : : ; xt1; a1; : : : ; at1/:

    La condicin de Markov sobre el modelo dinmico determina que el nuevo estado de-pende nicamente del estado y de la accin anterior. Esto es,

    p.xt j x1; : : : ; xt1; a1; : : : ; at1/ D p.xt j xt1; at1/: (2.2)La condicin de Markov establece que el conocimiento de las acciones y posiciones

    previas, .a1; : : : ; at2; x1; : : : ; xt2/, no proporciona ninguna informacin adicional a laderivada de conocer la posicin y accin inmediatamente previas.

    Independencia en las observaciones

    La segunda suposicin se refiere a las medidas z observadas por el robot. Se supone quedichas observaciones son independientes con respecto al tiempo, esto es, que

    p.z1; : : : ; zt j x1; : : : ; xt ; a1; : : : ; at1/ DtiD1p.zi j xi ; ai1/; (2.3)

    y que la probabilidad de la observacin depende del estado y no de la accin previa

    p.zi j xi ; ai/ D p.zi j xi/: (2.4)As,

    p.z1; : : : ; zt j x1; : : : ; xt ; a1; : : : ; at1/ DtiD1p.zi j xi/: (2.5)

    Esta suposicin permite formular la funcin de probabilidad conjunta de todas las obser-vaciones como el producto de la funcin de verosimilitud de cada lectura. La suposicin deindependencia, a pesar de no ser estrictamente correcta, se aplica normalmente con xito enmuchos trabajos que utilizan estos enfoques (Pearl 1988) y, en concreto, en la construccinincremental de mapas de ocupacin del entorno (Moravec 1998; Thrun 1998).

  • 40 CAPTULO 2. LOCALIZACIN Y MAPEADO EN ENTORNOS DE OFICINA

    2.5.2 Actualizacin de la probabilidad a posterioriSe utiliza la regla de Bayes para calcular la probabilidad a posteriori

    p.xt j z1; : : : ; zt ; a1; : : : ; at1/ Dp.zt j xt ; z1; : : : ; zt1; a1; : : : ; at1/p.xt j z1; : : : ; zt1; a1; : : : ; at1/ (2.6)

    Esto es, la probabilidad a posteriori puede expresarse como la verosimilitud de la ltimalectura, ponderada por la funcin de probabilidad a priori de la posicin del robot.

    La verosimilitud de la ltima lectura depende nicamente de la posicin actual del robot

    p.zt j xt ; z1; : : : ; zt1; a1; : : : ; at1/ D p.zt j xt /: (2.7)Este trmino se denomina normalmente modelo de observacin o modelo del sensor.

    Hay que hacer notar que en la expresin de probabilidad hay implcita una variable que defineel mapa del entorno, ya que las observaciones dependen tanto de la posicin del robot comodel entorno en el que ste evoluciona. Esta variable se hace explcita en aquellos enfoquesque pretenden realizar una estimacin del mapa del entorno a partir de las lecturas realizadaspor el robot (Thrun 1998; Koenig y Simmons 1996), tal y como haremos en la seccin 2.6,utilizndose entonces la expresin

    p.zt j xt ; /;

    donde es la variable que define el modelo del entorno.El segundo trmino de la ecuacin 2.6 describe la estimacin a priori de la localizacin

    xt inmediatamente despus de la accin at1 y antes de realizar la observacin zt . El modelodinmico (ecuacin 2.2) permite expresar esta densidad como

    p.xt j z1; : : : ; zt1; a1; : : : ; at1/ Dxt1

    p.xt j xt1; at1/p.xt1 j z1; : : : ; zt1; a1; : : : ; at2/: (2.8)

    Si observamos el ltimo trmino de la ecuacin anterior,

    p.xt1 j z1; : : : ; zt1; a1; : : : ; at2/

    podremos comprobar que representa la estimacin a posterior anterior, por lo que podremosformular la ecuacin 2.6 como

  • 2.5. FUNDAMENTOS DE LA LOCALIZACIN BAYESIANA 41

    p.xt / D p.zt j xt /

    xt1p.xt j xt1; at1/p.xt1/; (2.9)

    que proporciona una expresin recursiva de la estimacin a posteriori de la localizacindel robot. El factor es un factor de normalizacin que asegura que

    xtp.xt / D 1.

    La expresin anterior es una expresin genrica que se aplica a cualquier implementacinconcreta de la localizacin bayesiana, obtenida mediante la definicin de un modelo deobservacin y de movimiento especficos.

    Pero, sobre todo, lo que distingue los distintos enfoques de localizacin bayesiana es elmtodo escogido para estimar computacionalmente la funcin de densidad anterior. Revi-samos en el siguiente apartado los mtodos ms utilizados hasta el momento.

    2.5.3 Estimacin de la funcin de densidad a posterioriEn la seccin anterior se ha derivado la expresin matemtica de la funcin de densidad aposteriori. Revisaremos en esta seccin las distintas tcnicas propuestas para su estimacincomputacional.

    Entre las ms extendidas se incluyen: (1) la suposicin de que p.x/ es una funcinnormal y la estimacin de sus parmetros (mediante el filtro de Kalman, (2) la discretiza-cin del espacio de la variable aleatoria x (mtodos basados en la estimacin de rejillas deprobabilidad) y (3) la consideracin de que x toma valores discretos (mtodos topolgicos).

    Frente a estos enfoques proponemos en la tesis la utilizacin de filtros de partculas querepresentan la funcin de densidad mediante un conjunto de muestras.

    La localizacin bayesiana mediante el filtro de Kalman ya ha sido comentada previa-mente. Revisamos a continuacin los enfoques de rejillas de probabilidad y de mtodostopolgicos. En el captulo 5 presentaremos nuestra propuesta de estimacin bayesianamediante un filtro de partculas.

    Rejillas de probabilidadFrente a la propuesta anterior, las rejillas de probabilidad (Burgard, Fox, Henning, y Schmidt1996; Thrun, Burgard, y Fox 1998) permiten representar y actualizar funciones de proba-bilidad arbitraria. Para ello discretizan con una resolucin fina todo el espacio de posibleslocalizaciones x del robot y formulan las funciones de densidad de la ecuacin 2.9 comofunciones constantes en los intervalos correspondientes a la discretizacin. De esta forma, laactualizacin de la funcin de densidad se completa iterando por todos los posibles valoresdiscretos.

    Es interesante recoger aqu el proceso de actualizacin de la funcin de densidad aposteriori, dada la similitud que tendr el mismo con el mtodo basado en muestreo que

  • 42 CAPTULO 2. LOCALIZACIN Y MAPEADO EN ENTORNOS DE OFICINA

    propondremos ms adelante. La formulacin est basada en los trabajos de Burgard (Burgard,Fox, Henning, y Schmidt 1996; Burgard, Cremers, Fox, Hahnel, Lakemeyer, Schulz, Steiner,y Thrun 1998) y aparece, en forma de algoritmo, en la tabla 2.1. En el algoritmo, se utiliza lanotacin P.xi/ para referirse a la estimacin de la probabilidad para la celdilla i del espacioparamtrico X de posibles configuraciones del robot.

    Algoritmo: Localizacin bayesiana con rejilla de probabilidad

    1. InicializacinPara cada celdilla xi 2 X

    P.xi/ P0.xi/

    2. Actualizacin de la accin aPara cada celdilla xi 2 X

    P.xi/

    xj

    P .xi j xj ; a/P .xj /

    3. Actualizacin de la lectura zPara cada celdilla xi 2 X

    P.xi/ P.z j xi/P .xi/P .xi/ P.xi/

    xjP .xj /

    (normalizacin)

    4. Saltar a 2.

    Tabla 2.1: Algoritmo de localizacin basado en rejillas de probabilidad.

    Los mtodos basados en este enfoque han demostrado su potencia en aplicaciones enrobots reales (Burgard, Cremers, Fox, Hahnel, Lakemeyer, Schulz, Steiner, y Thrun 1998;Koenig y Simmons 1998), pero tienen ciertos problemas, entre los que se pueden citar lacomplejidad computacional y la necesidad de definir a priori el tamao de la discretizacindel espacio de parmetros y, por ello, su precisin.

  • 2.6. FUNDAMENTOS DEL MAPEADO BAYESIANO 43

    Mtodos topolgicos

    Los mtodos topolgicos (Nourbakhsh, Powers, y Birchfeild 1995; Kaelbling, Cassandra,y Kurien 1996; Koenig y Simmons 1998) definen un espacio discreto de estados para elrobot, distinto del espacio de configuraciones .x; y; /. Este espacio discreto suele ser deun grano muy grueso (pasillo,unin,final de pasillo), en contraste con el grano fino usadoen el enfoque anterior. Por ejemplo, Nourbakhsh (Nourbakhsh, Powers, y Birchfeild 1995)utiliza nodos topolgicos que representan pasillos o uniones.

    El grano grueso mejora la complejidad computacional del mtodo anterior. Sin embargo,no se garantiza una localizacin precisa del robot y se producen con frecuencia errores deconfusin de estados, debidos a la ausencia de informacin mtrica en los nodos.

    2.6 Fundamentos del mapeado bayesianoAl igual que en el apartado de localizacin bayesiana (seccin 2.5), denotamos por .x1; : : : ; xT /la secuencia de variables aleatorias que definen el estado del robot mvil en sucesivos instan-tes de tiempo. En cada instante t T el robot ha realizado una observacin zt y ejecutadouna accin at . Llamaremos D a la secuencia de observaciones y acciones obtenidas

    D D .z1; a1; z2; a2; : : : ; aT1; zT /: (2.10)La utilizacin de la variable T mayscula hace notar que el nmero de observaciones es

    constante. El proceso de mapeado se aplica una vez que el robot ha realizado la exploracindel entorno, y ha almacenado las observaciones realizadas. Todas ellas se van a utilizarpara estimar los mejores parmetros que definen el mapa del entorno. Estos parmetros serepresentan con una variable aleatoria, , cuyos valores dependen del enfoque utilizado.Por ejemplo, en el trabajo de Thrun (Thrun, Burgard, y Fox 1998), es una asignacin decoordenadas cartesianas .x; y/ a un conjunto de landmarks que el robot ha ido registrandomientras navegaba. En la propuesta de Koenig (Koenig y Simmons 1996), se estima ladistancia entre los nodos de un mapa topolgico construido a priori. En nuestra propuesta, lavariable representa un conjunto de parmetros utilizados en la definicin de las coordenadasde los vrtices del modelo poligonal construido a priori.

    Siguiendo el enfoque bayesiano, se debe encontrar el mapa ms probable dada lasecuencia de datos observadaD, esto es, el mapa mximo a posteriori (MAP). Aplicando laregla de Bayes, el MAP es el valor de que cumple

    D arg maxp. jD/ D

    D arg maxp.D j/p./: (2.11)

  • 44 CAPTULO 2. LOCALIZACIN Y MAPEADO EN ENTORNOS DE OFICINA

    El trmino p.D j/ define la verosimilitud de la secuencia de datos dado el mapa , yel trmino p./ define la probabilidad a priori de . En muchos enfoques se supone quela probabilidad a priori de es uniforme. En este caso, podemos simplificar la ecuacinanterior y considerar slo el trmino p.D j/ para encontrar el mapa ms probable. El valorde que maximiza este trmino se denomina valor de mxima verosimilitud (MV)

    D arg maxp.D j/: (2.12)

    Desarrollando el trmino de verosimilitud de la ecuacin anterior, podemos incorporaren el mismo la secuencia de posiciones .x1; : : : ; xT / en las que se ha encontrado el roboten los sucesivos instantes de tiempo. Estas variables se denominan variables ocultas en laterminologa de los Modelos Ocultos de Markov (Hidden Markov Models, HMM) ya queel observador no tiene acceso directo a ellas (consultar (Rabiner y Juang 1986) para unarevisin sobre los HMM y algoritmos asociados).

    Si se conocieran estas posiciones, podramos expresar el estimador de mxima verosi-militud como

    D arg maxp.D; x1; : : : ; xT j/: (2.13)

    Aplicando la definicin de la probabilidad condicional, se llega a la siguiente expresinde la funcin de densidad en la ecuacin 2.13

    p.D; x1; : : : ; xT j/ D p.D j x1; : : : ; xT ; /p.x1; : : : ; xT jD/; (2.14)Dado que la observacin zt depende nicamente del mapa y de la posicin del robot

    en el instante t , xt , y suponiendo independencia entre las observaciones, el primer trminode la ecuacin anterior puede reescribirse como

    p.D j x1; : : : ; xT ; / DTtD1p.zt j xt ; /: (2.15)

    La localizacin del robot en el instante t , xt , depende nicamente de su localizacin enel instante t 1, xt1, y de la accin at realizada por el robot en ese instante,

    p.x1; : : : ; xT jD/ D p.x1/TtD2p.xt j xt1; at1/: (2.16)

    El trmino p.x1/ determina la distribucin a priori de la localizacin del robot en elprimer instante de tiempo.

  • 2.6. FUNDAMENTOS DEL MAPEADO BAYESIANO 45

    Sustituyendo las ecuaciones 2.15 y 2.16 en la ecuacin principal 2.13 se llega a laformulacin final del mapa de mxima verosimilitud

    D arg maxp.D; x1; : : : ; xT j/ D

    D arg maxp.x1/

    TtD1p.zt j xt ; /

    TtD2p.xt j xt1; at1/: (2.17)

    La expresin final, al igual que la expresin que determina la localizacin (2.9), dependenicamente del modelo de observacin, p.zi j xi ; /, y del modelo dinmico del robot,p.xi j xi1; ai1/.

    El problema fundamental de la expresin 2.17 es que no se conoce el valor de las posi-ciones .x1; : : : ; xT /. Una solucin, claramente ineficiente, sera integrar todos los posiblesvalores de estas variables, de forma que se calculara

    arg max

    x1

    : : :

    xT

    p.x1/

    TtD1p.zt j xt ; /

    TtD2p.xt j xt1; at1/: (2.18)

    Existe, afortunadamente, una tcnica que realiza un descenso por gradiente en el espaciode verosimilitud: el mtodo EM (Dempster, Laird, y Rubin 1977), que, en el contexto de losHMM se denomina algoritmo Baum-Welch (Rabiner y Juang 1986) (para aplicaciones delEM en el contexto del mapeado, consultar (Koenig y Simmons 1996; Shatkay y Kaelbling1997; Thrun, Burgard, y Fox 1998)). Un algoritmo EM realiza un descenso por gradienteen el espacio de verosimilitud alternando dos pasos, un paso de estimacin (expection)(paso E) y un paso de maximizacin (paso M). En el paso E, se estiman los valores msprobables de las localizaciones del robot basndose en el mejor valor del mapa obtenidohasta el momento (en la primera iteracin no hay ninguno). En el paso M se estima unmapa de mxima verosimilitud a partir de las localizaciones estimadas en el paso E. El pasoE puede interpretarse como un procedimiento de localizacin dado un mapa fijo, mientrasque el paso M implementa un proceso de mapeado bajo la suposicin de que la localizacindel robot es conocida. La aplicacin iterativa de ambos pasos conduce a un refinamientosucesivo tanto de las posiciones estimadas como del mapa.

    Un algoritmo EM de mapeado debe proporcionar implementaciones del paso E y del pasoM. Dependiendo del modelo del entorno y de las funciones de densidad, ser ms o menosdirecto implementar ambos pasos. En nuestro caso, al ser un modelo paramtrico, y lafuncin de verosimilitud una funcin multimodal no representable mediante una distribucinnormal, no es posible llegar a una solucin cerrada de ninguno de los pasos. En el captulo7 proponemos un algoritmo estocstico que sigue la filosofa del EM para buscar el mapa demxima verosimilitud.

  • 46 CAPTULO 2. LOCALIZACIN Y MAPEADO EN ENTORNOS DE OFICINA

    2.7 DiscusinSe han presentado en este captulo los problemas de la localizacin y el mapeado, queconstituyen los problemas centrales de la tesis. Se han revisado los distintos enfoquesy propuestas existentes en la literatura para tratar ambas cuestiones, haciendo un nfasisespecial en los distintos modelos de entorno, en las propuestas de localizacin global y localy en los enfoques para resolver el problema del mapeado.

    Se presenta una formalizacin de ambos problemas utilizando la teora de estimacinbayesiana. Esta formalizacin unifica las propuestas existentes y proporciona un marcogeneral en el que se pueden formular muchas de las tcnicas propuestas.

  • Captulo 3

    Un modelo estocstico del sonar

    Un buen modelo del sonar proporciona una estimacin correcta de las lecturas reales queel sensor realizara dado un entorno conocido. Esta estimacin nos va a permitir formularuna funcin de verosimilitud, con la que, dado un modelo del entorno, unos datos ledos yuna posicin del robot, sea posible determinar la probabilidad de que los datos hayan sidorealmente percibidos en ese entorno y en esa posicin.

    La funcin de verosimilitud de las lecturas del sonar ser el elemento clave de losalgoritmos de localizacin y mapeado.

    3.1 IntroduccinLa palabra sonar deriva del ingls SOund NAvigation and Ranging, y se suele utilizar paradenominar dispositivos que detectan y localizan objetos submarinos mediante la emisinde ondas de sonido y el clculo del tiempo de recepcin del eco rebotado. Por extensin,reciben el mismo nombre los sensores de distancia de uso en robots mviles, basados en laemisin de pulsos de ultrasonidos y en la medicin de la distancia de los obstculos por eltiempo de recepcin del eco.

    A pesar del alto nivel de ruido existente en sus lecturas, los sonares se han convertido enel sensor de distancia tpico de los robots mviles. Se ha utilizado el sonar, por ejemplo, paradetectar obstculos (Arkin 1989; Borenstein y Korem 1991), construir mapas de ocupacindel entorno (Elfes 1989) o localizar la posicin del robot en un entorno previamente conocido(Drumheller 1987).

    El alto nivel de incertidumbre de las lecturas del sonar aconseja tratarlas mediante algunatcnica basada en modelos probabilsticos bayesianos (Fukunaga 1990) (incluyendo el filtrode Kalman y sus variantes (Dean y Wellman 1991)). De hecho, este tipo de enfoques se hanaplicado al sonar desde los comienzos de la investigacin en robtica mvil (Moravec y Elfes

    47

  • 48 CAPTULO 3. UN MODELO ESTOC`STICO DEL SONAR

    1985; Matthies y Elfes 1988), aunque es en la actualidad cuando comienza a reconocerseplenamente su utilidad (Koenig y Simmons 1998; Fox, Burgard, Thrun, y Cremers 1998b;Thrun 1998).

    En los enfoques bayesianos, como el propuesto en esta tesis, tiene una importanciafundamental realizar un clculo correcto de la verosimilitud, y para ello es indispensable unbuen modelo del sensor.

    Este trabajo propone una funcin multimodal de verosimilitud de un sonar genricobasada en un modelo novedoso y realista del sensor que incorpora caractersticas no con-templadas hasta el momento. El modelo parte de la formulacin de Barshan (Barshan y Kuc1990), a la que aadimos la utilizacin de una tcnica equivalente al trazado de rayos (Watt yWatt 1992) para simular todas las posibles trayectorias de los haces de ultrasonidos emitidospor el transductor. De esta forma es posible simular lecturas que, hasta el momento, erandespreciadas como errores del sonar y, sin embargo, pueden ser modeladas correctamentemediante dobles rebotes.

    Todas las medidas y experimentos presentado en este trabajo han sido realizados con elanillo de 24 sonares de PIXIE (ver figura 3.1).

    (a) (b)

    Figura 3.1: PIXIE, robot mvil RWI B-21 con el que se ha realizado la experimentacin:(a) fotografa, (b) esquema mostrando sus elementos.

    En el apartado 2 describiremos las caractersticas principales de los transductores deultrasonidos, presentando datos reales del anillo de sonares. En el apartado 3 se propone

  • 3.2. CARACTERSTICAS DEL SONAR 49

    un modelo emprico de interaccin entre un haz de ultrasonidos y el entorno. Este modelose utiliza como base del algoritmo de trazado de rayos especificado en el apartado 4. Eneste apartado tambin se detallan los distintos parmetros que permiten ajustar el modeloa las lecturas reales, y se estudian los resultados obtenidos por el algoritmo de simulacin,examinndose cmo varan dichos resultados en funcin de los valores dados a parmetrosdel modelo. Por ltimo se comparan dichos resultados con lecturas reales y se realiza elajuste de los parmetros a los datos reales. En el ltimo apartado se formula la verosimilitudmultimodal de las lecturas de un sonar y de un anillo basndose en el modelo planteado.

    3.2 Caractersticas del sonar

    Veremos en este apartado las caractersticas de los sensores de ultrasonidos Polaroid y ex-plicaremos el funcionamiento usual de los anillos de sonares usados habitualmente en losrobots mviles. Enumeraremos los distintos problemas inherentes a los sensores de ultraso-nidos de este tipo y, por ltimo, presentaremos datos experimentales de lecturas realizadasen distintos entornos y condiciones.

    3.2.1 Funcionamiento del transductor de ultrasonidos Polaroid

    Un transductor Polaroid (Polaroid Corp. 1984) tiene una forma circular, con un dimetro deunos 5 cm. Una fotografa de un sensor de este tipo aparece en la figura 3.2.

    Figura 3.2: Fotografa de uno de los transductores Polaroid con los que se ha realizado laexperimentacin.

    El transductor acta como emisor y como receptor de seales de ultrasonidos. En sufuncionamiento como emisor, enva frontalmente un breve tren de pulsos de ultrasonidos deunos 50 kHz. con el perfil de intensidad que aparece en la figura 3.3. Este perfil determinaun haz principal de sonido en forma de cono con una extensin angular de unos 15 a ambos

  • 50 CAPTULO 3. UN MODELO ESTOC`STICO DEL SONAR

    lados del eje central en el que est orientado el transductor. A mayor distancia angular laintensidad del sonido decae exponencialmente.

    Figura 3.3: Patrn de intensidad de emisin de ultrasonidos (en dB) en funcin de la distanciaangular al eje de orientacin del transductor.

    La duracin del tren de ultrasonidos suele ser de alrededor de 1 ms. Despus de haberemitido los pulsos, el sensor pasa a modo receptor, esperando los ecos procedentes de losobstculos. Un amplificador va aumentando de forma calculada su ganancia para eliminarel efecto de atenuacin del sonido con la distancia. Los ecos recibidos (ver figura 3.4)se filtran mediante un sencillo algoritmo de umbralizacin, y aquellos que sobrepasen elumbral de intensidad especificado se interpretan como ecos procedentes de un obstculo.Tanto el umbral de intensidad como la ganancia se modifican manualmente en el proceso decalibracin del sensor. Debido a ello es bastante probable que existan variaciones importantesen las lecturas proporcionadas por distintos sonares.

    Figura 3.4: Eco de un pulso de ultrasonidos con mltiples reflexiones.

    Una vez detectado un eco se calcula la distancia al objeto que lo ha producido mediante eltiempo transcurrido (TOF Time Of Flight) desde la emisin del pulso hasta la recepcin

  • 3.2. CARACTERSTICAS DEL SONAR 51

    del eco. En la figura 3.4 esto sucede, para el primer obstculo, en el instante marcado comot0. A partir del TOF se obtiene, mediante la siguiente frmula, la distancia R0 a la que estsituada el obstculo.

    R0 D ct02 ; (3.1)

    donde c es la velocidad del sonido en el aire 1.El sensor puede funcionar detectando el obstculo ms cercano o bien puede devolver los

    TOF de las lecturas que superan el umbral en un determinado intervalo de tiempo despusde emitido el pulso. Todos los experimentos se han realizado con el sensor funcionando enel primer modo. Si, despus de un intervalo de tiempo predefinido, no se detecta ningneco, el sensor devuelve un valor mximo arbitrario.

    3.2.2 Errores de medida en las lecturas del sensor de ultrasonidos

    En muchas ocasiones las lecturas realizadas por un sensor de ultrasonidos contienen erro-res debido fundamentalmente a dos factores: la extensin angular del haz de sonido y lainclinacin de los obstculos frente al sensor.

    Estos dos factores producen tres tipos fundamentales de errores, que enumeramos acontinuacin.

    1. No recepcin del eco por un ngulo de incidencia demasiado grande.Como se representa en la figura 3.5 (