modulo i

43
Modulo I: Repaso de Inteligencia Artificial Universidad de Guadalajara Redes Neuronales Artificiales Dra. Alma Yolanda Alanís García

Upload: malio96

Post on 26-Dec-2015

212 views

Category:

Documents


0 download

DESCRIPTION

redes neuronales

TRANSCRIPT

Modulo I: Repaso de Inteligencia Artificial

Universidad de Guadalajara Redes Neuronales Artificiales Dra. Alma Yolanda Alanís García

2

Definición de inteligencia

La inteligencia de las máquinas La Inteligencia Artificial (IA) es un término establecido a mediados del siglo XX, se caracteriza por una sucesión de períodos alternativos de éxito y abandono. La idea intuitiva de Inteligencia Artificial creó expectativas que no siempre se han cumplido, y desde luego, no en el grado en el que se había esperado de forma un tanto ilusoria.

3

Pero actualmente se puede considerar que el enfoque computacional inteligente no depende de inmediatos y probados resultados, sino que está avalado por sus logros y su desarrollo; Por lo que se ha consolidado en el ámbito de la computación como un concepto totalmente asumido aunque aún sometido a controversia en algunos sectores científicos. La inteligencia Artificial ha tenido siempre como modelo natural las funciones inteligentes del hombre, centrándose en distintos aspectos. Su primera motivación, que data de varios siglos atrás, fue intentar construir máquinas que pudieran pensar como el ser humano, o al menos, emularle en alguna capacidad que denotará cierta inteligencia

4

Es común suponer, que para que un sistema actúe de forma inteligente, debe imitar las funciones de las criaturas vivas en cuanto a algunas de sus facultades mentales. Por lo menos, la inteligencia requiere la habilidad de percibir y adaptarse al entorno, tomar decisiones y realizar acciones de control. Altos niveles de inteligencia pueden incluir el reconocimiento de objetos y sucesos, la representación del conocimiento en modelos lingüísticos, el razonamiento y la planificación.

5

En grados más avanzados, la inteligencia proporciona la capacidad de percibir, entender, elegir razonadamente y actuar satisfactoriamente bajo una gran variedad de circunstancias, así como de prosperar, sobrevivir y reproducirse en un entorno complejo y a menudo hostil. La inteligencia además crece y evoluciona. De la mano de potentes computadoras, las técnicas proporcionadas por la IA se han utilizado para intentar conseguir algunos de los objetivos mencionados.

6

En los comienzos del siglo XXI, la ciencia y la tecnología se enfrentan al reto de encontrar e implementar mejores y más sofisticadas soluciones en el área de la computación, con su amplio rango de aplicaciones; Esto como respuesta a la siempre creciente demanda de la sociedad, de la industria y de la humanidad en general. En este tipo de situaciones, la IA ofrece perspectivas interesantes ya que es capaz de suministrar metodologías que permiten realizar de forma automática algunas de las tareas realizadas típicamente por los humanos.

7

El estudio y desarrollo de sistemas inteligentes requiere grandes esfuerzos de investigación multidisciplinaría para integrar conceptos y métodos de distintas áreas, como Ciencias de la computación, Inteligencia artificial, Investigación operativa, Gestión del conocimiento, Tratamiento de la información, Control, Identificación, Estimación, Teoría de la comunicación, etc.

8

La IA está ayudando a expandir el horizonte del tratamiento de la información. Parte de esta expansión se debe a la extensión de las fronteras de la tecnología. Desde el microprocesador al impacto del procesamiento en paralelo, por medio de redes neuronales o los procesadores fuzzy, todo apunta a la expansión de las técnicas computacionales

9

Definición de sistema inteligente Hay muchas formas de definir un comportamiento inteligente, quizá porque se puede entender que hay distintos tipos de inteligencia. Por ejemplo, el hecho de ser capaz de recopilar información y a partir de ella deducir un diagnostico o proponer un tratamiento supone inteligencia;

Así como el hecho de ser capaz de procesar información incompleta o con incertidumbre,

O aprender de ejemplos, entre otros.

10

El diccionario define la inteligencia como “la capacidad de adquirir y aplicar conocimiento”. Esta definición es bastante general y de acuerdo con ella, incluso un termostato podría ser considerado un sistema inteligente aunque con un nivel bajo de inteligencia. Por eso se hace hincapié al hablar de “inteligente” en un alto grado de inteligencia. El sistema inteligente tiene la habilidad de actuar apropiadamente en un entorno con incertidumbre, donde una acción adecuada es la que aumenta la probabilidad del éxito, y el éxito es la consecución de los objetivos de comportamiento del sistema.

11

Concretando la definición para máquinas y sistemas, se considera inteligente aquella que satisface el test de Turing (hombre y máquina realizan la misma tarea con el mismo resultado). Alan Turing (1912-1954) fue un científico y matemático inglés, que estableció las bases teóricas de las que serian las computadoras digitales. La máquina universal de Turing, un dispositivo consistente en una cinta con símbolos (programa) y un escáner de lectura/escritura (el ordenador), podía emular un comportamiento de un ser humano trabajando con papel y lápiz, siguiendo un proceso mecánico o algoritmo. La máquina universal de Turing puede simular el comportamiento de cualquier otra máquina de procesamiento.

12

La prueba de Turing diseñada para demostrar si una máquina puede pensar, consiste a grandes rasgos en:

1. Dos personas y una computadora; una de las personas es el

interrogador y la otra persona y la computadora son los elementos que van ha ser identificados

2. Cada uno de los elementos del experimento están en un cuarto distinto

3. La comunicación entre los elementos es escrita y no se pueden ver

4. Después de un cierto número de preguntas y respuestas a ambos, si el interrogador no puede identificar cuál es la computadora y quién es la persona, entonces podemos decir que la computadora “piensa” igual que el ser humano en esa tarea.

13

La máquina sería entonces igual de inteligente que el ser humano en ese dominio de conocimiento específico. En una definición más formal: Máquina inteligente es la que realiza el proceso de analizar, organizar y convertir los datos en conocimiento, donde el conocimiento del sistema es información estructurada adquirida y aplicada para reducir la ignorancia o la incertidumbre sobre una tarea especifica a realizar por la máquina inteligente.

14

Por último, como se ha dicho, hay diferentes grados de inteligencia en los sistemas. Algunas de las características fundamentales para hablar de sistemas inteligentes son: Un sistema inteligente debe ser altamente adaptable a cambios significativos impredecibles, por lo que el aprendizaje es esencial. Debe exhibir un alto grado de autonomía para tratar con los cambios. Debe ser capaz de tratar con complejidad significativa. En definitiva, sistema inteligente es un procedimiento computacionalmente eficiente para dirigir un sistema complejo a un objetivo, con una representación incompleta o inadecuada y/o bajo especificaciones imprecisas de cómo hacerlo; es decir, que actúa apropiadamente en un entorno con incertidumbre.

15

El término Inteligencia Artificial Este concepto es relativamente nuevo, pero la idea de una inteligencia artificial existe desde hace miles de años. La IA, se puede definir como el estudio de las facultades mentales a través del uso de modelos computacionales. Este termino data de los años 50 del siglo XX y se debe a un grupo de científicos que estudiaron el cerebro humano como modelo natural, integrando la cibernética y las computadoras (McCarthy, Minisky, Newell, Simon). En palabras de uno de ellos Marvin Minisky, la IA es el estudio de cómo programar computadoras que posean la facultad de hacer aquello que la mente humana puede realizar, o en sentido amplio: la IA es una ciencia orientada al diseño y construcción de máquinas que implementen tareas propias de humanos dotados con inteligencia.

16

Otra definición muy extendida es la de Hayes que consideró que la IA es la implementación de razonamientos inteligentes mediante técnicas propias de la computación. Esta segunda definición establece un lazo de unión entre la máquina, la inteligencia y la actividad del ser humano.

Caracterizar a los sistemas inteligentes incluye tareas de: 1. Reconocerlos y distinguirlos de los sistemas convencionales 2. Clasificar el papel de la inteligencia en estos sistemas 3. Identificar los problemas para los cuales la IA es la única o la

mejor solución

17

Una máquina inteligente debe hacer las cosas que nosotros queremos que haga, que nosotros haríamos, pero quizá no como nosotros las hacemos. Una aproximación práctica y realista de la IA es conseguir que estas técnicas realicen de forma eficiente una serie de tareas que nos faciliten nuestro trabajo, quizá en menos tiempo, con menos datos, aunque no pasaran el test de Turing. En cualquier caso, se trata de que las soluciones que aporta la IA sean mejores que otras para esas tareas determinadas.

18

En lugar de confiar en las habilidades del programador, un verdadero programa inteligente aprenderá de su experiencia por generalización y abstracción, emulando la mente humana. Especialmente en su habilidad para razonar y aprender en un ambiente de incertidumbre, imprecisión, con información incompleta o errónea, etc., características propias del mundo real, tanto de los sistemas como del lenguaje natural. De esta forma, un sistema inteligente será capaz de modelar y controlar una amplia variedad de sistemas complejos, constituyéndose en una herramienta efectiva para tratar con problemas hasta ahora no abordados por su complejidad o por la naturaleza de su información.

19

Así, la IA, se utiliza en general para: la toma de decisiones en ambientes con incertidumbre, el razonamiento aproximado, la clasificación y comprensión de señales, el reconocimiento de patrones, entre otras utilidades. Sus aplicaciones están relacionadas, entre otros ámbitos, con: el comercio, las finanzas, la medicina, la robótica, la automatización y el control

20

El objetivo de la IA es el desarrollo de paradigmas o algoritmos requeridos por las máquinas para realizar tareas cognitivas, para las cuales los humanos son tradicionalmente mejores. Un sistema de IA debe ser capaz de realizar tres cosas: - Almacenar conocimiento - Aplicar el conocimiento almacenado para resolver problemas - Adquirir nuevo conocimiento a través de la experiencia Un sistema de IA tiene tres componentes

Representación

Aprendizaje

Razonamiento

21

Representación: La característica más distintiva de la IA probablemente es el profundo uso de un lenguaje o estructuras simbólicas para representar tanto el conocimiento general acerca de un problema como el conocimiento específico de una solución. Debido a la claridad de los símbolos utilizados en la IA la convierte en una excelente herramienta para la comunicación hombre-máquina

22

Razonamiento: En su forma básica, el razonamiento es la habilidad para resolver problemas. Para que se considere que un sistema tiene razonamiento, debe de satisfacer las siguientes condiciones: El sistema debe ser capaz de expresar y resolver una gran cantidad de problemas El sistema debe ser capaz de proporcionar información explicita e implícita acerca de los problemas El sistema debe de tener un mecanismo de control que determine cuales operaciones aplicar a un problema en particular

23

En muchas situaciones encontradas en la práctica, la disponibilidad del conocimiento está incompleta o es inexacta. En tales situaciones se utilizan procedimientos de razonamiento probabilístico, lo que le permite al sistema de IA tratar con incertidumbres - El vendedor que va de ciudad a ciudad - El diagnostico medico

24

Aprendizaje: En el modelo de una máquina de aprendizaje simple, el medio ambiente provee la información al elemento de aprendizaje, el cual la usa para realizar mejoras a la base de conocimiento y finalmente el elemento de desarrollo la utiliza para desarrollar su tarea. El mecanismo de retroalimentación habilita a la máquina de aprendizaje a evaluar sus hipótesis y adaptarse si es necesario. Una máquina de aprendizaje puede incluir dos tipos de razonamiento

Medio Ambiente

Elemento de Aprendizaje

Base de Conocimiento

Elemento de Desarrollo

25

Estrategias de la IA En el horizonte de los descubrimientos relacionados con la informática surgen no sólo ideas nuevas para mejorar las técnicas existentes, sino también paradigmas radicalmente diferentes de las actuales estrategias. Uno de ellos, actualmente muy extendido en el ámbito de la investigación computacional, es la Computación Suave o Inteligencia Computacional (Soft Computing). Su objetivo es implementar la IA en las máquinas. Los avances en el campo de la computación, la electrónica, sensores, procesamiento de señales, representación de la información, etc., proporcionan nuevas herramientas para el desarrollo de sistemas inteligentes. Al ser la IA un área multidisciplinar, dinámica y amplia, se sirve de distintas técnicas para conseguir sus objetivos.

26

En particular, la IA puede hacer efectivo el uso de: Nuevas técnicas y entornos avanzados de programación Técnicas para tratar la heurística Nuevos sistemas hardware Las metodologías de la IA incluyen, por ejemplo: Lógica difusa Sistemas expertos Aprendizaje Sistemas de planificación Algoritmos de búsqueda Sistemas híbridos Diagnostico de fallas y reconfiguración Autómatas Redes de Petri Redes Neuronales Computación evolutiva, etc.

27

No obstante, conviene aclarar que las técnicas asociadas a la IA tienen un desarrollo y una fundamentación independiente. Cada una de ellas contribuye con una metodología distintiva para tratar problemas en su dominio de aplicación. Sin embargo, de una forma complementaria – en lugar de competitiva –, se combinan algunas de ellas formando los denominados “sistemas inteligentes híbridos”, que combinan dos o más de estas técnicas para su aplicación a sistemas específicos que por su complejidad requieren un acercamiento desde distintos enfoques. Así se habla de los sistemas neuro-difusos, neuro-genéticos, los neuro-difusos-genéticos, etc.

28

Cada una de estas metodologías se centra en un aspecto o función inteligente de los seres vivos. Hoy en día, la mayoría de estos métodos de la IA están bien delimitados y gran parte de ellos han sido aplicados con éxito en diversos ámbitos. La IA sigue siendo un campo abierto a la investigación y junto con mejoras continuas y modificaciones que está experimentando, todavía están por desarrollarse nuevas implementaciones computacionales de facetas de la IA

29

Redes de Petri En 1962 Carl Adam Petri publicó su tesis doctoral en la que por primera vez se formulaba una teoría general para sistemas discretos paralelos. Las redes de Petri son una generalización de la teoría de autómatas y utilizan métodos gráficos para representar sistemas como condiciones y eventos. Un modelo de red de Petri formula las propiedades de un sistema en el lenguaje de la lógica aunque también utiliza la representación algebraica.

30

Sistemas expertos Campo pionero de la IA. Un sistema experto es básicamente un conjunto de programas informáticos que aplica el proceso del razonamiento humano al conocimiento de un experto en la solución de tipos específicos de problemas. Son sistemas basados en reglas de producción u otros procesos de razonamiento. Algunas de sus características son la heurística, el tratamiento simbólico, la toma de decisiones, la memoria, la predicción y la inferencia. Un sistema experto consiste en una base de conocimientos, una base de datos y una máquina de inferencias para interpretar la base de datos usando el conocimiento almacenado en la base de conocimiento.

31

Lógica difusa La lógica difusa, una forma matemática de representar la imprecisión inherente al lenguaje natural, introducida por Lofti A. Zadeh en 1965. Es una generalización de la lógica clásica: las variables toman valores lingüísticos de verdad. La pertenencia a los conjuntos difusos es gradual. Implementa la forma de razonar propia del sentido común

32

Redes Neuronales En la década de los 80 del siglo XX, se empezó a considerar este paradigma computacional conexionista cuya estructura emula el proceso biológico del aprendizaje humano. Son sistemas compuestos por muchos elementos de procesamiento (neuronas) que operan en “paralelo”, cuya función está determinada por la estructura de la red, las conexiones y el procesamiento local realizado por los elementos computacionales o nodos. Las redes neuronales pueden aprender de datos de entrenamiento y en realidad son aproximadores de funciones matemáticas

33

Algoritmos genéticos Un algoritmo genético es esencialmente un procedimiento de búsqueda y optimización modelado según los mecanismos genéticos de la selección natural de los seres vivos. Surgieron del estudio de los autómatas celulares llevado a cabo por Holland en 1975. Su funcionamiento básico es evolucionar a partir de una población que representa las soluciones candidatas (individuos) para un determinado problema, intentando producir nuevas generaciones de soluciones mejores que las anteriores, evaluadas por una función de ajuste. Se utilizan en problemas complejos de optimización por su paralelismo implícito y su habilidad para mantener múltiples soluciones concurrentemente

34

Teoría del caos Es un conjunto de técnicas utilizadas para examinar y determinar relaciones altamente complejas entre datos que han sido inicialmente clasificados al azar. Una característica de este tipo de datos es que una pequeña variación en las condiciones iniciales puede dar lugar a cambios drásticos en los resultados muy rápidamente. El supuesto fundamental de la teoría del caos es que la unidad individual no importa; lo que importa son las simetrías recursivas entre los diferentes niveles del sistema.

35

Breve visión histórica de la IA El desarrollo y la evolución de la IA como disciplina moderna viene de la mano del avance tecnológico. Sin embargo su origen se remonta a la antigüedad ya que está unida a modos de conocimiento y razonamiento tan lejanos en el tiempo como las civilizaciones clásicas. Las ciencias que de una forma u otra han influido en la IA son:

36

Filosofía. Los filósofos desde el año 400ac, intuyeron la IA al concebir la mente como una máquina que funcionaba a partir de un conocimiento codificado en un lenguaje interno y al considerar que el pensamiento servía para determinar cual era la acción correcta que se había de emprender. Matemáticas y Lógica. Prepararon el terreno para la implementación del razonamiento mediante algoritmos. Psicología. Permite la investigación de la mente reforzando la idea de que los humanos y otros animales podían ser considerados como máquinas para el procesamiento de la información. Lingüística. Ofrece teorías sobre la estructura y significado del lenguaje (sintaxis y semántica) y demostraron que el uso del lenguaje es necesario en la implementación de la IA para representar y manejar el conocimiento.

37

Ciencias de la computación. Aportaron las herramientas de cálculo necesarias para que la idea de la IA fuera una metodología aplicable. El concepto de la IA, aunque se origina de una concepción abstracta, es realmente una realización física de hardware y software que tienen un comportamiento inteligente, dentro del área de las ciencias de la computación

38

Período Clásico: Hasta la década de 1950 - Siglo XVII, Leibnitz (máquina capaz de razonar) - Siglo XIX, Babbage (sistema que modelara fenómenos físicos) - Problemas de búsqueda - Problemas de juegos - Prueba de Turing

Desarrollo Histórico de la IA (Jackson)

39

Período Romántico: Mediados de la década de 1960 hasta la década de 1970.

- Máquinas de “entendieran” lenguajes naturales - Representación formal del conocimiento

Período Moderno: Desde mediados de la década de 1970.

- Resolución de problemas complejos de interés práctico - Investigación en aspectos tanto teóricos como prácticos de la

IA

40

Gestación 1943-1956. Primeros modelos de aprendizaje Grandes expectativas 1952-1969. Modelo del cerebro,

Planificación temporal, Programas con sentido común Dosis de realidad 1966-1976. Primeros experimentos,

Limitaciones Sistemas basados en conocimiento 1969-1979. Poca actividad

en Redes neuronales, Crecimiento en Lógica difusa y Algoritmos genéticos

Vuelta a las redes neuronales 1986-Hoy. Renacimiento de las redes neuronales.

Logros recientes 1987-Hoy. Madurez, Procesamiento paralelo, Planificación, Robótica, Control

Desarrollo Histórico de la IA (Russell y Norving)

41

Paradigmas en IA

Paradigma Conexionista: Heillich y Pitts en 1943 sugieren la posibilidad de representar físicamente operaciones lógicas abstractas, mediante redes neuronales artificiales.

Propiamente dicho, constituye un contexto en el que se supone que la función principal de la inteligencia es la generación de estados globales emergentes, en redes locales y una relación cambiante entre tales elementos simples, gobernada por leyes de cambio. La actividad es masivamente paralela y relativamente rápida

42

Paradigma evolutivo: En este caso se supone la posibilidad de la generación de estructuras más aptas a partir de ancestros de menos aptitud o posibilidad mediante el recurso de evolución biológica. La cual se considera como un proceso unidireccional e irreversible que genera innovación en el tiempo de manera que las nuevas estructuras son mejores que sus antecesores.

Paradigma computacional e IA: Es aquel que pretende emular la inteligencia de bajo nivel (Percepción, control motriz y reflejos – instintos – )

43

Actividad

Con sus propias palabras defina Inteligencia Con sus propias palabras defina Inteligencia Artificial Describa con sus propias palabras la prueba de Turing Mencione cinco áreas de aplicación de la IA Mencione tres de las técnicas de la IA y defínalas con sus

propias palabras Mencione tres de las ciencias que han influido en la IA y

justifíquelas ¿Cuál desarrollo histórico considera más adecuado?, ¿Por qué? ¿Considera que cada una de las técnicas de IA, implementan

todos los paradigmas de la IA?, ¿Por qué? Desde su punto de vista, mencione por lo menos tres

tendencias de la IA Desde su punto de vista, considera que la IA ¿ha cumplido con

todas sus expectativas?, ¿Por qué?