modelos de neuronas artificiales.docx

13
Evelyn Gómez. Ci: 18451867. Asignación #1 Redes Neuronales. MAQUINAS QUE PIENSAN POR SI SOLAS El aprendizaje automático es una rama de la informática que permite a los ordenadores aprender de la experiencia, que está en todas partes. Hace que las búsquedas en Internet sean más relevante, servicios análisis de sangre más precisos y que en el servicio de citas haya más probabilidades de hallar a una pareja potencial. En su forma más simple, los algoritmos de aprendizaje automático toman un conjunto de datos existentes, y a través de ese conjunto de datos hacen predicciones sobre el futuro. Sin embargo, los avances de la máquina de aprendizaje en la última década han transformado el campo y las técnicas de aprendizaje automático son responsables de hacer los ordenadores "más inteligentes" que los humanos en muchas de las tareas que queremos llevar a cabo. Hace unos años Netflix, la compañía de alquiler de películas en línea quería ayudar a sus clientes a encontrar películas que probablemente les encantaría, especialmente películas que no eran de alta demanda. La empresa ya tenía un sistema de recomendación de películas en casa, pero estaba lejos de ser perfecto. Así se puso en marcha un concurso para mejorar los esfuerzos existentes. Las reglas eran simples: el primer premio para el que venciera el sistema existente mejorando un 10%, sería ganador de un premio de 1 millón de dólares. Lo más importante en cualquier sistema de aprendizaje automático son sus datos, y Netflix ofrecía 100 millones de datos reales listos para ser descargados. Días de Entrenamiento Muchos grupos atacaron el problema descomponiendo las películas individualmente, en largas series de diferentes atributos. Por ejemplo, buscarla por diversos rasgos, como lo divertidas que son, lo complicadas, o lo atractivo que son los actores. Ahora, la predicción se convierte en una simple cuestión de hacer coincidir los gustos de los espectadores a los atributos de la nueva película. Después de que el algoritmo coincide con decenas de estos atributos, la recomendación final debería ser una buena predicción basada en los gustos del espectador. Pensamos naturalmente en atributos fácilmente identificables como "comedia", pero los algoritmos necesitan hacer tales distinciones. El algoritmo aprendizaje-máquina se iniciará al azar, con atributos anónimos. Es así como se obtienen datos de

Upload: evelyn-gomez

Post on 13-Sep-2015

9 views

Category:

Documents


5 download

TRANSCRIPT

Evelyn Gmez. Ci: 18451867. Asignacin #1 Redes Neuronales.

MAQUINAS QUE PIENSAN POR SI SOLAS

El aprendizaje automtico es una rama de la informtica que permite a los ordenadores aprender de la experiencia, que est en todas partes. Hace que las bsquedas en Internet sean ms relevante, servicios anlisis de sangre ms precisos y que en el servicio de citas haya ms probabilidades de hallar a una pareja potencial. En su forma ms simple, los algoritmos de aprendizaje automtico toman un conjunto de datos existentes, y a travs de ese conjunto de datos hacen predicciones sobre el futuro. Sin embargo, los avances de la mquina de aprendizaje en la ltima dcada han transformado el campo y las tcnicas de aprendizaje automtico son responsables de hacer los ordenadores "ms inteligentes" que los humanos en muchas de las tareas que queremos llevar a cabo.Hace unos aos Netflix, la compaa de alquiler de pelculas en lnea quera ayudar a sus clientes a encontrar pelculas que probablemente les encantara, especialmente pelculas que no eran de alta demanda. La empresa ya tena un sistema de recomendacin de pelculas en casa, pero estaba lejos de ser perfecto. As se puso en marcha un concurso para mejorar los esfuerzos existentes. Las reglas eran simples: el primer premio para el que venciera el sistema existente mejorando un 10%, sera ganador de un premio de 1 milln de dlares. Lo ms importante en cualquier sistema de aprendizaje automtico son sus datos, y Netflix ofreca 100 millones de datos reales listos para ser descargados.

Das de EntrenamientoMuchos grupos atacaron el problema descomponiendo las pelculas individualmente, en largas series de diferentes atributos. Por ejemplo, buscarla por diversos rasgos, como lo divertidas que son, lo complicadas, o lo atractivo que son los actores.Ahora, la prediccin se convierte en una simple cuestin de hacer coincidir los gustos de los espectadores a los atributos de la nueva pelcula. Despus de que el algoritmo coincide con decenas de estos atributos, la recomendacin final debera ser una buena prediccin basada en los gustos del espectador.Pensamos naturalmente en atributos fcilmente identificables como "comedia", pero los algoritmos necesitan hacer tales distinciones. El algoritmo aprendizaje-mquina se iniciar al azar, con atributos annimos. Es as como se obtienen datos de cmo los espectadores calificaron en el pasado, se afinan los atributos hasta que ellos correspondan con la forma en que los espectadores califican las pelculas. Por ejemplo, si a la gente que gusta la pelcula A tambin tienden a preferir las pelculas B, C y D, el algoritmo se va a plantear un nuevo atributo que ser comn para A, B, C y D. El objetivo de esta fase es crear un conjunto de atributos objetivos que se basen en las calificaciones reales, no en anlisis subjetivos.

Bellkors Pragmatic Chaos presento en la ltima hora del concurso de Netflix, una solucin, 20 minutos antes que el otro equipo que disputaba el premio ( The Ensemble). 20 minutos de retraso en una competencia de 3 aos hizo una diferencia de 1 milln de dlares.

El ajuste perfectoEl tipo de aprendizaje mquina utilizada en el concurso de clasificacin de pelculas, se denomina aprendizaje supervisado. Tambin se utiliza en tareas tales como el diagnstico mdico. Por ejemplo, podramos proporcionar un ordenador con miles de imgenes de glbulos blancos de la sangre de los registros histricos de los pacientes, junto con informacin sobre si cada imagen es de una clula cancergena o no. A partir de esta informacin, el algoritmo aprender a aplicar ciertos atributos a las clulas, como forma de clulas, tamao y color, tal vez, para identificar las clulas malignas. Aqu el investigador "supervisa" el proceso de aprendizaje. Para cada imagen en los datos de entrenamiento, l o ella le darn al equipo la respuesta correcta.El aprendizaje supervisado es el tipo ms comn de aprendizaje de mquina, pero no es el nico. En robtica, por ejemplo, no pueden saber la mejor manera de hacer caminar un robot de dos piernas. En ese caso, podran disear un algoritmo de los experimentos, con un nmero de diferentes posturas. Si una marcha especial hace que el robot caiga, el algoritmo aprende a no hacer eso nunca ms.Este es el enfoque de refuerzo y aprendizaje. Se trata bsicamente de ensayo y error, una estrategia de aprendizaje que todos estamos familiarizados. En un escenario humano o por mquina nos enfrentamos a una situacin en la que se necesita un poco de accin de refuerzo del aprendizaje tpico. En lugar de que alguien nos diga qu hacer, intentamos algo y vemos qu pasa. Sobre la base de lo que suceda, reforzamos las acciones buenas y evitamos las malas acciones en el futuro. Finalmente tanto nosotros como las mquinas aprendemos de las acciones correctas para diferentes situaciones.

Exceso de ProblemasLos investigadores a menudo utilizan el refuerzo de aprendizaje para tareas que requieren una secuencia de acciones, como un juego, pero a veces, incluso el aprendizaje por refuerzo es mucho pedir, porque no somos capaces de obtener retroalimentacin sobre nuestras acciones. En estos casos, hay que recurrir a "aprendizaje no supervisado." Aqu el investigador tiene un conjunto de datos, pero no hay informacin sobre lo que se debe tomar, ya sea accin explcita, como en el aprendizaje supervisado, o implcitamente, como en el aprendizaje por refuerzo. Un primer paso es clasificar los datos en grupos basndose en la similitud. Esto se llama la agrupacin. La agrupacin nos proporciona una mejor comprensin de los datos antes de considerar llevar a cabo una accin. Una parte importante de la investigacin sobre la teora matemtica de la mquina de aprendizaje se centra en el problema del "sobreajuste" de datos. Queremos detectar conexiones autnticas que se ajusten a los datos, pero no queremos exagerar y terminar recogiendo patrones en los que no se pueden confiar.Para evitar este resultado, los algoritmos de aprendizaje automtico son parciales para mantener los modelos lo ms simple posible, usando una tcnica llamada regularizacin. Cuanto ms complejo un modelo, es ms propenso al sobreajuste. La regularizacin mantiene esta complejidad en control.

Predecir el futuroEl aprendizaje automtico permite a los no expertos hacer una aplicacin cientfica, en el rea de la moda de las mujeres, por ejemplo, a aprender y predecir basados simplemente en los datos.El aprendizaje automtico, sin embargo, slo funciona para los problemas que tienen suficientes datos, ya que no crea la informacin; sin suficientes datos de entrenamiento que contengan la informacin adecuada, el aprendizaje de la mquina no funcionar.

El aprendizaje de maquina es una rama de las ciencias de la computacin que combina datos fijos para hacer predicciones sobre el futuro. Esta es usada para identificar tpicos econmicos, recomendaciones personalizadas y desarrollo de computadores creados para pensar. Aunque el aprendizaje de maquina comienza a ser popular esta solo trabaja en problemas con una base de datos extensa. Los desarrolladores del aprendizaje de mquinas deben ser cuidadosos y evitar disear maquinas con caractersticas que realmente no existen.

MODELOS DE NEURONAS ARTIFICIALES.

Fue Ramn y Cajal (1888) quin descubri la estructura celular (neurona) del sistema nervioso. Defendi la teora de que las neuronas se interconectaban entre s de forma paralela, y no formando un circuito cerrado como el sistema sanguneo.

Una neurona consta de un cuerpo celular (soma) de entre 10 y 80 mm, del que surge un denso rbol de ramificaciones (dendritas) y una fibra tubular (axn) de entre 100 mm y un metro.De alguna forma, una neurona es un procesador de informacin muy simple: Canal de entrada: dendritas. Procesador: soma. Canal de salida: axn.

Una neurona cerebral puede recibir unas 10.000 entradas y enviar a su vez su salida a varios cientos de neuronas. La conexin entre neuronas se llama sinapsis. No es una conexin fsica, sino que hay unos 2 mm de separacin. Son conexiones unidireccionales, en la que la transmisin de la informacin se hace de forma elctrica en el interior de la neurona y de forma qumica entre neuronas; gracias a unas sustancias especficas llamadas neurotransmisora. No todas las neuronas son iguales, existen muchos tipos diferentes segn el nmero de ramificaciones de sus dendritas, la longitud del axn y otros detalles estructurales. Sin embargo, todas ellas operan con los mismos principios bsicos.

Una red Neuronal Artificial (RNA) es un sistema de procesamiento de informacin que tiene ciertas aptitudes en comn con las redes neuronales biolgicas: El procesamiento de informacin ocurre en muchos elementos simples llamados neuronas. Las seales son transferidas entre neuronas a travs de enlaces de conexin. Cada conexin tiene un peso asociado, el cual, tpicamente, multiplica a la seal transmitida. Cada neurona aplica una funcin de activacin (usualmente no lineal) a su entrada de red (suma de entradas pesadas) para determinar su salida.

La neurona artificial fue diseada para "emular" las caractersticas del funcionamiento bsico de la neurona biolgica. En esencia, se aplica un conjunto de entradas a la neurona, cada una de las cuales representa una salida de otra neurona. Cada entrada se multiplica por su "peso" o ponderacin correspondiente anloga al grado de conexin de la sinapsis. Todas las entradas ponderadas se suman y se determina el nivel de excitacin o activacin de la neurona. Una representacin vectorial del funcionamiento bsico de una neurona artificial se indica segn la siguiente expresin de la ecuacin (1.1). NET = X*W ecu.(1.1)

Siendo NET la salida, X el vector de entrada y W el vector de pesos. Normalmente la seal de salida NET suele ser procesada por una funcin de activacin F para producir la seal de salida de la neurona OUT. La funcin F puede ser una funcin lineal, o una funcin umbral o una funcin no lineal que simula con mayor exactitud las caractersticas de transferencia no lineales de las neuronas biolgicas.

La Figura (1) representa una neurona artificial con una funcin de activacin F.

Figura 1.Modelo de Neurona Artificial.

Neurona Natural vs. Artificial: Neurona = Unidad de proceso Conexiones sinpticas = Conexiones Pesadas Efectividad sinptica = Peso sinptico Exitatorio/Inhibitorio = Pesos + Efecto combinado de sinapsis = Funcin suma Activacin-> Ratio disparo = Funcin activacin -> salida

Figura 2. Neurona Biolgica vs Artificial.

PERCEPTRON.La arquitectura del Perceptron, llamada mapeo de patrones (pattern-mapping), aprende a clasificar modelos mediante un aprendizaje supervisado. Los modelos que clasifica suelen ser generalmente vectores con valores binarios (0,1) y las categoras de la clasificacin se expresan mediante vectores binarios. El Perceptron presenta dos capas de unidades procesadoras (PE) y slo una de ellas presenta la capacidad de adaptar o modificar los pesos de las conexiones. La arquitectura del Perceptron admite capas adicionales pero stas no disponen la capacidad de modificar sus propias conexiones. La Figura (3) muestra la unidad procesadora bsica del Perceptron. Las entradas llegan por la parte izquierda, y cada conexin con la neurona j tiene asignada un peso de valor .

Figura 3. Unidad procesadora bsica del Perceptron.

El Perceptrn puede entenderse como la neurona artificial y unidad bsica de inferencia en forma de discriminador lineal, es decir, un algoritmo capaz de generar un criterio para seleccionar un sub-grupo, de un grupo de componentes ms grande.El modelo biolgico ms simple de un perceptrn es una neurona y viceversa. Es decir, el modelo matemtico ms simple de una neurona es un perceptrn. Una neurona sola y aislada carece de razn de ser. Su labor especializada se torna valiosa en la medida en que se asocia a otras neuronas, formando una red.El perceptrn usa una matriz para representar las redes neuronales y es un discriminador terciario que traza su entrada (un vector binario) a un nico valor de salida (un solo valor binario) a travs de dicha matriz.

Donde es un vector de pesos reales y es el producto punto (que computa una suma ponderada). es el 'umbral', el cual representa el grado de inhibicin de la neurona, es un trmino constante que no depende del valor que tome la entrada.El valor de (0 o 1) se usa para clasificar como un caso positivo o un caso negativo, en el caso de un problema de clasificacin binario. El umbral puede pensarse de cmo compensar la funcin de activacin, o dando un nivel bajo de actividad a la neurona del rendimiento. La suma ponderada de las entradas debe producir un valor mayor que , para cambiar la neurona de estado 0 a 1. Su desventaja principal, es que no puede resolver problemas que no son linealmente separables.PERCEPTRN MULTICAPAEl perceptrn multicapa es una red neuronal artificial (RNA) formada por mltiples capas, esto le permite resolver problemas que no son linealmente separablesLas capas pueden clasificarse en tres tipos: Capa de entrada: Constituida por aquellas neuronas que introducen los patrones de entrada en la red. En estas neuronas no se produce procesamiento. Capas ocultas: Formada por aquellas neuronas cuyas entradas provienen de capas anteriores y cuyas salidas pasan a neuronas de capas posteriores. Capa de salida: Neuronas cuyos valores de salida se corresponden con las salidas de toda la red.La propagacin hacia atrs (tambin conocido como retropropagacin del error o regla delta generalizada), es un algoritmo utilizado en el entrenamiento de estas redes, por ello, el perceptrn multicapa tambin es conocido como red de retropropagacinSu caracterstica principal es que las funciones de transferencia de los elementos de procesado (neuronas) han de ser derivables. Sus desventajas principales son que el Perceptrn Multicapa no extrapola bien, es decir, si la red se entrena mal o de manera insuficiente, las salidas pueden ser imprecisas. Y la existencia de mnimos locales en la funcin de error dificulta considerablemente el entrenamiento, pues una vez alcanzado un mnimo el entrenamiento se detiene aunque no se haya alcanzado la tasa de convergencia fijada.RED SELF ORGANIZING MAPLa red S.O.M. (Self Organizing Map) tiene la caracterstica de organizar mapas topolgicos. El mapa que presenta la red a partir de una situacin inicial aleatoria muestra las relaciones existentes entre los diferentes patrones presentados a la red. Este modelo de red fue presentado por Kohonen (1988) aun cuando otros investigadores como Grossberg tambin se encontraban trabajando en la misma red. Esta nueva red muestra de forma efectiva la idea bsica de tener una red neuronal artificial que organice un mapa topolgico, constituyendo como tal una primera aproximacin a los mapas topolgicos de los fenmenos motores y sensoriales existentes en la superficie del cerebro humano. La red de Kohonen presenta ventajas sobre las tcnicas clsicas de reconocimiento de patrones porque adems de utilizar la arquitectura paralela de las redes neuronales provee una representacin grfica de las relaciones entre los patrones. Un aspecto diferenciador de la red SOM de otras muchas redes es que aprende sin supervisin, de aqu su nombre en ingls. No obstante, cuando la red SOM est en combinacin con otras capas neuronales para aplicaciones de categorizacin y/o prediccin la red aprende primeramente en modo no supervisado y despus cambia a modo supervisado. Las aplicaciones ms frecuentes de esta red son visualizar topologas y estructuras jerrquicas de espacios de entrada de dimensin elevada, as como su utilizacin en redes hbridas para problemas de prediccin y clasificacin.