apuntes de bioinformática

32
Bioinformática jueves 19 de febrero de 1998 Tema 1: CPU Unidad central. Posee una carcasa (Tapa). Fuente de alimentación Es un transformador rectificador a 220 V. Transformador porque pasa de 220 V a 5 y 12 V, y rectificador porque transforma corriente alterna (AC) en continua (DC). Es una caja grande de la que salen cables. Tiene un refrigerador que refrigera la unidad central. Placa del sistema IBMPlaca base OtrosPlaca madre Diseño modular, los componentes pueden aparecer en distintos sitios pero la tarea es al misma. Componentes electrónicos – Componentes de tipo pasivo (resistencias y condensadores). – Componentes activos (circuitos integrados CI o IC) – Microprocesador (P) Es el circuito más caro. – Chipset: Son circuitos integrados de apoyo. – Reloj: Marca ritmo de trabajo. Tiene que estar coordinado con el reloj y el P. – Memoria principal: Es donde se almacena temporalmente el software. Tiene dos componentes, ROM (sólo lectura), que es donde está el software que mete el fabricante para que pueda funcionar. Tiene un adhesivo metálico para que no se borre el contenido. Otro componente es la RAM, que es de lectura y escritura. Esta es la que maneja el P. Va en módulos de memoria. – Pila: Es azulita y con forma de barril. Bus de expansión Son una serie de ranuras (slots). Aquí se insertan tarjetas controladoras, que relacionan la placa del sistema con un 1 PGA (Actuales) DIP (Antiguo) Insertados en Zócalos

Upload: cava0707

Post on 30-Nov-2015

51 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Apuntes de Bioinformática

Bioinformática

jueves 19 de febrero de 1998

Tema 1:CPU Unidad central. Posee una carcasa (Tapa).

Fuente de alimentaciónEs un transformador rectificador a 220 V. Transformador porque pasa de 220 V a 5 y 12

V, y rectificador porque transforma corriente alterna (AC) en continua (DC).Es una caja grande de la que salen cables. Tiene un refrigerador que refrigera la unidad

central.

Placa del sistemaIBMPlaca base OtrosPlaca madreDiseño modular, los componentes pueden aparecer en distintos sitios pero la tarea es al

misma.

Componentes electrónicos– Componentes de tipo pasivo (resistencias y condensadores).– Componentes activos (circuitos integrados CI o IC)

– Microprocesador (P) Es el circuito más caro.– Chipset: Son circuitos integrados de apoyo.– Reloj: Marca ritmo de trabajo. Tiene que estar coordinado con el reloj y el P.– Memoria principal: Es donde se almacena temporalmente el software. Tiene dos

componentes, ROM (sólo lectura), que es donde está el software que mete el fabricante para que pueda funcionar. Tiene un adhesivo metálico para que no se borre el contenido. Otro componente es la RAM, que es de lectura y escritura. Esta es la que maneja el P. Va en módulos de memoria.– Pila: Es azulita y con forma de barril.

Bus de expansiónSon una serie de ranuras (slots). Aquí se insertan tarjetas controladoras, que relacionan

la placa del sistema con un periférico. Permite la comunicación del periférico con RAM, ROM, P u otro periférico.– ISASegmento largo y corto.– VESABus local, conexión del periférico con el P directamente sin pasar por chipset.

(Si hay muchos conectados, puede colapsarse)– PCI Es como un bus local que tiene un elemento regulador para que no se produzca

colapso.

1

PGA (Actuales)

DIP (Antiguo)

Insertados en Zócalos

Page 2: Apuntes de Bioinformática

Bioinformática

Tarjetas

Tarjetas obligatorias– Tarjeta controladora de vídeo: Convierte señales digitales del ordenador en señales de

vídeo.CGAEGAVGASVGA

Circuito integrado Chip controlador de vídeo (PGA) mantiene posición horizontal y vertical. Puede tener memoria RAM (memoria de vídeo).

– Tarjeta controladora de disco: Controla el flujo entre disco duro o disquetes y el P y la RAM. Memoria auxiliar o masiva. Hay cables (Flap) que unen esto. Están cerca de la fuente de alimentación. Se alimentan con 12 V.Hay varios tipos:– MFM-RLLDiscos de poca capacidad 20-40 Membrana– IDE Disco de tipo IDE. Actual. También se puede enchufar un CD- ROM.– SCSI[escasi]

Tarjetas tipo puerto (no obligatorias)Antiguamente para conectar impresora al ordenador– Conexión de salida paralelo o centronics. Sólo conecta impresora.– Serie (RS232) Puedo conectar cualquier cosa (Fax, módem, ratón...). Ya no se fabrican– Ahora, se fabrica una tarjeta que incluye la de disco y la de puerto (paralelo y serie), y se

llama tarjeta multi IO.Organización lógica de la placa baseBuses Canales de comunicación.Programa Conjunto de instrucciones ordenadas secuencialmente. No es ejecutable

en disco duro o disquete, sólo en memoria RAM. El cable que va del disco a la tarjeta controladora es el bus de datos, luego, de la tarjeta va al P.

Dirección de memoria: Cada celdilla de la memoria tiene un número independiente de la información de la célula.

P Unidad de control. Interpreta significado de operandos e instrucciones, se lo dice a la unidad aritmética lógica. La unidad de control tiene asociado un registro contador (memoria local) donde se indica la dirección de memoria de la próxima instrucción (contador = contador +1).

La unidad aritmética lógica, tiene asociados acumuladores donde almacenar temporalmente los datos que tiene que operar y el resultado.

El coprocesador matemático ayuda a la UAL.¿Cómo se materializa la información?

Bit Cantidad más pequeña de información que puede transmitirse o procesarse (0,1)

Byte Agrupación de 8 bits. (octeto)

1 0 0 1 0 0 1 0

2

t10

5 V_

Bit más significativo Bit menos significativo

máximo 256 (del 00000000 al 11111111)

Page 3: Apuntes de Bioinformática

Bioinformática

Palabra: Cantidad de bytes que puede procesar de una sola pasada el P. Antiguos 8bits, 8086 y 80286 16 bits y 80386 y 80486 32 bits.

Sistema de numeración hexadecimalHay un problema, las direcciones de memoria son muy largas en binario. Se utiliza el

sistema hexadecimal al ser un sistema relación entre binario y decimal.Dígitos 0123456789ABCDEFCada dígito en hexadecimal equivale a 2bits en sistema binario.

Código ASCIITabla fotocopia

jueves 26 de febrero de 1998

MicroprocesadorResponsable de todas las operaciones lógicas y aritméticas. Cuando hacemos un

programa, la información se traduce a código máquina (binario) que ya es reconocido por el P.

Operaciones– Aritméticas + - * / : Las operaciones log x, sen x, ex, se realizan mediante un

desarrollo en serie, (los pasa a polinomios).– Lógica A>B; A<B; A<>B; AB; AB: Determina si una proposición es verdadera o

falsa y según la respuesta opera de manera distinta.Bucle : el P repite cierta tarea un número determinado de veces.El P para hacer estas operaciones utiliza:

RAMPosee una región: pila o stack, que hace de borrados, apunta valores intermedios en

operaciones de manera provisional.

RegistrosEl P no puede estar recurriendo constantemente e la RAM, porque es muy amplia y

está muy lejos. Por eso utiliza registros: memorias de pequeña capacidad. Están insertos en la estructura del P.

Un IBM o PC compatible posee cuatro registros acumuladores (AX, BX, CX, DX)También hay un registro contador: aumento su valor en una unidad entre cada

operación. En estos ordenadores sólo existe uno: IP (puntero de instrucciones)Otros raros: Registros segmento: ayudan a los otros registros (es el equivalente al

distrito postal), ubica una cierta región de la RAM.Banderas: toma un valor para que el P se de cuenta de que ha habido un error (5/0).

PuertosCada periférico tiene un número asociado (DNI), ese es el puerto. También se le llama

IO Address (In/Out address dirección entrada y salida) En Windows ‘95, el P asigna estos números PnP (Plug & Play).

Unidad aritmético lógica.Es un circuito digital. Registra presencia o ausencia de voltaje. Utiliza unos elementos:Puerta lógica: materialización de un operador de un álgebra(álgebra de Boole).

(Transistores y resistencias).

PuertasAND producto lógico OR suma lógica XOR exclusivo ORNOT complementación, negación o inversión)

3

Page 4: Apuntes de Bioinformática

Bioinformática

ANDI1 I2 O0 0 01 0 00 1 01 1 1

ORI1 I2 O0 0 01 0 10 1 11 1 1

NOTI1 I2 O0 0 01 0 00 1 01 1 1

XORI1 I2 O0 0 01 0 10 1 11 1 0

No entiendo los ejemplosUAL Circuito combinacional digital basado en el uso de puertas lógicas.Sumador elemental: Combinación XOR con ANDMultiplicar y dividir: Las tablas de multiplicar están grabadas en silicio.Inconveniente de los circuitos combinacionales que no poseen memoria:Circuito secuencial: Circuito combinacional + pequeña memoria ( registro).La UAL posee un circuito biestable o flip-flop que detecta operaciones erróneas, lo

transmite a las banderas.martes 3 de marzo de 1998

MemoriaDispositivo electrónico con capacidad para almacenar información lógica (secuencia de

0 y 1).

CaracterísticasTienen matriz: Lugar físico en el que se almacena información. Un punto es el lugar

físico donde se almacena un bit. 8 puntos es una celda Byte.Cada celda tiene asociada una dirección, que indica la ubicación física de la celda.Capacidad: número de bytes que puede almacenar.Tiempo de acceso: El tiempo que transcurre desde que el P solicita un dato y la

memoria se lo entrega (en ns).

ClasificaciónMemoria principal: Es la que se comunica directamente con el P.– RAM: Memoria del usuario, de lectura y escritura. Se conecta con el P por el bus de

datos y direcciones. Es volátil. Son dos tipos:– SRAM: De tipo estático Memoria caché. El P almacena aquí los programas que

más usa el ordenador (Controlador del ratón...). Es un circuito integrado rectangular. Es biestable (flip-flop). Gasta más porque tiene más resistencias.

4

¿¿¿??? No se si es así

Page 5: Apuntes de Bioinformática

Bioinformática

– DRAM: De tipo dinámico, es la memoria RAM. Un programa para ejecutarse tiene que estar aquí. Almacena un bit en un condensador (┤├). Eso es un problema porque hay que suministrarle cada cierto tiempo energía, hay que suministrar energía a la memoria. El resetear es detener suministro a la RAM.

– ROMMemoria auxiliar: Donde se almacena información de forma masiva. No se pueden ejecutar los programas desde aquí.

– Disquetes: Floppy disk (5 ¼ y 3 ½) Es un material magnetizable recubierto de un plástico (mylar) y por otro Teflón (5 ¼) o plástico.– Discos duros: Hard disk– Unidades de cinta: acceso secuencial.– CD-ROM: acceso secuencial.

jueves 5 de marzo de 1998

Sistema operativoSon programas que controlan el hardware, permiten accede a los recursos de ordenador

y permiten la comunicación entre usuario y máquina.Una parte está en disco, otra en la ROM.MS-DOSUn sistema operativo tiene una estructura en niveles de servicios. En MS-DOS hay tres

niveles.Shell - Bios - Núcleo (Kernel)El usuario interacciona con el ordenador a nivel de Shell.El núcleo actúa con el hardware, sobre las celdas de la RAM y sobre el reloj..Al encender el ordenador, aparece el puntero de comandos o prompt (C:\>),

perteneciente al nivel Shell, donde se conecta el usuario con el hardware.COMMAND.COM Intérprete de comandos.CONFIG.SYS Configura las características del Shell.AUTOEXEC.BAT Responsable de configurar características del ordenador.El nivel Bios (Basic input- output system) controla los periféricos (PRN impresora,

CON Teclado, AUX auxiliar). También es responsable de la fecha y hora.Cuando se enciende el ordenadorAl encender el ordenador, pasa un tiempo hasta que la ROM comprueba el sistema,

después suena. Después, la ROM busca el sistema operativo en el HD o FD. Para hacer esto, se va al sector de arranque del HD, que se llama BOOTSTRAP, donde está anotada la posición del MS-DOS. Cuando ya lo sabe, busca:

COMMAND.COM Shell.CONFIG.SYS Bios.AUTOEXEC.BAT Núcleo.Una vez encontrados, los carga en la RAM.Windows 3.X no es sistema operativo, sino que enmascara el Shell del MS-DOS y lo

embellece.Windows 95 sí es un sistema operativo, con los siguientes niveles:

5

Page 6: Apuntes de Bioinformática

Bioinformática

UNIXHay varios Shells para elegir, y tiene programas que permiten añadir nuevos periféricosLINUX Viene del UNIX y permite convertir ordenador en servidor.Clasificación de sistemas operativosS. O. en lotes “Batch”Programa Cada línea contiene comandos del sistema operativo. El MS-DOS

incorporal la posibilidad.S.O. Monousuario (MS-DOS) PC ------------ usuario.S.O. Multiusuario (UNIX).

El ordenador central tiene un P que asigna un tiempo corto al usuario pero como es muy rápido,

ni te enteras. Hay niveles de preferencia, denominado por la jerarquía de usuarios y la complejidad del programa, pero hay un tiempo crítico de espera.

S.O. Multitarea (W95, UNIX)

Formato de discosEs distinto para cada sistema operativo.

En MS-DOS o W95Actuamos en el nivel físico y el lógico:– Nivel físico: Pistas y sectores.– Nivel lógico: Estructuramos el disco así:

– Sector de arranque (BOOT). Es el 1er sector. Aquí se sitúan inicialmente las cabezas de lectura y escritura.– FAT (Tabla de localización de ficheros). Segundo sector.– Directorio principal “raíz”: Alberga el nombre, la extensión, la capacidad y la hora y

fecha de creación.– Área de datos.

ParticiónSólo en disco duro. Se define un área lógica gestionada por un sistema operativo. Se

definen los cilindros (varias pistas homólogas de cada disco del disco duro) y cada cilindro puede funcionar con un sistema distinto. Como no puedo trabajar a la vez con los dos, en el sector primero, hay un master, que tiene información sobre el número de particiones, el tamaño de cada cilindro, y en qué sistema operativo se arranca.

La ROM participa en la gestión de los recursos del ordenador.ROM-BIOS: Cómo participa la ROM con el sistema operativo.– 1- Área de inicialización (Bootstrap y Post Comprueba el hardware)– 2- gestor de interrupciones– 3- Zona de servicios (Programas de la ROM que colaboran con el MS-DOS para

controlar la parte más íntima del hardware).

Gestor de interrupcionesColabora por la manipulación del hardware por los programas. Una interrupción es una

señal que interrumpe el trabajo del P. El gestor de interrupciones analiza la interrupción, gestiona y devuelve una respuesta.

Tipos de interrupciones

TIPO HARDWARE

– Interno: la causa de las interrupción ocurre dentro del P (15/0)

6

Escritorio (Shell)

PC

Recursos (Bios)

Carpetas

Archivos

PC

PC

P

P

Page 7: Apuntes de Bioinformática

Bioinformática

– Externo: Interrumpen el funcionamiento del P y vienen fuera del P. (Damos a la tecla retorno al estar ocupado, la impresora se queda sin papel, cuando se escribe o se lee en disco)

TIPO SOFTWARE

– Se producen durante la ejecución de un programa (print...)jueves 12 de marzo de 1998

Redes de ordenadoresUna red es dos o más ordenadores conectados entre sí. Depende de las dimensiones

que tenga la red.

LANLocal Area Network red local Los ordenadores conectados a red están instalados en un edificio u otro muy próximo.

WANWide Area NetworkMayores dimensiones (barrio, distrito, pueblo)

Ventajas de una redSe puede compartir Hardware y Software.Puede haber correo electrónico. (E-mail).Componentes de una red

SERVIDOR

Componente más importante de la red. Es el ordenador de la red que comparte sus recursos con los demás.

Hay servidor de ficheros y de impresora.Características: Tiene que tener mucha RAM, varios discos duros (dos mejor que uno) y

un P de velocidad alta. También mucha memoria caché.Se van a hacer particiones o volúmenes.Se define un sistema de acceso restringido.Uno es privado Password.Otro es compartido Determinado grupo de usuarios.Otro es público Todos los usuarios.Gestor de impresión: Es el ordenador que tiene mayor calidad. También tiene que tener

mucha RAM.Spooler Programa que determina el orden en que se imprimen los trabajos.Gestor dedicado De torre alta, sin teclado ni monitor.

TERMINALES

No tienen por qué ser ordenadores buenos.

PASARELAS

También llamadas “gateway” permite la conexión entre dos redes locales.MainFrame: Centro de cálculo especial para redes.

CableadoEn estrella: Si se rompe el servidor, la red se viene abajo.En árbol: Si se rompe una rama, sólo se desconecta de la red esa rama.En anillo: Si se rompe un ordenador no se cae la red.En bus: El más fiable. En los extremos hay una resistencia que evita el efecto del eco.

martes 17 de marzo de 1998

7

Page 8: Apuntes de Bioinformática

Bioinformática

Cableado LAN

Par telefónico < 1 Mb/s1 mm de grosor. Es muy sensible al ruido magnético (tormenta, temperatura...)

Par trenzado 10 Mb/sTrenzado como una molécula de ADN, que lo hace inmune al ruido magnético.

Cable coaxial banda base 10 Mg/sHilo conductor protegido por tres capas de material que lo inmunizan del ruido.

Cable coaxial banda ancha 150 Mb/sEl cable de la TV por cable. Puede llevar señales analógicas.

Fibra óptica 1000 Mb/sNo impulso eléctrico, sino luz (inmunidad máxima) Cada cable lleva hilo de cristal

equivalente a un pelo humano. La luz produce un diodo LCD o un rayo láser.

¿Qué necesita una red local?– Ordenadores– Sistema operativo– Software de red (PCLAN, Novell)– Tarjeta comunicaciones o módem (si es telefónico).

LAN– Red Cluster– Red PCNetwork– Red Token-Ring IBM– Red Ethernet RANK XEROX.

Red cluster (No estudiar)El servidor sólo puede tener un disco duro.Vd 375 Mb/sDistancias cortosCable coaxial banda base (caro)Máximo 65 PCsRed jerárquica

Red PC NetworkComparte disco duro e impresorasVelocidad 2·106 bytes/sDistancia mayor que la red cluster.Cable coaxial banda ancha.Máximo 72 PcsRed Pcs y grandes ordenadores (centro de cálculo)Programa PCLan bajo MS-DOSSistema I/O NetbiosNetbios circuito integrado que aparece en tarjeta de comunicaciones. Permite que un

programa pueda ser ejecutado desde cualquier ordenador de cualquier marca.

REDES ACTUALES

(Pregunta una en el examen)

EthernetDescendiente de red aloha (años 70)Forma de bus, al construir la red, se construye a cachos:

8

Page 9: Apuntes de Bioinformática

Bioinformática

– Terminador de línea: Se pone en el extremo del bus, es una resistencia que hace que no haya eco debido al cambio de medio.– Pieza en T: Para dos cosas

– Por uno de los extremos se conecta el ordenador.– Permite definir arquitecturas en forma de árbol.

– Pieza en I: Para conectar los cables.Independientemente de la topología, hay tres tipos de red, que dependen del tipo de

cable.Cable coaxial10 base 5 Grueso. Máximo 300 m cada 2,5 m hay líneas amarillas (donde se

conectan las terminales). Hay que tener un transceptor (cajita que controla flujo de información a los largo del cable que regula incorporación de la terminal).

10 base 2 Cable coaxial de máximo 185 m. Los terminales se conectan directamente en la pieza en T. (Cable fino o R6-58)

Cable telefónico10 base T Sistema de cable estructurado. Se asemeja a una red en estrella, pero

evita los problemas de esta red.RJ-11 conector telefónicoRJ-45 El que se usa para esta red.Todos los ordenadores son repetidores multipuerta (Hub).El hub está formado por puntos de recepción y distribuye el mensaje por las líneas

telefónicas.Si quiero enviar un mensaje, el mensaje espera un momento hasta que no habla ningún

ordenador y manda un cachito de información.

Red Token-RingRed en anillo interrumpido por unos dispositivos MAU (unidad de acceso multi¿¿¿???)

que controla el tamaño del anillo. Tiene la ventaja de incorporar a la red únicamente los ordenadores encendidos (Ring).

Por la red, circula una seña, (testigo o token). Si un usuario quiere enviar un mensaje, retiene el testigo y lo sustituye por el mensaje y circula por la red hasta la terminal receptora. Éste hace una copia del mensaje, y devuelve el mensaje a la red, que sigue circulando hasta el emisor, cogiendo el mensaje y lo sustituye pro el testigo. El primer usuario que se enchufe, es el administrador de la red, que genera el testigo y gestiona su estado de salud. Si el testigo no pasa por su ordenador, lo volvería a crear.

martes 24 de marzo de 1998

ProgramaciónPrograma: Conjunto de instrucciones ordenadas secuencialmente siguiendo una

sintaxis. Las instrucciones pertenecen a un lenguaje de programación.

Características1. Funcionar, libre de errores2. Documentación: Información sobre la características del programa. Tipos

– Interna: Es solamente para el programador (p. ej.: REM frase, esta información será ignorada en la ejecución del programa)– Externa: útil para el programador y el usuario (ejemplos, bibliografía...)

– Manual del usuario– Reference Book: archivos (LÉAME, README)

3. Apariencia, Estilo: Facilidad lectora.

Técnica general1. Análisis del problema (para encontrar una solución)2. Solución o Algoritmo: Conjunto de reglas o pasos que forman parte de una solución. Se

expresa gráficamente mediante un diagrama de flujo.

9

Page 10: Apuntes de Bioinformática

Bioinformática

3. Edición: El listado de instrucciones es el código fuente.4. Traducción: del código fuente en código máquina (programa objeto).5. Ejecución: Si funciona, vale, si no:6. Depuración: Eliminación de errores (“Debugging”)

– Puntos de ruptura (“breakpoints”) : Ejecuta un programa línea a línea. En el monitor no sólo aparecen resultados, sino también datos intermedios y estado de la RAM.– Módulos: Descompone el programa en módulos y los prueba por separado.– Trazas: Imprime el valor de ciertas variables críticas. (write, print).

7. Documentación

AlgoritmoSolución a un problema. Debe cumplir estas características:

Imprescindibles– Finitud: El número de pasos o etapas debe ser finito. El número de subalgoritmos

también tiene que ser finito.– Definitud: no pueden existir las ambigüedades.

Prescindibles– Generalidad: un algoritmo sirva para resolver un conjunto de problemas de la misma

clase.– Eficacia: Tiempo de espera en la ejecución.– Flujo que siguen los datos al ejecutar un programa.

FUNDAMENTALES

– Comienzo/fin de programa– Proceso interno (operación aritmética) – Proceso interno (decisión, bifurcación u operación lógica)

SECUNDARIOS

– Lectura/escritura de datos– Teclado– Impresora– Sub-programa– Símbolo (dentro):Cada símbolo dentro un comentario– Símbolos se unen con flechas.– Se lee izquierda a derecha y arriba y abajo.– Siembre al final hay que poner fin.

Programación estructurada o modularConjunto de reglas que nos lleva a resolver un programa. Es una filosofía se puede

seguir o no.

Estrategia Top-Down (de arriba a abajo).

10

Page 11: Apuntes de Bioinformática

Bioinformática

Escribo el código fuente para cada solución menor.Test independiente de cada módulo antes de incorporarlo al programaGrupos de módulos por afinidad. Lógico- funcional (S1, S2 , etc.).Estructuras control relacionan los módulos.

Teorema de estructuraPuedo escribir en cualquier lenguaje de programación siguiendo tres estructuras

básicas.Estructura secuencial: I=V/R Input V, R, PRINT IEstructura alternativa: Desvía el flujo de datos en función de una condición lógica. IF

A>B THEN acción1 ELSE acción2.E. repetitiva: Un conjunto de sentencias se realiza repetidas veces. También llamada en

bucle.FOR J=1 TO 10acciónDO WHILE condiciónacción

jueves 26 de marzo de 1998

Lenguaje de programación: Es un lenguaje que representa un algoritmo.– Declarativos: Inteligencia artificial (Prolog, lisp)– Imperativos o procedurales: Se utilizan para escribir un algoritmo.

– Alto nivel (se asemeja al lenguaje humano): 1. General (BASIC, C, Pascal...) 2. Particular (Orientados a ámbito estrecho de administración COBOL).– Bajo nivel (más parecido al lenguaje del ordenador)

Programa traductorPrograma fuente Traductor (intérprete o compilador) Programa objeto (código

máquina).

CompiladorPrograma fuente

Análisis léxico

Análisis sintáctico

Análisis semántico

Optimización

Generación de código

11

Fase de análisis

Fase de síntesis

54321

S2S1

S

SubP2SubP1

MódulosProblemas menores

Soluciones

Ecuación de segundo grado

Problema trivialP

54321

Page 12: Apuntes de Bioinformática

Bioinformática

Programa objeto (.COM)

Enlazador (enlaza módulos)

Reubicador (sustituye las direcciones de memoria simbólicas)

.EXE

Direcciones simbólicas: Son las direcciones de memoria que usa el programa objeto, que son ficticias.

Diferencias entre intérprete y compilador– Intérprete es un programa traductor que traduce una línea y la ejecuta. No requiere

mucha RAM.– Compilador: Traduce todo el código fuente a código máquina, creando un .EXE

Requiere más memoria RAM.martes 31 de marzo de 1998

Tema: Lenguaje PASCAL

PROGRAM título;VAR a,b,suma:integer;BEGINWRITE (‘valor a y b’);READLN (a,b);SUMA:=a+b;WRITELN (total);END.

Características a tener en cuenta– ; Separa sentencias– Documentación interna (REM):

– (* lsdkjfklasjfklajsdkfjalñsjdfl *) o { lsdkjfklasjfklajsdkfjalñsjdfl }– Operador igual:

– := Operación aritmética (SUMA:=a+b;)– = Operación lógica (IF a=b THEN...)– Palabras reservadas: Palabras que no se puede dar como nombre a variables.– Nombres de variables: Longitud de nombre indefinida. No se puede poner con

vocales acentuadas, sólo los 128 primeros caracteres del código ASCII.

Estructura de control

Expresiones condicionalesIF THENIF THEN ELSEIF THEN anidados

Estructuras iterativas, buclesBucle DOBucle contador.Bucle sumador.Bucle FOR DOBucle REPEAT UNTIL

12

Zona de asignaciónBloque

código fuenteZona de asignación (algoritmo)Zona de salida

Page 13: Apuntes de Bioinformática

OI

Bioinformática

Estructuras de datosVariables subíndice: array.Registros: Record.

Conceptos avanzadosProcedimientos/ funciones.Menú de opciones: CASE OFLectura (creación de ficheros en disco) etc.Organización de un programa.

martes 31 de marzo de 1998

Tema

SistemaEcosistema

CélulaSociedadEmpresa

Metabolismo

Proceso/ fenómenoAprendizaje

ReproducciónEvolución

Relaciones socialesOferta Demanda

Reacciones metabólicas

ModeloModelo: Abstracción formal de un sistema o proceso. Entendiendo como formal que hay

expresiones matemáticas que representan las características de este sistema o proceso, aunque el modelo puede ser o no matemático.

FinalidadComprender la estructura íntima de un sistemaPredicción

EstructuraViene dada por sus ecuaciones:

Ej. Ley de Ohm: I=V·1/RI: Variables de entrada (V)O: Variables de salida (nos dice el estado del sistema) (I)

Parámetro: Cantidad numérica que relaciona las variables de entrada con las de salida. (1/R, Km...) Expresan una característica del sistema, pero no puede ser directamente observada.Constantes Parámetros que no varían.Sus valores se estiman en laboratorio, métodos estadísticos...

Ecuaciones: Explican el comportamiento de un sistema.Nivel de explicación– Efecto de primer orden: Si explica efectos principales.– Efecto de segundo orden: Aspectos particulares.

La variable O (Output) depende de:

13

Caja negraNodos

Grafos

Page 14: Apuntes de Bioinformática

Bioinformática

– Estructura del sistema– “datos” (I, Parámetros)

martes 2 de abril de 1998

Clasificación Holling de sistemas– calidad de los datos:

– Alta: número de votantes del sistema.– Baja: poco informativa.– De lado del reconocimiento del sistema por parte de una persona.– Sólo se toman dos valores alto y bajo– Sistema esto cáustico utilizan estadística.– Sistema determina este utilizarlo visto matemáticas.– Dinámica de sistemas: es un sistema mixto.– A esta clasificación:

Simulación– Experimentación con los sistemas.– Ensayo por el que prevemos el estado futuro del sistema.– Creación de un sistema artificial: pretendemos que imite perfectamente un sistema real.

Clases o categorías– Continuo: simulación analítica, corresponde a sistemas determinísticos (sistemas de

ecuaciones diferenciales)– Discreto: sistemas estocásticos.

Diferencia entre modelo matemático y el modelo de simulación– Modelo matemático: pretende "imitar" un sistema real cuando lo reproduce porque ese

comportamiento existe en las ecuaciones.– Modelo de simulación: imita un sistema real, pero no existe en las ecuaciones, sin

embargo lo hace a partir de las interacciones entre los módulos del sistema.

Definición de experimento de simulación– Ver el efecto de los parámetros– Ver el efecto del cambio de las condiciones iniciales.– Ver lo que pasa si el cambio los dos.– Cambios en el modelo hasta que se ajuste más a los datos observados en la naturaleza.

Criterios para la simulación– Baja el tiempo de simulación (velocidad): depende de la RAM reanudar dictado y el

microprocesador.– Facilidad para modificar el código fuente (lenguaje destinado orientado la simulación)– Facilidad para modificar los parámetros – El output puede ser numérico (listas/tablas) con gráficos, en dos dimensiones o tres.– Complejidad lógica del programa– Desarrollo: lenguaje estándar (orientado a la simulación). Simulador: programa que

introduce la simulación, insertando simplemente los datos.

Función/utilidad – Experimentación controlada: sin necesidad de perturbar el entrono real.– Predicción del futuro: por ejemplo estructura terciaria de una proteína.– Entrenamiento: simulador de vuelo.– Verificación de una trayectoria o hipótesis: origen de la vida, evolución...– Una predicción en simulación consiste en obtener esta serie: – X(t), X(t+2t),X(t+3t)...– Esto mediante la ecuación diferencial (ordinaria) – Cómo resolver una ecuación diferencial en el ordenador:

14

Page 15: Apuntes de Bioinformática

Bioinformática

– ¿¿¿ ? ? ? Algo pasa aquímartes 14 de abril de 1998

¿¿¿??? Falta un poco de este día al principio1. Se definen variables que nos definen el estado del sistema en un tiempo: x(t)2. Se elige cómo queremos que sea el tiempo. Hay dos tipos:

– Contínuo: valor de flujo. Entre dos puntos cualesquiera siempre existen valores intermedios.– Discreto: transcurre a saltos: t, t+1...

Todos los modelos de simulación utilizan tiempo discreto porque es el más fácil de incluir en el código fuente.

Sistemas dinámicosSistema determinístico cuyo estado cambia constantemente.– El problema principal al aplicar esto a sistemas biológicos es que el estado en t0 siempre

depende del estado anterior (t-1). (el impulso nervioso).– Otro problema es que hay que esperar un tiempo (retardo) desde que aplico todo input

hasta que se produce una respuesta (valor de x).El principal mecanismo para reproducir este sistema es:

x (t+t) = f(x(t),t) Función de evaluación (se obtiene de manera empírica)Por ejemplo: Predicicón de [Ca+] dentro de una célula:

Ca (t+1) = Ca(t) + FCa(t) (flujo de calcio) +OCa(t) (calcio acumulado en orgánulos)¿Cuando utilizar ecuaciones diferenciales? Cuando sea posible saber calcular la tasa de

cambio de un sistema:x(t+t) = x(t) + xx(t) + f[x(t),t] · t

Cuando:x 0 y t 0

dx/dt = f[x(t),t] · t– Una predicción en simulación en sistemas dinámicos consiste en obtener esta serie:

x(t), X(t+2t), x(t + 3t)– Cómo resolver una ecuación diferencial en el ordenador:

MÉTODO DE EULER O DE LAS TANGENTES

En simulación no nos interesa la solución exacta, sino una aproximada. Solución numérica requiere métodos numéricos.

1 dx/dt = f[x(t),t] · t2 Definir las condiciones iniciales t=0; x=0Lo que quiero saber es el estado en t1=t0 + tSu ecuación es:x1 = x0 + t · x’0x2 = x1 + t · x’1Fórmula de Euler: xn+1 = xn + t·x’nCuanto más pequeño sea t(intervalo de simulación) será más exacto.Ejemplo:dA/dt = A (2·12 - 0,04 A) (A expresa como mayor el área en cm) Tasa de cambio del sistemaA(0) = 0,24 cm2, t=1 (normalmente más pequeño 0,2,0,4...)t=0 t=1 t=100Programa:A(0) =0,24FOR T=0 TO 100A(T) = A(T-1) + INCT*(A(T-1)*2,12-0,04*A(T-1))NEXT T

jueves 16 de abril de 1998

15

Ilustración 1: Solución analítica.

Page 16: Apuntes de Bioinformática

Bioinformática

Los métodos numéricos para mejorar la aproximación van a buscar una tangente cuya pan dientes y aproxime más a la solución exacta (analítica)

Método de de IU de tres términos– Xn+1 = Xn+t·X’n + (t2/2)·Xn’’

– Método de Runge- Kutta– Xn+1 = Xn+aK1+bk2+ck3+dk4

– a,b,c,d =cte– k1,k2. Son los puntos intermedios para estimar el siguiente punto.– Sistemas estocásticos: sistemas los cuales interviene la azar.

Método de Montecarlo– Es un nombre genérico que agrupa a una familia de métodos. Cualquiera de ellos

requiere de números aleatorios (principio del bombo).– ¿Cómo hacer este montaje? Utilizando un generador de números aleatorios, que es un

programa de ordenador capaz de generar numerosos incluidos entre cero y el 1., ambos inclusive [1(0,1)] su. Incluye RND y RANDOM que son comandos que invoca en este generador.– Sin embargo cada número que nos da generados no es un número aleatorio sino sin

duda aclaratorio. Un generador debe tener:– 1. Que se eficiente: dependiendo del avión de la ciudad de microprocesador adherentes

veracidad., el número se obtiene a dicho dementes velocidades.– Todos. Correlación seria nula que se en los números independientes entre sí.– 3. Distribución uniforme: todos los números tienen que tener la misma probabilidad de

salir.– 4. Ciclo de generación : la secuencia base sea la más larga posible.

Método de John Von Neumann o “mid-square”1. V0 valor semilla:2. V0

2

3. V1 igual a los p dígitos centrales de V02

Método de Lehmer o Congruencia1. V0 semilla2. V1=(V0·a1+a2) mod k3. V1/k U(0,1)– Elegir a1, A2 y k.

Martes 21 de abril de 1998

Método de Montecarlo1. U(0,1) U1, U2...2. X v.a. f(x) inversa de la transformación (distribución exponencial o uniforme) o

simulación directa.– Variable de Bernouilli (la más sencilla).– Si x=0 se verifica un fracaso, si es 1 un éxito– sorteo de equipo contigo es: de tipo continúa: meses electorales.– Variable binomial: son variables aleatorias independientes con distribución de Bernuilli– ¿¿¿ ? ? ? Falta un poco

VARIABLE DE DISTRIBUCIÓN NORMAL

– Es una consecuencia del teorema central del límite.– z :N(0,1) Z=U1+U2+...+Un

– Corrección : Z= Z-6 (ya se explicará en prácticas)Jueves 23 de abril de 1998

Técnicas alternativas de simulación– (Van a ser equivalentes a utilizar ecuaciones diferenciales pero no las usa)

16

Page 17: Apuntes de Bioinformática

Bioinformática

– partiendo de que tenemos un sistema determina místico nos encontramos con:– 1. Sistemas biológicos que no conocemos (origen vida, desarrollo embrionario) y por

tanto no podemos pasar a ecuaciones-esenciales. – todos. Sistemas biológicos conocemos pero que las ecuaciones diferenciales son muy

complicadas (poseen derivadas parciales).

Autómatas celulares– Existen elementos (por ejemplo un ecosistema). Que interacción entre sí. Las

situaciones de la agencia les utiliza invariables y situación en el sistema a lo largo de un tiempo son variables globales.– Con los autómatas no defino variables sino las interacciones entre los elementos. Veo

cuantos estados se puede encontrar cada elemento (vivo-muerto). Vamos a definir una autómata célular en una región de dimensión D.– Existe un elemento o autómatas de finito: tres características:– Tiene un input– : conjunto de todos los estados posibles– : reglas de transición.– Ejemplo: un semáforo es un autómata finito.– =3 (rojo, verde, amarillo)– un semáforo recibe un input que es el estado de los demás autómatas cimientos– Para actualizar el estado de semáforo lo calculan las reglas de transición y conociendo

los estados de los demás.

Vecindad de Moore (o de 8 vecinos)– Tengo un autómata finito central.

Vecindad de Von Neumann (o de 4 vecinos) juego de la vida--mayor que el más famoso autómata finito y el más activo.Puede pasar tus cosas cuando ha transcurrido mucho tiempo de simulación:1. El autómata evoluciones sin llegar a una solución fija--mayor que el sistema

evoluciona a un estado carente de orden.Dos. El autómata puede evolucionar a una estado ordenado. Esto es equivalente a abrir

resuelto una ecuación diferencial. Sistemas a tractores. Estructurasmartes 28 de abril de 1998

Inteligencia artificial

Historia1920 Un escritor de ciencia ficción definió “robot”.1940 Alan Turing aborda la cuestión de construir máquinas inteligentes.1950 IA : Resultado de la influencia de muchas ciencias.

– Neurofisiología : Nos dice el Hardware.– Psicología : Nos dice el Software.– Teoría de juegos :

Y = a1X1 + a2X2 + a3X3 + a4X4 +...+ anXn Las características de esa posición son favorables a la máquina si ai>0.

– Lógica : Turing construyó una máquina teórica que es la formulación más sencilla de un ordenador. Un problema es computable se puede ser resuelto con un ordenador o máquina de Turing. Los otros problemas se llaman no computables.– Cibernética : Estudia los mecanismos de control y cómo procesan información los

animales y máquinas.1956 IA nace : Es una disciplina de carácter interdisciplinar cuya finalidad es la

construcción y diseño de máquinas inteligentes. Una máquina inteligente es capaz de hacer tareas en las que un ser humano necesita la inteligencia.

1960 Desarrollo :

17

Page 18: Apuntes de Bioinformática

Bioinformática

– Ordenadores más potentes– 1er lenguaje LISP (se define el problema y el ordenador da la solución.– “Logic theorist” 1er programa de inteligencia artificial.

1970 Sistemas expertos : Simulan el razonamiento que haría un especialista :– MYCIN A partir de síntomas, diagnostica enfermedades.– PROSPECTOL Ayuda a los geólogos.– PROLOG Lenguaje– MACSYMA : 1er programa de cálculos simbólicos. (derivadas...).

1980 Redes neuronales artificiales : Modelos que simulan la función de las neuronas.Jueves 30 de abril de 1998

– Las redes neuronales intentan simular redes neuronales parecidas a las biológicas. Se inspiró en los descubrimientos de Cajal, el aprendizaje tiene lugar a nivel de sinápsis.– La red del neuronas artificiales van a reproducir y modular conexiones sinápticas.– Cualquier objeto se puede codificar en una matriz.– Una red artificial está compuesta por neuronas artificiales=nodo=elemento procesador.– Se organiza por capas. Cada nodo está relacionado con los nodos de la capa inferior.– Función: reconocer un objeto, gracias a la acción de todas las neuronas en conjunto.– Cada neurona artificial no equivale a una neurona biológica, sino que representa una

acción conjunta de un grupo de neuronas.– Capa de entrada: simula lo que haría una capa de neuronas biológicas conectadas a un

sistema sensitivo.– Capa de salida: conectadas a un sistema efector.– Ambas tienen contacto con el medio exterior. La capa intermedia está aislada del medio

exterior.– La capa intermedia u oculta: recibe la información de la Capa de entrada intentan

obtener las características del objeto en cuestión. Es la responsable de obtener una representación del objeto.

Neurona artificial

– Es un sumador con un elemento umbral.– Las características de la sinápsis vamos a representarlas por (siendo nuestra neurona

J). No alivia– es la representación de la plasticidad sináptica de las neuronas biológicas. Cajal:

aprender modifica la plasticidad sinápticas y hace mayor o menor la facilidad con la que circula un neurotransmisor.– Cuando aumenta : hay facilidad de circulación– Cuando disminuye, hay dificultad de circulación.– Cuando las neuronas artificiales reciben información (input=i) realizan sumas

ponderadas: suma en señales de entrada y las multiplicado por su peso correspondiente.– =I1·1j+ I2j·1j+ I2·2j+ I3·3j+...+ Ii·ij

– = NETj=iiijh

– Cuando conversa es igual a cero no existe conexión, cuando es mayor que 0 la conexión es excitado hora, cuando es menor que 0 es inhibido hora.

18

Oj

jij

ij

ij

Ii

I2

I1

Page 19: Apuntes de Bioinformática

Bioinformática

– Una vez detenido el valor NET, hay que decidir si el nivel de estimulación es suficiente para producir una señal. Para decir esto:– Función : f() varias funciones.

Modelo lineal– OjResultado de la neurona– si NETj>= – Según aumente o disminuya el , baja y sube

respectivamente la sensibilidad de la neurona.– que esto constituye además una autómata finito.

Modelo no lineal– Es más eficaz.– Oj= 1/(1+e-NETj)– El problema de estos dos modelos: se trabaja con 0 y

1.0: reposo, se pierden su valor.– Para el evitar esto, se

utiliza una tangente hiperbólica:– Oj=tg(NETj)·(eNETj-e-NETj)/(eNETj+e-NETj)– La probabilidad de que caiga el resto en el examen es

uno.–

– Todas las neuronas de la Capa de salida están conectadas con todas las neuronas de la capa exterior.– Ii=Componentes del detector

de entrada: tiene codificados las características de un objeto.– Ejemplo tonto:– El objeto es un bolígrafo.

I1=¿Es oscuro ? SI=1 No=0 I2=¿Escribe? SI=1 NO=0.– Oi : Es el estado por valor de

activación de la neurona y.

VECTORES

– Matriz memoria: sus elementos son los pesos de las conexiones. Recoge las características de un objeto.– Hay que calcular el vector salida. Siempre hay que conocer los vectores entrada y

memoria.

– Sustituyo por sus valores:

19

45

46

0,40,8

35

36

=0,30,7

25

26

0,20,9

Entrada

Salida15

16

NET5

NET60,10,8

I1

i2I3

1010

ij

valor umbral NETj

0

Oj1

valor umbral NETj

0

Oj1

-1

1

NETj

valor umbral0

Oj

I1

I2

I3

Page 20: Apuntes de Bioinformática

NET4NET5NET6

1,30,51,3

Bioinformática

– Tengo los valores NETj (suma ponderado de las entradas) simular la estimulación neuronal.– Ahora hay que saber si los valores netos obtenidos son suficientes para estimular la

neurona.– Para una función de tipo escalón, se utiliza el modelo de

McCulloch-Pitts.– Valor umbral : siempre se reconoce. Supongamos que

vale 1.– O5=0 no es suficiente para el valor umbral.– O6=1 si es suficiente.

Otro ejemplo:3 capas– Cuando tengo tres capas calculo el valor de

salida o estado de activación de la capa intermedia, de manera que representará el vector de entrada entre la capa intermedia y la de salida.– En este caso no está obligado a mantener la

función de activación en todas las capas, puede ser distinta en cada una.

– Supondremos otra vez que tenemos la función escalón:

– En ciertas aplicaciones al valor NET se le suma un valor numérico llamado ruido. Puede ser un número aleatorio. En ciertas aplicaciones es mejor que exista ruido. Por ejemplo: en el hombre la supervivencia es posible gracias al sueño; en el sueño se produce ruido (señales aleatorias) esto se reproduce en las redes neuronales y funcionan mejor. – Si el ruido es R=0,78 éste se suma al valor NET (vector (2’08,1’28,2’08))– El vector de salida de 4,5,6 es el de entrada:– (El ruido es aleatorio en cada etapa, como las funciones de activación, lo pongo o los

quito cuando a mí me dé la gana o cuando me lo diga el enunciado del problema) – O7=f(NET7) = (eNET8-e-NET8)/(eNET8+e-NET8)=0,186 Cuando utilizo la función hiperbólica no

hay que redondear a 1 o a 0 porque los estados están entre 1 y -1 de manera continua.– Nota: no hay que aprenderse esta fórmula, nos la dará en el examen. Las función

escalón si.– Si es una función logística puede tomar cualquier valor (con decimales) entre 0 y 1.– Los sistemas de redes vistos son de tipo reactivo porque ante un vector de entrada

genera uno de salida pero no existe aprendizaje.Jueves 7 de mayo de 1998

Red de aprendizaje – Aprendizaje: proceso por el cual un individuo cambia de patrón de comportamiento, de

manera que se adapta de manera más favorable.– En una red neuronal significa que unoo más neuronas de la capa de salida cambia su

estado de activación.– Vamos a definir una serie de características que someten a una red aprendizaje, de

manera que en seguida sea la adecuada. Esto se hace al nivel de:– Topología: estructura de la red. No es modificable.– Vector de entrada ( input) :tampoco se modifica (el mundo exterior no es modificable).

20

==0,80,90,1

0,70,30,4

0,60,20,9

110

valor umbral NETj

0

Oj1

valor umbral NETj

0

Oj1

Page 21: Apuntes de Bioinformática

Bioinformática

– Función de activación: no se puede alterar porque es una parte integral de la red. – El valor de los pesos () : teoría de Cajal: el aprendizaje y nivel de las conexiones. Lo

que vamos a modificar es una regla de aprendizaje.– ij(t+1)=ij(t)+ij) Paradigma de aprendizaje– Así se aumenta la facilidad de la conexión.– Todos los paradigmas de aprendizaje pueden ser: (ambos coexisten en animales y

seres humanos)– De tipo supervisado: requiere la presencia de un agente externo o un supervisor (los

padres, profesores...)– Tipo no supervisado: no existe la mediación de un supervisor. Por ejemplo: aprendizaje

por fuerza: en una jaula de skinner la rata pulsa dos palancas, una da una descarga eléctrica y otra da comida.– ¿Cómo sabemos si la red neuronal aprendido?– Cuando aprende algo correctamente los pesos no cambian, o lo que es lo mismo

matemáticamente: dij/dt=0

Modelos de aprendizaje de redes neuronales

PERCEPTRÓN

– El más antiguo. Lo creó un psicólogo (Rosenblarr). Modifica el de Mc Culloch-Pitts en el cual no se puede dar aprendizaje:

– 1. Se definen los (mediante un generador de números aleatorios entre 0 y 1)– 2. Para cada patrón de entrada se

definen el estado de la neuronales y. Por ejemplo: 0010, 0101... esta tabla o mapeo la define el usuario como le dé la gana.– Ahora utilizaremos todos valores de la

neurona de salida: es el valor que quiero que aprendan y ese valor que, sin aprendizaje.– 3. Dado un valor que nos da en

respuesta la neurona de la capa de salida, utilizando una función de tipo

escalón.– Esto habrá que hacerlo para cada patrón de entrada.– I1I2 se compara con – I1’I2’ se compara ’ con ’– 4. Aplicar la regla de aprendizaje del perceptrón:

i(t-1)=i(t)+[(t)-(t)] Ii

– Lo que sabía sin aprendizaje– :factor de aprendizaje, determina la velocidad de aprendizaje de la red. 0<<1

– Si =0 la red aprende muy despacio.– Si =1 aprende muy rápido pero de manera inestable (con alfileres).

– [(t)-(t)] :Error. Cuando sea distinto del 0 se aplica la regla de aprendizaje. – Ii= input que recibe la neurona de

salida.– Ejemplo :– Calcularemos el NET del primer

vector:– NET= 0·0,5 + 0·0,9 =0

21

Page 22: Apuntes de Bioinformática

Bioinformática

– O3 = f(NET) =0– Ahora el 2º– NET = 0·0,5 + 1·0,9 = 0,9– O3= f(NET) =0 ; =1 Existe diferencia así que aplico la regla de aprendizaje. Esta actúa

sobre lso pesos– 1 (T+1) = 1(t) + 1(1-0)– 2 (t+1) = 2 (t) +1(1-0)1– Veamos si realmente ha aprendido :– NET=0·0,5+1·1,9 = 1,0 O3=f(NET) = 1 (Coincide con )

martes 12 de mayo de 1998

Limitaciones:Solamente pueden aprender a reconocer y clasificar patrones si éstos son linealmente

separables.(que tienen características que no comparten). Ejemplo: si quiere que la red neuronal de tipo perceptron aprenda esto.Net=I1W1+I2W2

g=0 i1w1+i2w2<1 I1w1+i2w2>El valor net es la ecuación que nos separa los patrones.teorema de convergencia del perceptrónEl precepto son sólo es capaz de clasificar dos grupos de patrones en un número finito

de pasos (si son linealmente se palpables).El problema está práctica se producen situaciones que no puede resolver el preceptrón. preceptor. Red neuronal , vapor repetirse, retro propagación.Es una generalización de la regla del percepción (regla delta). W1(+1)=w1(t)+(d-0)iiDos o más capas ocutas.Y representación interna del conocimiento. Sus neuronas son capaces de extraer las

características de los objetos. Si a la red neuronal se le presenta un objeto que no ha visto antes, es capaz de clasificarlo, incluso distorsionado.

Función de transferencia continuaSe inspira, en la biología y la psicología.(en el psicoanálisis de Freud)Ello: parte instintiva del conocimiento.Super yo:sociedad (intentan reprimir al ello).Yo: yo,(reprime también al ello).

La red bp sin entrenar, simula el ello. Al entrenar 1, aparece el superyo.Freud decía que, a lo mejor, habría un mecanismo que hiciera que la información fuera

en contra del resto.

Red: naval red:Como mínimo tres capas, la segunda capa está oculta y se llama J..algoritmo1-inicializar w.: valores pequeños y aleatorios.2-presentar patrón entrada/salida deseada.

22

Retropropagación

I1, I2 ..... Ii 1, 2 ..... k

I’1, I’2 ..... I’i ’1, ’2 ..... ’k... .. .. .. .. ..I1, I2 ..... Ii 1, 2 ..... k

Page 23: Apuntes de Bioinformática

Bioinformática

jueves 14 de mayo de 1998

3. Calculo del algoritmo:a) valor del vector de salida: Ok=f(NETk) Estado de activación : Oj=f(NETj) ; NETj= i ij·Ii

b) ¿Están las neuronas de la capa de salida en situación de error ?– Vamos a calcular k-Ok=k

k=(k-Ok) · f’(NETk)

––––––

f’ nos muestra el grado de error de una neuronak=(k-Ok) · O(1)

c) capa pacto ¿Cuál es un error de la capa ocultas? Su error no se puede calcular, que hacemos responsables de este error les neuronas de esa y. Dos y el error será proporcional a k, la constante será jk.

j=(kjk·k) Esto es el término de retropropagación (basado en Freud)j=(kjk·k) · f’ (NETj) estima el grado de error.

d) Fase de actualización de llos pesos :jk(t+1)=jk(t) + Wjk Es la regla del perceptron

jk(t+1)=jk(t) + (k-Ok) Ok (1-Ok)Oj

jk(t+1)=jk(t) + (kjk·k) Oj (1-Ok)I1

e) ¿Cada cuanto modificamos los pesos ?– Hasta que E <= 0,1, 0,01 o 0 (un cierto número).– Para delimitar cuando termina el aprendizaje, definimos una superficie de error.

– La regla aprendido cuando alcanzado un mínimo. El mínimo puede ser local (d/dt=0) o global: reconoce cosas que nunca ha visto.– A veces la red queda atrapada en mínimos locales y nos creemos que aprendido.

Una tratamiento local, solución darle un número aleatorio.– Fórmula general:– =-(dEp/d) Modificamos los pesos para obligar a bajar a la red por sitios de la

superficie de error donde la pendiente es muy grande para que lleguen seguro al mínimo a global.– Con esto se resuelven ecuaciones diferenciales y se consigue que les neuronas de

la capa intermedia actúen como detectores de características.Jueves 28 de mayo de 1998

Sistema experto probabilístico– Evitan problemas de los sistemas expertos basados entregas.

23

valor umbral valor umbral NETjNETj

00

local

local

local

Global

local

OjOj11

Page 24: Apuntes de Bioinformática

Bioinformática

– evitan esta rigidez en el razonamiento utilizando la lógica de tipo incierto.– Vamos a asociarle al resultado una medida de verosimilitud (está enfermo en un 70%).

H1,H2,H3...Hj

– La medida de verosimilitud se puede conseguir con la teoría de probabilidad.P[E/S)=(P(ES))/P(S)– La base de reconocimiento es un fichero donde vamos a incluir un espacio de

probabilidad (matriz de probabilidades).– Los hechos pueden ser binarios (ser o no ser) o múltiples (ser mucho, ser y ser poco).

Técnicas para almacenar probabilidades

Modelo de dependencia general– 2 probabilidades: una la que P(EJ S1 S2 ... SI) y otra la que presente síntomas

P(S1 S2 ... SI).– Cuando dos o más enfermedades tienen síntomas comunes se desperdiciado mucho

espacio y se utiliza otro método.

Modelo de dependencia general con síntomas relevantes– P(EJ S*

1 S*2 ... S*I) Síntomas relevantes– P(SI) Síntomas no relevantes.– Síndrome: todos los síntomas aparecen a la vez.– P(EJ /S1 ,S2, ... SI)= (P(EJ S*

1 S*2 ... S*I)·P(S1)·P(S2)·...)/ P(S*1 S*2 ... S*I)

Modelo de independencia generalP(SI) ·P(Si)P(EJ S1 S2 ... SI)– La base del conocimiento también tiene la lista de los síntomas y enfermedades.– El motor de interferencia combina el conocimiento abstracto con el concepto.– El motor de interferencia toma la teoría clásica de probabilidad condicionada.

S1 P(E1/S1) P(E1/S1) P(E1/S1)S1 ,S2 P(E1/S1S2) P(E1/S1S2) P(E1/S1S2)S1 p

– A medida que aumenta conocimiento sobre el número de síntomas, los valores de las probabilidades comienzan a separarse.(unos tienden a 1 y otros a 0).– Estos sistemas hay posibilidad de aprendizaje. El programa puede ir recalculando las

probabilidades.–

24