hyhorsphqwridqhxudofrqwuroohudssolhglqd … · 2014-02-18 · wdqk vjq wdqk vjq ec ec ec fq f kq q...

9
Abstract— In this paper the development of a neural controller implemented in a five Degrees Of Freedom (DOF) redundant robot is presented. The design of the control law considers the robotic system inverse model, including the performance of the actuators for the five joints, obtained through a feedforward neural network with backpropagation learning algorithm. This inverse structure is weighted by desired acceleration and derivative proportional feedback loops to provide the appropriate supply voltage to the servo motors of the robotic manipulator. Tracking tests are performed to a path in Cartesian space using a simulator developed using MatLab/Simulink software tools. It assesses the neural controller performance versus classical computed torque controller, comparing the results of curves in the joint space and Cartesian through RMS errors indices of Cartesian and joint positions. Keywords— neural network, inverse model, simulation, robots, redundant manipulators, controllers. I. INTRODUCCIÓN L EMPLEO de robot industriales, desde sus inicios hace ya más de sesenta años, ha permitido aumentar la productividad y mejorar la calidad de los productos fabricados, masificándose y extendiéndose rápidamente a diversas áreas de aplicación, como en las industrias: automotriz, plástica, alimentaria, maderera, agrícola, aeronáutica, ferroviaria, energética, entre otras. Este amplio campo de aplicación ha requerido como consecuencia la flexibilización del espacio de trabajo de los sistemas robotizados; característica que puede lograrse aumentando el número de grados de libertad del robot, es decir, dotándolo de redundancia, e incorporando una técnica de control adecuada a esta nueva estructura. Diferentes diseños de algoritmos de control, empleados en manipuladores robotizados, se basan en el conocimiento preciso del modelo dinámico del robot para elaborar sus respectivas leyes de control, sin embargo, las diferencias o errores entre el modelo y la realidad del sistema condicionan el buen desempeño del controlador. Una de las primeras estructuras de control, basada en el modelo del manipulador, es el control par calculado que incorpora términos de tipo proporcional y derivativo, y hace uso explícito de las matrices y vectores presentes en la dinámica J. Kern, Universidad de Santiago de Chile (USACH), Santiago, Chile, [email protected] M. Jamett, Universidad de Santiago de Chile (USACH), Santiago, Chile, [email protected] C. Urrea, Universidad de Santiago de Chile (USACH), Santiago, Chile, [email protected] H. Torres, Universidad de Santiago de Chile (USACH), Santiago, Chile y Universidad del Azuay, Cuenca, Ecuador, [email protected] modelada del robot. En este trabajo, para prescindir del modelo dinámico en el controlador se propone un sistema neuronal, utilizando una red feedforward con algoritmo de aprendizaje backpropagation Levenberg-Marquardt, que tiene como objetivo excluir el cálculo de la dinámica en la ley de control y conseguir el correcto desempeño del sistema robotizado a pesar de las incertidumbres en diferentes aspectos del manipulador, como por ejemplo: en la flexibilidad de los eslabones y de las articulaciones, en las perturbaciones externas, en la dinámica de los actuadores, en la fricción de las articulaciones, en el ruido de los sensores, y en otros comportamientos dinámicos no modelados. La organización del trabajo es la siguiente: en la Sección II se introducen las características principales de los robots redundantes. La Sección III hace referencia a la estructura del manipulador, junto con sus actuadores. En la Sección IV se explica la ley de control par calculado clásico y su dependencia de un modelo dinámico preciso. En la Sección V se plantea el controlador neuronal por modelo inverso, utilizando el algoritmo de aprendizaje de Levenberg- Marquardt. En la Sección VI se describe el entorno de simulación empleado. Finalmente, los resultados y las conclusiones se presentan en las Secciones VII y VIII, respectivamente. II. ROBOTS REDUNDANTES Los robots redundantes corresponden a aquellos que poseen más grados de libertad que los necesarios para realizar una determinada tarea [1], [2]. En los últimos años se ha prestado especial atención al estudio de los manipuladores redundantes; esta redundancia ha sido considerada como una característica importante en el desempeño de tareas que requieren destreza comparable a la del brazo humano, como la es por ejemplo, la del robot Hiro, primer robot industrial que interactúa directamente con las personas, desarrollado en Japón por la empresa Kadawa, como se muestra en la Fig. 1. Figura 1. Robot Hiro desarrollado por la empresa Kadawa de Japón. Si bien la mayoría de los manipuladores no redundantes J. Kern , Member, IEEE, M. Jamett , Member, IEEE, C. Urrea , Member, IEEE and H. Torres Development of a neural controller applied in a 5 DOF robot redundant E 98 IEEE LATIN AMERICA TRANSACTIONS, VOL. 12, NO. 2, MARCH 2014

Upload: others

Post on 20-Apr-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: HYHORSPHQWRIDQHXUDOFRQWUROOHUDSSOLHGLQD … · 2014-02-18 · wdqk vjq wdqk vjq ec ec ec fq f kq q fkq q =++ Š grqghn uhsuhvhqwd od uhodflyq gh hqjudqdmhv n n kaod frqvwdqwhghsdughoprwru

Abstract— In this paper the development of a neural controller implemented in a five Degrees Of Freedom (DOF) redundant robot is presented. The design of the control law considers the robotic system inverse model, including the performance of the actuators for the five joints, obtained through a feedforward neural network with backpropagation learning algorithm. This inverse structure is weighted by desired acceleration and derivative proportional feedback loops to provide the appropriate supply voltage to the servo motors of the robotic manipulator. Tracking tests are performed to a path in Cartesian space using a simulator developed using MatLab/Simulink software tools. It assesses the neural controller performance versus classical computed torque controller, comparing the results of curves in the joint space and Cartesian through RMS errors indices of Cartesian and joint positions.

Keywords— neural network, inverse model, simulation,

robots, redundant manipulators, controllers.

I. INTRODUCCIÓN L EMPLEO de robot industriales, desde sus inicios hace ya más de sesenta años, ha permitido aumentar la

productividad y mejorar la calidad de los productos fabricados, masificándose y extendiéndose rápidamente a diversas áreas de aplicación, como en las industrias: automotriz, plástica, alimentaria, maderera, agrícola, aeronáutica, ferroviaria, energética, entre otras. Este amplio campo de aplicación ha requerido como consecuencia la flexibilización del espacio de trabajo de los sistemas robotizados; característica que puede lograrse aumentando el número de grados de libertad del robot, es decir, dotándolo de redundancia, e incorporando una técnica de control adecuada a esta nueva estructura. Diferentes diseños de algoritmos de control, empleados en manipuladores robotizados, se basan en el conocimiento preciso del modelo dinámico del robot para elaborar sus respectivas leyes de control, sin embargo, las diferencias o errores entre el modelo y la realidad del sistema condicionan el buen desempeño del controlador. Una de las primeras estructuras de control, basada en el modelo del manipulador, es el control par calculado que incorpora términos de tipo proporcional y derivativo, y hace uso explícito de las matrices y vectores presentes en la dinámica

J. Kern, Universidad de Santiago de Chile (USACH), Santiago, Chile,

[email protected] M. Jamett, Universidad de Santiago de Chile (USACH), Santiago, Chile,

[email protected] C. Urrea, Universidad de Santiago de Chile (USACH), Santiago, Chile,

[email protected] H. Torres, Universidad de Santiago de Chile (USACH), Santiago, Chile y

Universidad del Azuay, Cuenca, Ecuador, [email protected]

modelada del robot. En este trabajo, para prescindir del modelo dinámico en el controlador se propone un sistema neuronal, utilizando una red feedforward con algoritmo de aprendizaje backpropagation Levenberg-Marquardt, que tiene como objetivo excluir el cálculo de la dinámica en la ley de control y conseguir el correcto desempeño del sistema robotizado a pesar de las incertidumbres en diferentes aspectos del manipulador, como por ejemplo: en la flexibilidad de los eslabones y de las articulaciones, en las perturbaciones externas, en la dinámica de los actuadores, en la fricción de las articulaciones, en el ruido de los sensores, y en otros comportamientos dinámicos no modelados.

La organización del trabajo es la siguiente: en la Sección II se introducen las características principales de los robots redundantes. La Sección III hace referencia a la estructura del manipulador, junto con sus actuadores. En la Sección IV se explica la ley de control par calculado clásico y su dependencia de un modelo dinámico preciso. En la Sección V se plantea el controlador neuronal por modelo inverso, utilizando el algoritmo de aprendizaje de Levenberg-Marquardt. En la Sección VI se describe el entorno de simulación empleado. Finalmente, los resultados y las conclusiones se presentan en las Secciones VII y VIII, respectivamente.

II. ROBOTS REDUNDANTES Los robots redundantes corresponden a aquellos que

poseen más grados de libertad que los necesarios para realizar una determinada tarea [1], [2]. En los últimos años se ha prestado especial atención al estudio de los manipuladores redundantes; esta redundancia ha sido considerada como una característica importante en el desempeño de tareas que requieren destreza comparable a la del brazo humano, como la es por ejemplo, la del robot Hiro, primer robot industrial que interactúa directamente con las personas, desarrollado en Japón por la empresa Kadawa, como se muestra en la Fig. 1.

Figura 1. Robot Hiro desarrollado por la empresa Kadawa de Japón.

Si bien la mayoría de los manipuladores no redundantes

J. Kern , Member, IEEE, M. Jamett , Member, IEEE, C. Urrea , Member, IEEE and H. Torres

Development of a neural controller applied in a 5 DOF robot redundant

E

98 IEEE LATIN AMERICA TRANSACTIONS, VOL. 12, NO. 2, MARCH 2014

Page 2: HYHORSPHQWRIDQHXUDOFRQWUROOHUDSSOLHGLQD … · 2014-02-18 · wdqk vjq wdqk vjq ec ec ec fq f kq q fkq q =++ Š grqghn uhsuhvhqwd od uhodflyq gh hqjudqdmhv n n kaod frqvwdqwhghsdughoprwru

disponen de los grados de libertad suficientes para realizar sus tareas principales, por ejemplo, el seguimiento de la posición y/o la orientación, se sabe que su manipulabilidad restringida resulta en una reducción del espacio de trabajo, debido a las limitaciones mecánicas de las articulaciones y a la presencia de obstáculos en dicho espacio. Esto ha motivado a los investigadores a estudiar el comportamiento de los manipuladores al incorporar mayores grados de libertad (redundancia cinemática), que consiguen cumplir con tareas adicionales definidas por el usuario. Dichas tareas pueden ser representadas como funciones cinemáticas, incluyendo no sólo aquellas que reflejan algunas propiedades deseables del comportamiento del manipulador, como las características de las articulaciones y la evasión de obstáculos, sino que también pueden ampliarse para incluir medidas del rendimiento de la dinámica a través de la definición de funciones en el modelo dinámico del robot, por ejemplo, la fuerza de choque, el control de la inercia, etc. [3].

III. ROBOT REDUNDANTE DE 5 GDL El manipulador robotizado en estudio incorpora dos grados

de libertad adicionales, en comparación con un robot industrial SCARA clásico, dotándolo de redundancia tanto en su movimiento rotatorio, en el plano x-y, como en su movimiento prismático, en el eje z, como se aprecia en la Fig. 2.

Figura 2.: Esquema de un manipulador redundante de 5 GDL.

Los modelos cinemático y dinámico del robot han sido desarrollados por los autores en [4], de acuerdo a [5], [6] y [7], empleando, para la dinámica, las ecuaciones (1) y (2):

( ) ( ) ( ) ( ),q q q q q= + + +τ M q C G F (1)

( ) ( ) ( ) ( ),q q q q q= + + +mτ M q V q G F (2)

donde τ representa el vector de fuerzas generalizadas (de dimensión n×1), M la matriz de inercia (de dimensión n×n ), C el vector de fuerzas centrífugas y de Coriolis (de dimensión n×1), q los componentes del vector de posición de las articulaciones, q los componentes del vector de velocidad de las articulaciones, G el vector de fuerza gravitatoria (de

dimensión n×1) , q el vector de aceleración de las articulaciones (de dimensión n×1), q el vector de velocidad de las articulaciones (de dimensión n×1), F el vector de fuerzas de fricción (de dimensión n×1), Vm la matriz de fuerzas centrifugas y de Coriolis, y n el número de grados del libertad del robot.

Los actuadores considerados en este trabajo corresponden a servomotores analógicos. En la Fig. 3 se aprecia el diagrama esquemático de un servomotor acoplado a un manipulador robotizado como carga [8]. Estos sistemas están constituidos por un motor de corriente continua, un juego de engranajes para la reducción de velocidad de giro y el aumento de torque en su eje motriz, un potenciómetro de realimentación conectado a este eje de salida (utilizado para conocer la posición), y un circuito de control que convierte una señal de entrada de tipo modulación por ancho de pulsos PWM (Pulse-Width Modulation) a tensión, comparándola con la posición realimentada para luego amplificarla y accionar un puente H produciendo un giro a una determinada velocidad [9].

Figura 3. Diagrama esquemático de un servomotor acoplado a un manipulador robotizado como carga.

En la Fig. 4 se muestra un diagrama bloques de un servomotor analógico al cual se le conecta una carga constituida por un robot.

Figura 4. Diagrama de bloques de un servomotor acoplado a un manipulador robotizado como carga.

El modelo dinámico de los servomotores contemplados ha sido desarrollado por los autores en [8], y está dado por las ecuaciones (3) y (4):

( )( )( ) ( )( )

...L a a s p i m

a b a m a a s ec

k R Ak k v J q n n

k k R B q n k R Ak pq f q n n

τ = − −

+ + +

(3)

KERN MOLINA et al.: DEVELOPMENT OF A NEURAL 99

Page 3: HYHORSPHQWRIDQHXUDOFRQWUROOHUDSSOLHGLQD … · 2014-02-18 · wdqk vjq wdqk vjq ec ec ec fq f kq q fkq q =++ Š grqghn uhsuhvhqwd od uhodflyq gh hqjudqdmhv n n kaod frqvwdqwhghsdughoprwru

( ) ( ) ( )( )( ) ( )( )

1

2

tanh 1 sgn 2 ...

tanh 1 sgn 2ec ec

ec

f q F kq q

F kq q

= + +

(4)

donde n representa la relación de engranajes (n1/n2), ka la constante de par del motor, Ra la resistencia de armadura, A la ganancia del amplificador de corriente (puente H), ks la sensibilidad del comparador, kp la ganancia total de la conversión PWM (kp1 ∙ kp2), vi la tensión de entrada al servomotor, Jm el momento de inercia del motor, kb la

constante de fuerza electromotriz inversa, Bm la fricción viscosa del motor, p la ganancia del potenciómetro de posición y k la ganancia del argumento de la función tanh utilizada para aumentar o reducir la pendiente de la curva en el cruce por cero.

IV. CONTROLADOR PAR CALCULADO CLÁSICO El controlador neuronal propuesto se basa en la ley de

control por par calculado clásico; éste consiste en la aplicación de un par con el objeto de compensar los efectos centrífugos y de Coriolis; gravitatorios; y de fricciones, como se indica en la ecuación (5) [10]:

( )( ) ( ) ( ) ( )ˆ ˆˆ ˆ,q q q q q= + + + + +d v pτ M q K e K e C G F (5)

donde M expresa la estimación de la matriz de inercia (de dimensión n×n ), C la estimación del vector de fuerzas centrífugas y de Coriolis (de dimensión n×1), G la estimación del vector de fuerza gravitatoria (de dimensión n×1) , F la estimación del vector de fuerzas de fricción (de dimensión n×1), dq el vector de aceleración deseada de las articulaciones (de dimensión n×1), Kp = diag(Kp1, Kp2, ..., Kpn) y Kv = diag(Kv1, Kv2, ..., Kvn) son matrices de ganancias proporcional y derivativa, diagonales y definidas positivas (de dimensiones n×n), respectivamente.

El vector de error de posición e, en términos de las coordenadas articulares del manipulador, se expresa mediante la ecuación (6):

= −de q q (6)

donde qd y q representan los vectores de posición: deseada y real de las articulaciones (de dimensiones n×1), respectivamente. El vector de velocidad e , en términos de las coordenadas articulares del robot, se expresa a través de la ecuación (7):

= −de q q (7)

donde dq representa un vector de velocidad deseada de las articulaciones (de dimensión n×1).

Si los errores en las estimaciones son pequeños, los errores de las articulaciones se aproximan a una ecuación lineal como se indica en la expresión (8):

0+ + ≈v pe K e K e . (8)

V. CONTROLADOR NEURONAL POR MODELO INVERSO Según se plantea en [11], una de las propiedades más

importantes de las Redes Neuronales Artificiales (ANN, Artificial Neural Networks) es la de ser es capaz de aproximar cualquier función continua real con precisión arbitraria. Esta característica ha permitido emplearlas en diferentes aplicaciones tales como: identificación de sistemas [12], reconocimiento de patrones [13], control de sistemas dinámicos [14], etc., sin embargo, ninguna de estas operaciones sería posible sin un adecuado algoritmo de aprendizaje. Durante muchos años se han utilizado los algoritmos basados en gradiente; alcanzado gran popularidad [15], como los algoritmos: de primer orden (gradiente descendente) y de segundo orden (gradiente conjugado), y los algoritmos basados en la metodología de Levenberg-Marquardt [16].

La ANN empleada para desarrollar el sistema de control utiliza el modelo inverso del robot; en ella se selecciona el algoritmo de Levenberg-Marquardt debido a que, en aplicaciones de control neuronal, este método de aprendizaje presenta rapidez de convergencia con errores suficientemente pequeños [17]. El algoritmo de Levenberg-Marquardt está diseñado específicamente para minimizar funciones de suma de cuadrados de errores, de la forma indicada en la ecuación (9):

221 12 2k

kE e= = e (9)

donde ek corresponde al error en el k-ésimo ejemplo o patrón y e representa un vector con elementos ek. Si en la red, la diferencia entre el vector de pesos anterior w(j) y el nuevo vector de pesos w(j+1) es pequeña, el vector de error puede expandirse por medio de una serie de Taylor (primer orden), de acuerdo a la expresión (10) [18]:

( ) ( ) ( ) ( )( )1 1k

i

ej j j j

w∂

+ = + + −∂

e e w w (10)

como consecuencia de ello, la función de error se consigue expresar a través de la ecuación (11):

( ) ( ) ( )( )2

1 12

k

i

eE j j j

w∂

= + + −∂

e w w . (11)

Al minimizar la función de error, con respecto al nuevo vector de pesos, se logra la expresión señalada en (12):

( ) ( ) ( ) ( )1T T1j j j−

+ = −w w Z Z Z e (12)

donde ( ) k iki e w= ∂ ∂Z .

La primera y la segunda derivada de la función de la suma de los cuadrados del error corresponden al vector gradiente G y a la matriz Hessiana H, respectivamente. G se obtiene a través de las primeras derivadas parciales del error, con respecto a cada uno de los pesos wi de la red, y H se consigue calculando cada elemento (i, j ) con las segundas derivadas

100 IEEE LATIN AMERICA TRANSACTIONS, VOL. 12, NO. 2, MARCH 2014

Page 4: HYHORSPHQWRIDQHXUDOFRQWUROOHUDSSOLHGLQD … · 2014-02-18 · wdqk vjq wdqk vjq ec ec ec fq f kq q fkq q =++ Š grqghn uhsuhvhqwd od uhodflyq gh hqjudqdmhv n n kaod frqvwdqwhghsdughoprwru

parciales del error con respecto a los pesos wi y wj. De esta forma, el vector gradiente puede expresarse

mediante la ecuación (13):

( )ii

Ew

∂=∂

G (13)

y la matriz Hessiana mediante la expresión (14):

( )22

k k kki j

i j i i i j

e e eE ew w w w w w

∂ ∂ ∂∂ = = + ∂ ∂ ∂ ∂ ∂ ∂ H (14)

si se desprecia el segundo término en (14), es posible aproximar la matriz Hessiana mediante H≅ZTZ.

En el algoritmo de Levenberg-Marquardt, la función de error se minimiza mientras que el tamaño de paso se mantiene pequeño con el fin de garantizar la validez de la aproximación lineal. Esto se logra a través del uso de una función de error de la forma modificada como en la ecuación (15):

( ) ( ) ( )( ) ( ) ( )2

21 1 - 1 -2

k

i

eE j j j j j

wλ∂

= + + + +∂

e w w w w (15)

donde λ es un parámetro que regula el tamaño de paso. Ahora, al minimizar la nueva función del error modificado con respecto a w(j+1), se consigue la expresión (16):

( ) ( ) ( ) ( )1T T1j j jλ−

+ = − +w w Z Z I Z e . (16)

Para valores de λ: muy grandes y muy pequeños, la ecuación (16) equivale al gradiente descendente estándar y al método de Newton, respectivamente.

El algoritmo de aprendizaje señalado en la fórmula (16) se utiliza en una ANN feedforward backpropagation con n entradas, m salidas y p neuronas en la capa oculta, como se aprecia en la Fig. 5. En dicho esquema, n representa 20 vectores x (distribuidos en: 5 posiciones, 5 velocidades, 5 aceleraciones y, 5 voltajes con retardos) y m constituye 5 vectores de voltajes, todos con una longitud de 2477, por último, p representa 9 neuronas en la capa oculta.

Figura 5. Esquema de una red neuronal feedforward backpropagation.

La salida yk de la red feedforward puede expresarse a través

de (17):

1 1( ) ( )

p n

k L jk NL ij i j kj i

y t f w f v x t bi bo= =

= ⋅ ⋅ + +

(17)

donde bi y bo representan los valores de los vías de entrada y de salida, respectivamente, fNL expresa una función de activación no lineal tansig con valores entre [-1,1] y fL corresponde a una función de activación lineal purelin en la capa de salida, con el objetivo de transformar la respuesta de las neuronas no lineales a valores apropiados generando las señales de alimentación para los servomotores.

Para el correcto aprendizaje de la red el número de neuronas de la capa oculta y la cantidad de datos de entrenamiento deben estar en una proporción adecuada, este requisito se consigue considerando que el número de datos de entrenamiento Nd debe ser al menos 10 veces el número de pesos Nw de la red, de acuerdo a ecuación (18):

( ) ( )1 1w e c c sN N N N N= + ⋅ + + ⋅ (18)

donde Ne, Nc y Ns representan el número de neuronas de: la capa de entrada, la capa intermedia (oculta) y la capa de salida, respectivamente, es decir, Nd > 2390.

Para obtener el modelo inverso del sistema se entrena la red neuronal a través de una estructura de aprendizaje generalizado [20], como se indica en la Fig. 6. El entrenamiento se realiza fuera de línea a partir de patrones de aprendizaje que se obtienen de las características de lazo cerrado de la planta [21]. El sistema robotizado se somete al seguimiento de 3 trayectorias de prueba, bajo la acción del controlador par calculado clásico, obteniendo el conjunto de datos ejemplos para la red.

Figura 6. Estructura de aprendizaje del modelo inverso.

Los datos obtenidos se dividen en 3 conjuntos correspondientes a: 70% (primeros datos para entrenamiento), 20% (datos intermedios para pruebas) y 10% (datos finales para validación). En la Fig. 7 y en la Fig. 8, se observan los gráficos de: error generado en la red neuronal en función de los datos para validación y error cuadrático medio en función de las épocas durante el aprendizaje.

KERN MOLINA et al.: DEVELOPMENT OF A NEURAL 101

Page 5: HYHORSPHQWRIDQHXUDOFRQWUROOHUDSSOLHGLQD … · 2014-02-18 · wdqk vjq wdqk vjq ec ec ec fq f kq q fkq q =++ Š grqghn uhsuhvhqwd od uhodflyq gh hqjudqdmhv n n kaod frqvwdqwhghsdughoprwru

Figura 7. Error generado en la red neuronal considerando el 10% de las muestras finales del conjunto de datos total.

Figura 8. Gráfico de validación de la red a partir del error cuadrático medio en función del número de épocas.

Utilizando los índices de comparación del error de la red: Error Cuadrático Medio (RMS), Error Residual Estándar (RSD) e Índice de Adecuación (AI) [19], el modelo inverso se valida contemplando siempre el 10% de las muestras finales del conjunto de datos total. Los índices de adecuación obtenidos, para cada una de las señales que se aplican a los 5 servomotores, son muy cercanos a 1, considerando como aceptable valores superiores a 0,9. Los índices RMS y RSD se representan en la Fig. 9, teniendo presente que para ambos casos se consideran relaciones aceptables aquellos cuyos valores son inferiores a 0,1.

Figura 9. Indicadores de validación correspondientes al error cuadrático medio y al error residual estándar.

Finalmente, la ANN diseñada, entrenada y validada se dispone en un esquema de control neuronal por modelo inverso, como se indica en la Fig. 10.

Figura 10. Esquema de control neuronal por modelo inverso.

VI. ENTORNO DE SIMULACIÓN Los esquemas de control mencionados, junto con el modelo

dinámico del manipulador redundante de de 5 GDL y de la dinámica de los actuadores, se ejecutan en una estructura de simulación, realizada utilizando herramientas de programación MatLab/Simulink, como la que se representa en la Fig. 11.

Figura 11. Diagrama de bloques del simulador empleado para ensayar el modelo del manipulador junto con las leyes de control mencionadas.

Los valores de los parámetros considerados en el manipulador se muestran en la Tabla I. La

Tabla II señala el conjunto de los valores de los parámetros utilizados para cada actuador. La Tabla III muestra el conjunto de los valores de las ganancias empleadas para cada tipo de controlador.

TABLA I. PARÁMETROS CONSIDERADOS EN EL MANIPULADOR.

Pará-metro Eslabón 1 Eslabón 2 Eslabón 3 Eslabón 4 Eslabón 5 Unidades

l 0,524 0,2 0,2 0,2 0,14 [m]

lc - 0,0229 0,0229 0,0229 - [m]

m 1,228 1,023 1,023 1,023 0,5114 [kg]

Izz - 0,0058 0,0058 0,0058 - [kg⋅m2]

Fv 0,03 0,025 0,025 0,025 0,02 [N⋅m⋅s/rad]

Feca 0,05 0,05 0,05 0,05 0,03 [N⋅m]

Fecb -0,05 -0,05 -0,05 -0,05 -0,03 [N⋅m]

102 IEEE LATIN AMERICA TRANSACTIONS, VOL. 12, NO. 2, MARCH 2014

Page 6: HYHORSPHQWRIDQHXUDOFRQWUROOHUDSSOLHGLQD … · 2014-02-18 · wdqk vjq wdqk vjq ec ec ec fq f kq q fkq q =++ Š grqghn uhsuhvhqwd od uhodflyq gh hqjudqdmhv n n kaod frqvwdqwhghsdughoprwru

TABLA II. PARÁMETROS CONSIDERADOS EN LOS SERVOMOTORES.

Parámetro Servo 1 Servos 2-3-4 Servo 5 Unidades

Ra 1,6 1,6 1,6 [Ω] La 0,0048 0,0048 0,0048 [H] Jm 0,007 0,007 0,007 [kg⋅m2] Bm 0,01413 0,01313 0,01208 [N⋅m⋅s/rad] ka 0,35 0,35 0,35 [N⋅m/A] kb 0,04 0,04 0,04 [V⋅s/rad]

Feca 0,05 0,05 0,03 [N⋅m] Fecb -0,05 -0,05 -0,03 [N⋅m] n 1/600 1/561,6 1/561,6 [Veces] A 15 15 15 [Veces] ks 10 10 10 [Veces] kp 1 1 1 [Veces] p 1 1 1 [Veces]

TABLA III

GANANCIAS CONSIDERADAS EN LOS CONTROLADORES.

Controlador Constantes

Par calculado Kp1, …, Kp5 Kv1, …, Kv5

400, 600, 700, 800, 100 120, 100, 60, 50, 40

Neuronal Kp1, …, Kp5 Kv1, …, Kv5

400, 600, 700, 800, 100 120, 100, 60, 50, 40

VII. RESULTADOS Luego de ejecutar el modelo del manipulador,

incorporando la dinámica de los actuadores, en el entorno de simulación y de entrenar la red neuronal estableciendo las leyes de control a utilizar, se selecciona una trayectoria de prueba en el espacio cartesiano para someter el manipulador al seguimiento de la misma y, consecuentemente, estudiar los resultados en función del desempeño del controlador par calculado clásico y del controlador neuronal; tal trayectoria se indica en la Fig. 12.

Figura 12. Trayectoria cartesiana de prueba.

La respuesta de seguimiento del modelo del robot en el espacio articular, a través del uso del controlador par calculado, se indica en las Figs. 13 y 14 señalando las curvas deseada y real en: el plano x-y y el plano y-z, correspondientemente, donde xyzd y xyz, xyd y xy, y yzd e yz indican las trayectorias cartesianas deseada y real, en el espacio, en el plano x-y, y en el plano y-z, respectivamente.

Figura 13. Comparación en el plano x-y de las trayectorias cartesianas deseada y real utilizando el controlador par calculado.

Figura 14. Comparación en el plano y-z de las trayectorias cartesianas deseada y real utilizando el controlador par calculado.

En la Fig. 15 se observan las gráficas de las trayectorias articulares deseadas y reales mediante el uso del controlador par calculado, donde qdn y qn representan las trayectorias articulares deseada y real (n indica las articulaciones 1 a 5).

Figura 15. Comparación de las trayectorias articulares deseada y real utilizando el controlador par calculado.

En las Figs. 16 y 17 se muestran las curvas de los errores obtenidos a partir de las trayectorias deseada y real: cartesiana

KERN MOLINA et al.: DEVELOPMENT OF A NEURAL 103

Page 7: HYHORSPHQWRIDQHXUDOFRQWUROOHUDSSOLHGLQD … · 2014-02-18 · wdqk vjq wdqk vjq ec ec ec fq f kq q fkq q =++ Š grqghn uhsuhvhqwd od uhodflyq gh hqjudqdmhv n n kaod frqvwdqwhghsdughoprwru

y articular, correspondientemente, utilizando el controlador par calculado, donde ex, ey, y ez expresan los errores de las trayectorias cartesianas en los ejes x, y y z, respectivamente, y en los errores de las trayectorias articulares (n representa las articulaciones 1 a 5).

Figura 16. Error de la trayectoria cartesiana utilizando el controlador par calculado.

Figura 17. Error de la trayectoria articular utilizando el controlador par calculado.

Las comparaciones entre la trayectoria cartesiana deseada y la trayectoria cartesiana real, de acuerdo al comportamiento del controlador neuronal, se indican en las Figs. 18 y 19, respectivamente. En ellas, se muestran las gráficas pertinentes en: el espacio, el plano x-y y el plano y-z, correspondientemente.

Figura 18. Comparación en el plano x-y de las trayectorias cartesianas deseada y real utilizando el controlador neuronal.

Figura 19. Comparación en el plano y-z de las trayectorias cartesianas deseada y real utilizando el controlador neuronal.

En la Fig. 20 se indican las gráficas relacionadas a las trayectorias articulares deseadas y reales mediante el uso del controlador neuronal.

Figura 20. Comparación de las trayectorias articulares deseada y real utilizando el controlador neuronal.

Los errores producidos entre las trayectorias: cartesiana deseada y real, y articular deseada y real, aplicando el controlador neuronal, se señalan a través de las Figs. 21 y 22, respectivamente.

Figura 21. Error de la trayectoria cartesiana utilizando el controlador neuronal.

104 IEEE LATIN AMERICA TRANSACTIONS, VOL. 12, NO. 2, MARCH 2014

Page 8: HYHORSPHQWRIDQHXUDOFRQWUROOHUDSSOLHGLQD … · 2014-02-18 · wdqk vjq wdqk vjq ec ec ec fq f kq q fkq q =++ Š grqghn uhsuhvhqwd od uhodflyq gh hqjudqdmhv n n kaod frqvwdqwhghsdughoprwru

Figura 22. Error de la trayectoria articular utilizando el controlador neuronal.

Finalmente, las Figs. 23 y 24 señalan los índices de errores articulares y cartesianos RMS, respectivamente, de acuerdo a la ecuación (19).

2

1

1RMSn

ii

en =

= (19)

donde ei representa tanto los errores articulares como los errores cartesianos de la trayectoria y n el número de datos.

Figura 23. Índice de desempeño correspondiente a la trayectoria articular.

Figura 24. Índice de desempeño correspondiente a la trayectoria cartesiana.

VIII. CONCLUSIONES En este trabajo se ha presentado un esquema de control

para un robot redundante de 5 GDL empleando una red neuronal feedforward con algoritmo de aprendizaje backpropagation Levenberg-Marquardt.

Un aspecto muy destacable es que este controlador no requiere el conocimiento preciso del modelo dinámico del sistema robotizado, como lo hace el controlador par calculado clásico, para ofrecer un desempeño adecuado.

A partir de los resultados obtenidos se observa que el controlador neuronal por modelo inverso presenta un seguimiento de la trayectoria de prueba cuyos errores máximos exhiben un valor menor comparado con el controlador par calculado, lo que se traduce en movimientos más homogéneos del manipulador. Por consiguiente, los mayores errores articulares y cartesianos, tanto valores máximos como valores RMS, se producen al utilizar el controlador par calculado.

Conforme al comportamiento conseguido a través de los ensayos de simulación, del controlador neuronal junto con el modelo del robot redundante y sus actuadores, se comienza una nueva etapa en el estudio, diseño y análisis de los controladores basados en redes neuronales aplicados en manipuladores robotizados redundantes consistente en la implementación práctica de: robots de tipo industrial reales; de sus actuadores y de sus controladores, mediante el desarrollo del hardware necesario, como se esquematiza en la Fig. 25.

Figura 25. Esquema del robot redundante de tipo manipulador industrial (unidades medidas en mm).

AGRADECIMIENTOS Este trabajo ha contado con el apoyo del Programa

Postdoctoral de la Universidad de Santiago de Chile; y del Fondo de Fomento al Desarrollo Científico y Tecnológico (FONDEF), a través del Proyecto FONDEF CA12I10167, Chile.

KERN MOLINA et al.: DEVELOPMENT OF A NEURAL 105

Page 9: HYHORSPHQWRIDQHXUDOFRQWUROOHUDSSOLHGLQD … · 2014-02-18 · wdqk vjq wdqk vjq ec ec ec fq f kq q fkq q =++ Š grqghn uhsuhvhqwd od uhodflyq gh hqjudqdmhv n n kaod frqvwdqwhghsdughoprwru

REFERENCIAS

[1] J. Rubí, «Cinemática, Dinámica y Control de Robots Redundantes yRobots Subactuados», Tesis doctoral, Navarra, San Sebastián, España,2002.

[2] A. Ollero, Robótica: Manipuladores y robots móviles, 1a ed. Barcelona, España: Marcombo, 2006.

[3] R. V. Patel y F. Shadpey, Control of Redundant Robot Manipulators: Theory and Experiments. Heidelberg, Germany: Springer, 2005.

[4] J. Kern y C. Urrea, «Modelamiento y simulación de un robotredundante de tipo manipulador SCARA», Lat. Am. J. Phys. Educ. Vol, vol. 5, no. 4, p. 824, 2011.

[5] J. J. Craig, Introduction to Robotics: Mechanics and Control, 3a ed. New Jersey: Prentice Hall, 2004.

[6] M. W. Spong, S. Hutchinson, y M. Vidyasagar, Robot Modeling andControl, 1a ed. New York: Wiley, 2005.

[7] J. Angeles, Fundamentals of Robotic Mechanical Systems: Theory,Methods, and Algorithms, 3a ed. New York: Springer, 2006.

[8] C. Urrea y J. Kern, «A New Model for Analog Servomotors. PracticalImplementations», Canadian Journal on Automation, Control andIntelligent Systems, vol. 2, no. 2, pp. 29-38, 2011.

[9] R. Iñigo y E. Vidal, Robots industriales manipuladores. México: Alfaomega, 2004.

[10] B. Siciliano y O. Khatib, Springer Handbook of Robotics, 1a ed. Berlin, Heidelberg: Springer, 2008.

[11] K. Hornik, M. Stinchcombe, y H. White, «Multilayer feedforwardnetworks are universal approximators», Neural Networks, vol. 2, no. 5, pp. 359-366, 1989.

[12] G. Pezzotti, J. Valencia, y N. Londono, «Deabbeat discrete controlthrogh of the identification with neural networks for presure system»,IEEE LATIN AMERICA TRANSACTIONS, vol. 10, no. 4, pp. 1967–1972, jun. 2012.

[13] M. Maglianesi y G. Stegmayer, «Methodology for the construction of abiometric facial recognition system based on a neural classifier», IEEE LATIN AMERICA TRANSACTIONS, vol. 10, no. 5, pp. 135-144, sep. 2012.

[14] F. G. Rossomando, C. Soria, y R. Carelli, «Adaptive Neural DynamicCompensator for Mobile Robots in Trajectory tracking control», IEEE LATIN AMERICA TRANSACTIONS, vol. 9, no. 5, pp. 593–602, sep. 2011.

[15] O. Peñaloza, J. Alvarez, y J. Alvarez, «Chaos Suppression Of AnUnderactuated Manipulator: Experimental Results», IEEE LATIN AMERICA TRANSACTIONS, vol. 2, no. 1, pp. 19-24, mar. 2004.

[16] M. T. Hagan, H. B. Demuth, y M. H. Beale, Neural network design. Boston: PWS Publishing Company, 1996.

[17] V. A. Rodriguez, J. E. Garzon, y J. A. Lopez, «Control Neuronal porModelo Inverso de un Servosistema Usando Algoritmos deAprendizaje Levenberg-Marquardt y Bayesiano», in VIII Congreso de la Asociación Colombiana de Automática, Universidad Tecnológica deBolívar, Cartagena, Colombia, 2009.

[18] C. Aldrich, Exploratory Analysis Of Metallurgical Process Data WithNeural Networks And Related Methods, 1a ed., vol. 12. New York, NY,U.S.A.: Elsevier Science Ltd, 2002.

[19] G. Acuña y J. González, «Desarrollo de Modelos de Caja Grisutilizando Máquinas de Vectores de Soporte», in XXIII EncuentroChileno de Computación (ECC), Universidad de Talca, Curicó, Chile,2011.

[20] D. Psaltis, A. Sideris, y A. A. Yamamura, «A multilayered neuralnetwork controller», IEEE Control Systems Magazine, vol. 8, no. 2, pp. 17 -21, abr. 1988.

[21] G. Artola y R. S. Apóstoli, «Controlador de robots basado en redesneuronales», in 9o Congreso Chileno de Ingeniería Mecánica, 2000.

John Kern was born in Santiago, Chile. He received the M.Sc. Eng. and the Dr. degrees from Universidad de Santiago de Chile, Santiago, Chile in 2010 and 2013, respectively. John Kern is currently Professor of electronic engineering in the areas of automatic control and robotics,

since 1999 and studies post doctorate in Fault-Tolerant Systems at the Universidad de Santiago de Chile. He has developed laboratories: theory and control systems, signals and communication system, and electronics.

Marcela Jamett was born in Santiago, Chile. She received the Dr.Sc. Eng. degree, majoring in Automation, from Universidad de Santiago de Chile, Santiago, Chile in 2004 and the title of Systems Engineer from Universidad de Los Andes, Mérida, Venezuela, in 1999. She is currently Professor at the Electrical Engineering Department,

Universidad de Santiago de Chile, from 2007. She has developed theoretical research projects DICYT.

Claudio Urrea was born in Santiago, Chile. He received the M.Sc. Eng. and the Dr. degrees from Universidad de Santiago de Chile, Santiago, Chile in 1999, and 2003, respectively; and the Ph.D. degree from Institut National

Polytechnique de Grenoble, France in 2003. Ph.D. Urrea is currently Professor at the Electrical Engineering Department, Universidad de Santiago de Chile, from 1998. He has developed and implemented a Robotics Laboratory, where intelligent robotic systems are development and investigated.

Hugo Torres was born in Cuenca, Ecuador. He received the title of Electronic Engineer from Universidad Politécnica Salesiana, and the Doctor of Research and Planning degree from Universidad Técnica Particular de Loja. Currently he studies doctorate in Engineering Sciences at the Universidad de Santiago de Chile. He

teaches at the University of Azuay since 1991. He has developed laboratories: industrial control, PLC and electronics.

106 IEEE LATIN AMERICA TRANSACTIONS, VOL. 12, NO. 2, MARCH 2014