adaptaciÓn del driver de latarjeta de red d-link dge...

12
ADAPTACIÓN DEL DRIVER DE LA TARJETA DE RED D-LINK DGE-530T PARA GAMMA D-Link DGE-530T Network Interface Card Driver Adaptation for GAMMA KIARA A. OTTOGALLI F., DANIEL H. ROSQUETE DE M., AMADÍS A. MARTÍNEZ M. y FREDDY J. PEROZO R. Departamento de Computación Facultad Experimental de Ciencias y Tecnología. Universidad de Carabobo Valencia, Estado Carabobo, Venezuela {kottogal, dhrosquete, aamartin, fperozo}@uc.edu.ve Fecha de Recepción: 08/07/2009, Fecha de Revisión: 16/06/2010, Fecha de Aceptación: 30/07/2010 Resumen Un cluster es un sistema de computo formado por varios computadores con hardware similar, que se comunican a través de una red de alta velocidad, que funciona como un único computador. Se puede construir un cluster de PCs, pero la velocidad de comunicación entre sus nodos es notablemente menor en comparación a la de un cluster especializado de alto costo, debido al uso de controladores (drivers) no especializados para tarjetas (Gigabit) en cluster que utilizan la pila de protocolos TCP/IP. En este artículo se describe la adaptación de un controlador para la NIC (Network Interface Card) D-Link DGE-530T compatible con GAMMA (Genoa Active Message MAchine) y los resultados que comprueban que dicho controlador mejora el rendimiento del cluster de bajo costo del Departamento de Computación de la FaCyT-UC, denominado Mangosta. Palabras clave: Cluster, Driver, GAMMA, Optimización de comunicaciones, Tarjetas de red. Abstract A cluster is a computer system formed by several computers with similar hardware, which maintains the communication among them through a high-speed network, working together as a single integrated resource. It is possible to built a cluster of PCs, but the communication speed among its nodes is considerably slower compared with the communication speed of a high-cost specialized one due to the use of non-specialized (Gigabit) network card drivers that uses the TCP/IP protocol stack for communication purposes. In this article are described the adaptation of a D-Link DGE-530T NIC (Network Interface Card) driver compatible with GAMMA (Genoa Active Message MAchine) and the tests that con?rm that the driver improves the performance of the low-cost cluster of the Department of Computer Science of the FaCyT-UC, known as Mangosta. Keywords: Cluster, Communication optimization, Driver, GAMMA, Network card. ISSN 1698 - 7418 Depósito Legal PP200402CA1617 FARAUTE Ciens. y Tec., 5(1): 47-58, 2010 47

Upload: others

Post on 13-Oct-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ADAPTACIÓN DEL DRIVER DE LATARJETA DE RED D-LINK DGE …servicio.bc.uc.edu.ve/facyt/vol5n1/art05.pdf · 1. Introducción nodo receptor, por cada capa del modelo TCP/IP, antes de

Oldfield R., D. Womble & D. Ober. (1998). Efficient parallel I/O in seismic imaging, Int. J. High Perform. Comput. Appl. 12(3): 333-344.

Phadke, S., D. Bhardwaj & S. Yerneni. (1998). Wave equation based migration and modellingalgorithms on parallel computers. Proceedings of SPG´98. Chennai. India. 55-59.

Reynolds A. (1978). Boundary conditions for the numerical solution of wave propagation problems. Geophysics. 43(6): 1099-1110.

Whitmore N. (1983). Iterative depth migration by backward time propagation. 53rd Ann. Internat. Mtg. Soc. Expl. Geophys. Expanded Abstract.Las Vegas. USA. 382-385.

Parallel Seismic Imaging in Oil Exploration

FARAUTE Ciens. y Tec., 5(1). 2010

ADAPTACIÓN DEL DRIVER DE LA TARJETA DE RED D-LINK DGE-530T PARA GAMMA

D-Link DGE-530T Network Interface Card Driver Adaptation for GAMMA

KIARA A. OTTOGALLI F., DANIEL H. ROSQUETE DE M., AMADÍS A. MARTÍNEZ M. y FREDDY J. PEROZO R.

Departamento de ComputaciónFacultad Experimental de Ciencias y Tecnología. Universidad de Carabobo

Valencia, Estado Carabobo, Venezuela{kottogal, dhrosquete, aamartin, fperozo}@uc.edu.ve

Fecha de Recepción: 08/07/2009, Fecha de Revisión: 16/06/2010, Fecha de Aceptación: 30/07/2010

Resumen

Un cluster es un sistema de computo formado por varios computadores con hardware similar, que se comunican a través de una red de alta velocidad, que funciona como un único computador. Se puede construir un cluster de PCs, pero la velocidad de comunicación entre sus nodos es notablemente menor en comparación a la de un cluster especializado de alto costo, debido al uso de controladores (drivers) no especializados para tarjetas (Gigabit) en cluster que utilizan la pila de protocolos TCP/IP. En este artículo se describe la adaptación de un controlador para la NIC (Network Interface Card) D-Link DGE-530T compatible con GAMMA (Genoa Active Message MAchine) y los resultados que comprueban que dicho controlador mejora el rendimiento del cluster de bajo costo del Departamento de Computación de la FaCyT-UC, denominado Mangosta.

Palabras clave: Cluster, Driver, GAMMA, Optimización de comunicaciones, Tarjetas de red.

Abstract

A cluster is a computer system formed by several computers with similar hardware, which maintains the communication among them through a high-speed network, working together as a single integrated resource. It is possible to built a cluster of PCs, but the communication speed among its nodes is considerably slower compared with the communication speed of a high-cost specialized one due to the use of non-specialized (Gigabit) network card drivers that uses the TCP/IP protocol stack for communication purposes. In this article are described the adaptation of a D-Link DGE-530T NIC (Network Interface Card) driver compatible with GAMMA (Genoa Active Message MAchine) and the tests that con?rm that the driver improves the performance of the low-cost cluster of the Department of Computer Science of the FaCyT-UC, known as Mangosta.

Keywords: Cluster, Communication optimization, Driver, GAMMA, Network card.

ISSN 1698 - 7418Depósito Legal PP200402CA1617FARAUTE Ciens. y Tec., 5(1): 47-58, 2010

46 47

Page 2: ADAPTACIÓN DEL DRIVER DE LATARJETA DE RED D-LINK DGE …servicio.bc.uc.edu.ve/facyt/vol5n1/art05.pdf · 1. Introducción nodo receptor, por cada capa del modelo TCP/IP, antes de

1. Introducción nodo receptor, por cada capa del modelo TCP/IP, antes de ser enviados a una capa superior. Este

Un cluster es un conjunto de máquinas proceso genera un tiempo de latencia importante interconectadas que trabajan de forma colectiva para tanto en el nodo emisor como en el nodo receptor procesar instrucciones y datos (Morrison, 2003), y su (Tanenbaum, 2003).representación es la de un sistema unificado, es decir, el número de máquinas que conforman un cluster es Estos datos de control son necesarios en redes transparente al usuario. de computadores que están a grandes distancias, pero

en el caso de un cluster dejan de ser necesarios y Uno de los requerimientos que se debe tomar pasan a ser factores de disminución en el rendimiento

en cuenta al construir un cluster es que todos los del mismo.nodos deben completar una tarea paralela de forma simultánea. Para ello, deben tener hardware y Una forma de optimizar la transmisión de software con características similares, de lo datos en un cluster, consiste en eliminar la pila de contrario, el nodo más lento podría generar un protocolos del modelo TCP/IP y utilizar protocolos retardo en el tiempo total de procesamiento. ligeros, los cuales sustituyen parte o la totalidad de la Específicamente, si se tienen nodos con tarjetas de pila de protocolos TCP/IP y tienen como objetivos: red que ofrecen tasas de transmisión menores que los (1) hacer más eficiente el proceso de comunicación demás, se produce una latencia injustificada. entre los nodos del cluster, (2) reducir la latencia de

comunicación y (3) permitir un mejor aprovechamiento En la actualidad existen compañías tales como del ancho de banda que ofrece la red.

IBM, HP, Sun Microsystems y Microsoft, que han lanzado al mercado clusters (IBM System Cluster Genoa Active Message Machine (GAMMA) (Chiola 1350, IBM System Cluster 1600, HP Cluster & Ciaccio, 1997) es una capa de comunicaciones, de Platform 4000BL, HP Cluster Platform 6000 y baja latencia y alta tasa de transmisión de datos, 6000BL) con hardware y software especializado implementada a nivel de kernel, diseñada para (Solaris Cluster, Microsoft Cluster Server) para el clusters de PCs, que utiliza protocolos ligeros para procesamiento de datos de manera rápida y eficiente. sustituir la pila de protocolos del modelo TCP/IP. Uno de los inconvenientes con este tipo de equipos Debido a las características de GAMMA, se decidió especializados es su alto costo, por esto se han creado incorporarlo al cluster de PCs de bajo costo del alternativas de bajo costo, como los clusters de PCs Departamento de Computación de la Facultad (Personal Computers), pero estos usan para Experimental de Ciencias y Tecnología (FaCyT) de comunicarse la pila de protocolos TCP/IP la Universidad de Carabobo (UC), denominado (Transmission Control Protocol/Internet Protocol). Mangosta. Sin embargo, este cluster cuenta con

tarjetas de red Gigabit D-Link DGE-530T, El modelo TCP/IP está formado por un anteriormente no soportadas por GAMMA.

conjunto de capas que se encargan de la transmisión confiable de datos de un emisor a un receptor por En este artículo se describe la adaptación de un medio de un canal. Cuando el nodo emisor desea driver (controlador) compatible con GAMMA para transmitir un conjunto de datos, cada capa del la tarjeta de red D-Link DGE-530T. Además, se modelo TCP/IP le agrega ciertos datos de control presentan diversas pruebas realizadas en el cluster antes de transmitirlos a una capa inferior. Mangosta, en las cuales se demuestra que la Análogamente, los datos de control agregados por el incorporación de GAMMA disminuyó la latencia en nodo emisor deben ser procesados y eliminados en el la comunicación, aumentó la velocidad de

FARAUTE Ciens. y Tec., 5(1). 2010

transmisión de datos y, en consecuencia, mejoró el usuario, sobre una plataforma de hardware off-desempeño general del cluster. the-shelf, con un sistema operativo estándar. U-

NET elimina al kernel del camino de Este artículo fue estructurado en seis comunicación para ofrecer más flexibilidad,

secciones, incluyendo la introducción. En la Sección proveer baja latencia en la comunicación y 2 se describen brevemente los antecedentes de este explotar por completo el ancho de banda de la red. trabajo. En la Sección 3 se introducen conceptos Proporciona a los procesos una vista virtual del fundamentales relacionados con cluster computing y dispositivo de red, de forma tal que se crea la drivers de red. En la Sección 4 se describe el ilusión de que cada proceso es propietario del desarrollo del driver en dos partes: (1) adaptación del mismo.driver de red a GAMMA y (2) desarrollo de la Application Programming Interface (API) de 2.3. Virtual Interface Architecture (VIA)GAMMA. En la Sección 5 se muestran los resultados experimentales obtenidos mediante las pruebas Virtual Interface Architecture (VIA) (Von realizadas sobre el cluster Mangosta. Finalmente, la Eicken et al., 1998) es un estándar para los Sección 6 contiene las conclusiones del artículo y paradigmas de comunicación, influenciado por trabajos futuros. U-NET, cuyo diseño se enfoca en brindar baja

latencia y uso eficiente del ancho de banda en un 2. Antecedentes cluster. Para lograr lo expuesto anteriormente,

VIA define un conjunto de funciones, estructuras 2.1. Active Messages de datos y semánticas asociadas al acceso directo

a la interfaz de red, evade el paso por el kernel y la Active Messages es un mecanismo simple y utiliza el Remote Direct Memory Access

asíncrono de comunicación que permite solapar la (RDMA).comunicación con el cómputo, aprovechando la flexibilidad y el desempeño de las interconexiones de 2.4. Genoa Active Message Machine (GAMMA)las redes modernas, logrando así un equilibrio costo/efectivo del uso del hardware y reduciendo la GAMMA es una capa de comunicaciones sobrecarga en la comunicación (Von Eicken et al., basada en Active Messages (Chiola & Ciaccio, 1992). Bajo este modelo, cada nodo lleva a cabo una 1997), de baja latencia y alta tasa de transmisión de tarea que es interrumpida por la llegada de un datos (Chiola & Ciaccio, 1998), implementada a mensaje. Por cada mensaje se especifica un nivel de kernel y diseñada para clusters de PCs, la manejador de mensajes que sirve para extraer el cual utiliza protocolos ligeros para sustituir la pila mensaje de la red e incorporarlo en el procesamiento de protocolos del modelo TCP/IP (Fig. 1 Chiola & que se está llevando a cabo. La eficiencia de este Ciaccio, 1996).modelo se debe a la eliminación de buffers intermedios, la programación simple del manejador GAMMA ha demostrado superioridad ante de mensajes no suspensivo y el solapamiento de la otras aproximaciones, entre ellas U-NET y VIA comunicación y el cómputo. (Chiola & Ciaccio, 1999), con lo cual se ha

demostrado que no es necesario eliminar al kernel 2.2. U-Net

U-Net (Von Eicken et al., 1995) es una arquitectura para la comunicación a nivel de

del camino de comunicación de datos para explotar eficientemente los dispositivos de comunicación.

Kiara A. Ottogalli F., Daniel H. Rosquete De M., Amadís A. Martínez M. y Freddy J. Perozo R.

FARAUTE Ciens. y Tec., 5(1). 201048 49

Adaptación del Driver de la Tarjeta de Red D-Link DGE-530t para Gamma

Page 3: ADAPTACIÓN DEL DRIVER DE LATARJETA DE RED D-LINK DGE …servicio.bc.uc.edu.ve/facyt/vol5n1/art05.pdf · 1. Introducción nodo receptor, por cada capa del modelo TCP/IP, antes de

1. Introducción nodo receptor, por cada capa del modelo TCP/IP, antes de ser enviados a una capa superior. Este

Un cluster es un conjunto de máquinas proceso genera un tiempo de latencia importante interconectadas que trabajan de forma colectiva para tanto en el nodo emisor como en el nodo receptor procesar instrucciones y datos (Morrison, 2003), y su (Tanenbaum, 2003).representación es la de un sistema unificado, es decir, el número de máquinas que conforman un cluster es Estos datos de control son necesarios en redes transparente al usuario. de computadores que están a grandes distancias, pero

en el caso de un cluster dejan de ser necesarios y Uno de los requerimientos que se debe tomar pasan a ser factores de disminución en el rendimiento

en cuenta al construir un cluster es que todos los del mismo.nodos deben completar una tarea paralela de forma simultánea. Para ello, deben tener hardware y Una forma de optimizar la transmisión de software con características similares, de lo datos en un cluster, consiste en eliminar la pila de contrario, el nodo más lento podría generar un protocolos del modelo TCP/IP y utilizar protocolos retardo en el tiempo total de procesamiento. ligeros, los cuales sustituyen parte o la totalidad de la Específicamente, si se tienen nodos con tarjetas de pila de protocolos TCP/IP y tienen como objetivos: red que ofrecen tasas de transmisión menores que los (1) hacer más eficiente el proceso de comunicación demás, se produce una latencia injustificada. entre los nodos del cluster, (2) reducir la latencia de

comunicación y (3) permitir un mejor aprovechamiento En la actualidad existen compañías tales como del ancho de banda que ofrece la red.

IBM, HP, Sun Microsystems y Microsoft, que han lanzado al mercado clusters (IBM System Cluster Genoa Active Message Machine (GAMMA) (Chiola 1350, IBM System Cluster 1600, HP Cluster & Ciaccio, 1997) es una capa de comunicaciones, de Platform 4000BL, HP Cluster Platform 6000 y baja latencia y alta tasa de transmisión de datos, 6000BL) con hardware y software especializado implementada a nivel de kernel, diseñada para (Solaris Cluster, Microsoft Cluster Server) para el clusters de PCs, que utiliza protocolos ligeros para procesamiento de datos de manera rápida y eficiente. sustituir la pila de protocolos del modelo TCP/IP. Uno de los inconvenientes con este tipo de equipos Debido a las características de GAMMA, se decidió especializados es su alto costo, por esto se han creado incorporarlo al cluster de PCs de bajo costo del alternativas de bajo costo, como los clusters de PCs Departamento de Computación de la Facultad (Personal Computers), pero estos usan para Experimental de Ciencias y Tecnología (FaCyT) de comunicarse la pila de protocolos TCP/IP la Universidad de Carabobo (UC), denominado (Transmission Control Protocol/Internet Protocol). Mangosta. Sin embargo, este cluster cuenta con

tarjetas de red Gigabit D-Link DGE-530T, El modelo TCP/IP está formado por un anteriormente no soportadas por GAMMA.

conjunto de capas que se encargan de la transmisión confiable de datos de un emisor a un receptor por En este artículo se describe la adaptación de un medio de un canal. Cuando el nodo emisor desea driver (controlador) compatible con GAMMA para transmitir un conjunto de datos, cada capa del la tarjeta de red D-Link DGE-530T. Además, se modelo TCP/IP le agrega ciertos datos de control presentan diversas pruebas realizadas en el cluster antes de transmitirlos a una capa inferior. Mangosta, en las cuales se demuestra que la Análogamente, los datos de control agregados por el incorporación de GAMMA disminuyó la latencia en nodo emisor deben ser procesados y eliminados en el la comunicación, aumentó la velocidad de

FARAUTE Ciens. y Tec., 5(1). 2010

transmisión de datos y, en consecuencia, mejoró el usuario, sobre una plataforma de hardware off-desempeño general del cluster. the-shelf, con un sistema operativo estándar. U-

NET elimina al kernel del camino de Este artículo fue estructurado en seis comunicación para ofrecer más flexibilidad,

secciones, incluyendo la introducción. En la Sección proveer baja latencia en la comunicación y 2 se describen brevemente los antecedentes de este explotar por completo el ancho de banda de la red. trabajo. En la Sección 3 se introducen conceptos Proporciona a los procesos una vista virtual del fundamentales relacionados con cluster computing y dispositivo de red, de forma tal que se crea la drivers de red. En la Sección 4 se describe el ilusión de que cada proceso es propietario del desarrollo del driver en dos partes: (1) adaptación del mismo.driver de red a GAMMA y (2) desarrollo de la Application Programming Interface (API) de 2.3. Virtual Interface Architecture (VIA)GAMMA. En la Sección 5 se muestran los resultados experimentales obtenidos mediante las pruebas Virtual Interface Architecture (VIA) (Von realizadas sobre el cluster Mangosta. Finalmente, la Eicken et al., 1998) es un estándar para los Sección 6 contiene las conclusiones del artículo y paradigmas de comunicación, influenciado por trabajos futuros. U-NET, cuyo diseño se enfoca en brindar baja

latencia y uso eficiente del ancho de banda en un 2. Antecedentes cluster. Para lograr lo expuesto anteriormente,

VIA define un conjunto de funciones, estructuras 2.1. Active Messages de datos y semánticas asociadas al acceso directo

a la interfaz de red, evade el paso por el kernel y la Active Messages es un mecanismo simple y utiliza el Remote Direct Memory Access

asíncrono de comunicación que permite solapar la (RDMA).comunicación con el cómputo, aprovechando la flexibilidad y el desempeño de las interconexiones de 2.4. Genoa Active Message Machine (GAMMA)las redes modernas, logrando así un equilibrio costo/efectivo del uso del hardware y reduciendo la GAMMA es una capa de comunicaciones sobrecarga en la comunicación (Von Eicken et al., basada en Active Messages (Chiola & Ciaccio, 1992). Bajo este modelo, cada nodo lleva a cabo una 1997), de baja latencia y alta tasa de transmisión de tarea que es interrumpida por la llegada de un datos (Chiola & Ciaccio, 1998), implementada a mensaje. Por cada mensaje se especifica un nivel de kernel y diseñada para clusters de PCs, la manejador de mensajes que sirve para extraer el cual utiliza protocolos ligeros para sustituir la pila mensaje de la red e incorporarlo en el procesamiento de protocolos del modelo TCP/IP (Fig. 1 Chiola & que se está llevando a cabo. La eficiencia de este Ciaccio, 1996).modelo se debe a la eliminación de buffers intermedios, la programación simple del manejador GAMMA ha demostrado superioridad ante de mensajes no suspensivo y el solapamiento de la otras aproximaciones, entre ellas U-NET y VIA comunicación y el cómputo. (Chiola & Ciaccio, 1999), con lo cual se ha

demostrado que no es necesario eliminar al kernel 2.2. U-Net

U-Net (Von Eicken et al., 1995) es una arquitectura para la comunicación a nivel de

del camino de comunicación de datos para explotar eficientemente los dispositivos de comunicación.

Kiara A. Ottogalli F., Daniel H. Rosquete De M., Amadís A. Martínez M. y Freddy J. Perozo R.

FARAUTE Ciens. y Tec., 5(1). 201048 49

Adaptación del Driver de la Tarjeta de Red D-Link DGE-530t para Gamma

Page 4: ADAPTACIÓN DEL DRIVER DE LATARJETA DE RED D-LINK DGE …servicio.bc.uc.edu.ve/facyt/vol5n1/art05.pdf · 1. Introducción nodo receptor, por cada capa del modelo TCP/IP, antes de

alto rendimiento cuyo componente principal es el cluster, el cual es un conjunto de máquinas interconectadas que trabajan de forma colectiva para procesar instrucciones y datos provenientes de un software que posee altos requerimientos. Una clasificación de clusters por su tipo de arquitectura es la siguiente (Morrison, 2003): (1) Cluster de PCs o Pila de PCs, (2) Cluster of Work-stations (COW) y Network of Workstations (NOW) y (3) Workstation Farm (Granja de Estaciones de Trabajo).

Las características más importantes de Este artículo se enfocará en el cluster de PCs GAMMA son: optimizaciones en el camino de tipo Beowulf, ya que el cluster Mangosta de la comunicación (por ejemplo el uso de cero copias), FaCyT pertenece a esta clasificación. Un cluster tipo llamadas ligeras al sistema, que guardan sólo un Beowulf es un sistema formado por un conjunto de subconjunto de los registros de máquina y no invocan PCs bajo la arquitectura cliente/servidor (Morrison, al planificador y el uso del camino de interrupción 2003), en el cual existen dos tipos de nodos: (1) los rápida (Fast Interrupt Path) que es un camino nodos cliente, que conforman una red local a la cual codificado y optimizado al manejador de no se puede acceder directamente y (2) un nodo interrupciones del driver de red. servidor, que es una estación de trabajo desde la cual

se maneja todo el cluster, y normalmente el único El primer prototipo de GAMMA fue criticado nodo con conexión a Internet.

por su falta de portabilidad, pero este problema fue resuelto al incorporar MPI (Message Passing 3.2. El Driver de RedInterface) a GAMMA (Chiola & Ciaccio, 1999).

La función de un driver de red consiste en 2.5. CLIC manejar una interfaz de red y hacer que sea posible el

intercambio de paquetes entre un host y la red. Un CLIC (Díaz et al., 2003) es un protocolo driver de red en Linux, normalmente se carga como

ligero, el cual reduce el tiempo de latencia y aumenta un módulo del kernel y hace petición de recursos el uso del ancho de banda. CLIC está incrustado en el (memoria e interrupciones) así como también ofrece kernel de Linux, reemplaza la pila de protocolos servicios. El núcleo de un driver de red es una

_TCP/IP, reduce el número de capas de protocolos, lo estructura de tipo net device que describe cada cual reduce la sobrecarga producida por los mismos, interfaz de red, ya que contiene todos sus datos y provee una interfaz entre el controlador de la tarjeta (nombre y MTU, entre otros) así como también de red y las aplicaciones de usuario. Sin embargo, no apuntadores a las funciones que actúan sobre la se ha reportado continuidad de este proyecto desde el misma.año 2003.

Todo módulo, incluyendo un driver de red, 3. Definiciones Previas debe tener al menos dos operaciones básicas: Una

operación para cargar el módulo y una operación 3.1. Cluster Computing para remover el módulo. La operación para cargar el driver de red, se encarga de: (1) verificar la

Es una rama especifica de la computación de existencia y el estado del dispositivo de red, (2)

Fig. 1. Modelo de GAMMA

Adaptación del Driver de la Tarjeta de Red D-Link DGE-530t para Gamma

FARAUTE Ciens. y Tec., 5(1). 2010

hacer petición de recursos, (3) inicializar el módulo 4. Implementación de la Solucióny (4) registrarlo en el kernel. La operación para remover el driver de red se encarga de descargar el Para incorporar GAMMA al cluster módulo del kernel para que ya no pueda ser Mangosta, se precisó el desarrollo de un driver utilizado. Estas operaciones deben ser compatible con dicha capa de comunicaciones. Se proporcionadas como parámetros a dos funciones tomó como base el driver skge del kernel de Linux en estándar para el manejo de los módulos del kernel su versión 2.6.18.1, el cual brinda soporte a las

_ _de Linux, module init y module exit. tarjetas de red Gigabit Ethernet de SysKonnect y las tarjetas de red con familia de chips Marvell Yukon 1, conjunto al cual pertenece la tarjeta de red Gigabit Además de las operaciones básicas, un Ethernet D-Link DGE- 530T, presente en cada nodo driver de red debe ofrecer servicios para que la del cluster (Ottogalli, 2007). Para desarrollar un tarjeta de red pueda ser utilizada. Algunos de los driver compatible con GAMMA fue necesario servicios que ofrece, de acuerdo con su nombre est´

_ completar dos fases: adaptación del driver de red a andar dentro de la estructura net device del GAMMA (Subsección 4.1) y desarrollo del API de kernel de Linux, son los siguientes (Corbet et al., GAMMA (Subsección 4.2).2005):

4.1. Adaptación del Driver de Red a GAMMAopen: Se encarga de registrar todos los recursos que necesite el dispositivo de red (puertos I/O, IRQ,

Para lograr adaptar el driver skge a GAMMA, se DMA, entre otros) y habilitar la tarjeta de red.modificaron las operaciones principales para cargar y remover el módulo además de las primitivas de stop: Detiene la interfaz de red y revierte las

_servicio open, stop, hard start_xmit, poll operaciones hechas durante open. y ethtool_ops descritas en la Subsección 3.2.

hard start xmit: Inicia la transmisión de un paquete.El driver skge utiliza unas estructuras de datos

poll: Se encarga de mantener la interfaz en modo de llamadas rings para la transmisión y la recepción de polling para la recepción, con las interrupciones datos (Fig. 2). Un ring es una lista circular deshabilitadas. simplemente enlazada, donde cada elemento que la

constituye contiene un buffer en el cual se copia un ethtool ops: Es una operación de soporte para paquete que va a ser procesado. Cada ring se maneja

ethtool, que es una utilidad para controlar el funcionamiento de una interfaz de red. Este apuntador debe ser colocado a través del macro

_ _SET ETHTOOL OPS.

Finalmente, se puede nombrar una función _que no forma parte de la estructura net device,

pero que es necesaria para el funcionamiento de un driver de red: la función encargada de las interrupciones, cuyo identificador no es estándar; por lo tanto, se proporciona como parámetro cuando se realiza el registro de interrupciones durante la función open.

Kiara A. Ottogalli F., Daniel H. Rosquete De M., Amadís A. Martínez M. y Freddy J. Perozo R.

Fig. 2. Ring del driver skge

FARAUTE Ciens. y Tec., 5(1). 201050 51

Page 5: ADAPTACIÓN DEL DRIVER DE LATARJETA DE RED D-LINK DGE …servicio.bc.uc.edu.ve/facyt/vol5n1/art05.pdf · 1. Introducción nodo receptor, por cada capa del modelo TCP/IP, antes de

alto rendimiento cuyo componente principal es el cluster, el cual es un conjunto de máquinas interconectadas que trabajan de forma colectiva para procesar instrucciones y datos provenientes de un software que posee altos requerimientos. Una clasificación de clusters por su tipo de arquitectura es la siguiente (Morrison, 2003): (1) Cluster de PCs o Pila de PCs, (2) Cluster of Work-stations (COW) y Network of Workstations (NOW) y (3) Workstation Farm (Granja de Estaciones de Trabajo).

Las características más importantes de Este artículo se enfocará en el cluster de PCs GAMMA son: optimizaciones en el camino de tipo Beowulf, ya que el cluster Mangosta de la comunicación (por ejemplo el uso de cero copias), FaCyT pertenece a esta clasificación. Un cluster tipo llamadas ligeras al sistema, que guardan sólo un Beowulf es un sistema formado por un conjunto de subconjunto de los registros de máquina y no invocan PCs bajo la arquitectura cliente/servidor (Morrison, al planificador y el uso del camino de interrupción 2003), en el cual existen dos tipos de nodos: (1) los rápida (Fast Interrupt Path) que es un camino nodos cliente, que conforman una red local a la cual codificado y optimizado al manejador de no se puede acceder directamente y (2) un nodo interrupciones del driver de red. servidor, que es una estación de trabajo desde la cual

se maneja todo el cluster, y normalmente el único El primer prototipo de GAMMA fue criticado nodo con conexión a Internet.

por su falta de portabilidad, pero este problema fue resuelto al incorporar MPI (Message Passing 3.2. El Driver de RedInterface) a GAMMA (Chiola & Ciaccio, 1999).

La función de un driver de red consiste en 2.5. CLIC manejar una interfaz de red y hacer que sea posible el

intercambio de paquetes entre un host y la red. Un CLIC (Díaz et al., 2003) es un protocolo driver de red en Linux, normalmente se carga como

ligero, el cual reduce el tiempo de latencia y aumenta un módulo del kernel y hace petición de recursos el uso del ancho de banda. CLIC está incrustado en el (memoria e interrupciones) así como también ofrece kernel de Linux, reemplaza la pila de protocolos servicios. El núcleo de un driver de red es una

_TCP/IP, reduce el número de capas de protocolos, lo estructura de tipo net device que describe cada cual reduce la sobrecarga producida por los mismos, interfaz de red, ya que contiene todos sus datos y provee una interfaz entre el controlador de la tarjeta (nombre y MTU, entre otros) así como también de red y las aplicaciones de usuario. Sin embargo, no apuntadores a las funciones que actúan sobre la se ha reportado continuidad de este proyecto desde el misma.año 2003.

Todo módulo, incluyendo un driver de red, 3. Definiciones Previas debe tener al menos dos operaciones básicas: Una

operación para cargar el módulo y una operación 3.1. Cluster Computing para remover el módulo. La operación para cargar el driver de red, se encarga de: (1) verificar la

Es una rama especifica de la computación de existencia y el estado del dispositivo de red, (2)

Fig. 1. Modelo de GAMMA

Adaptación del Driver de la Tarjeta de Red D-Link DGE-530t para Gamma

FARAUTE Ciens. y Tec., 5(1). 2010

hacer petición de recursos, (3) inicializar el módulo 4. Implementación de la Solucióny (4) registrarlo en el kernel. La operación para remover el driver de red se encarga de descargar el Para incorporar GAMMA al cluster módulo del kernel para que ya no pueda ser Mangosta, se precisó el desarrollo de un driver utilizado. Estas operaciones deben ser compatible con dicha capa de comunicaciones. Se proporcionadas como parámetros a dos funciones tomó como base el driver skge del kernel de Linux en estándar para el manejo de los módulos del kernel su versión 2.6.18.1, el cual brinda soporte a las

_ _de Linux, module init y module exit. tarjetas de red Gigabit Ethernet de SysKonnect y las tarjetas de red con familia de chips Marvell Yukon 1, conjunto al cual pertenece la tarjeta de red Gigabit Además de las operaciones básicas, un Ethernet D-Link DGE- 530T, presente en cada nodo driver de red debe ofrecer servicios para que la del cluster (Ottogalli, 2007). Para desarrollar un tarjeta de red pueda ser utilizada. Algunos de los driver compatible con GAMMA fue necesario servicios que ofrece, de acuerdo con su nombre est´

_ completar dos fases: adaptación del driver de red a andar dentro de la estructura net device del GAMMA (Subsección 4.1) y desarrollo del API de kernel de Linux, son los siguientes (Corbet et al., GAMMA (Subsección 4.2).2005):

4.1. Adaptación del Driver de Red a GAMMAopen: Se encarga de registrar todos los recursos que necesite el dispositivo de red (puertos I/O, IRQ,

Para lograr adaptar el driver skge a GAMMA, se DMA, entre otros) y habilitar la tarjeta de red.modificaron las operaciones principales para cargar y remover el módulo además de las primitivas de stop: Detiene la interfaz de red y revierte las

_servicio open, stop, hard start_xmit, poll operaciones hechas durante open. y ethtool_ops descritas en la Subsección 3.2.

hard start xmit: Inicia la transmisión de un paquete.El driver skge utiliza unas estructuras de datos

poll: Se encarga de mantener la interfaz en modo de llamadas rings para la transmisión y la recepción de polling para la recepción, con las interrupciones datos (Fig. 2). Un ring es una lista circular deshabilitadas. simplemente enlazada, donde cada elemento que la

constituye contiene un buffer en el cual se copia un ethtool ops: Es una operación de soporte para paquete que va a ser procesado. Cada ring se maneja

ethtool, que es una utilidad para controlar el funcionamiento de una interfaz de red. Este apuntador debe ser colocado a través del macro

_ _SET ETHTOOL OPS.

Finalmente, se puede nombrar una función _que no forma parte de la estructura net device,

pero que es necesaria para el funcionamiento de un driver de red: la función encargada de las interrupciones, cuyo identificador no es estándar; por lo tanto, se proporciona como parámetro cuando se realiza el registro de interrupciones durante la función open.

Kiara A. Ottogalli F., Daniel H. Rosquete De M., Amadís A. Martínez M. y Freddy J. Perozo R.

Fig. 2. Ring del driver skge

FARAUTE Ciens. y Tec., 5(1). 201050 51

Page 6: ADAPTACIÓN DEL DRIVER DE LATARJETA DE RED D-LINK DGE …servicio.bc.uc.edu.ve/facyt/vol5n1/art05.pdf · 1. Introducción nodo receptor, por cada capa del modelo TCP/IP, antes de

a través de tres apuntadores: start, que

representa la primera posición del ring, _to clean, que representa la primera posición

_llena del ring, y to use, que representa la

primera posición vacía del ring, es decir, donde se guardará un nuevo paquete.

Con el driver skge original, una aplicación que necesita transmitir datos genera una llamada al kernel del sistema operativo, luego, éste se encarga de procesar dichos datos mediante la pila de protocolos TCP/IP y hace una llamada a la función de transmisión del driver de red, la cual se encarga de encolar los paquetes en el ring de transmisión y enviar una señal a la tarjeta de red para que transmita esos paquetes. Por último la tarjeta de red, al finalizar la transmisión de los datos, genera una interrupción para limpiar el ring de transmisión. El proceso de transmisión del driver skge modificado elimina tanto al kernel como al driver del camino de datos, logrando que

entregue los paquetes a una aplicación. Con el driver skge modificado, al igual que con el original, la tarjeta de red genera una interrupción de recepción al recibir un paquete, la cual es atendida por el kernel del sistema operativo, el cual se encarga de invocara la función encargada del manejo de interrupciones. La diferencia está en que el driver modificado redirige la fase de recepción a GAMMA, que procesa los paquetes y los copia directamente en el espacio de memoria de la aplicación.

4.2. Desarrollo de la API (Application Programming Interface) de GAMMA

La API de GAMMA está constituida por un conjunto de operaciones que se encargan de actuar como una interfaz entre el driver de red modificado para GAMMA y el protocolo de comunicación de GAMMA. Esta API contiene macros para la transmisión y recepción de paquetes con GAMMA.una aplicación que necesite transmitir datos pueda

realizar una llamada ligera (lightweight call), la Los macros de transmisión se hacen cargo de cual es atendida por GAMMA, que se encarga de

cuatro operaciones fundamentales: (1) colocar el procesar los datos, encolarlos en el ring de paquete en el ring de transmisión, (2) actualizar el transmisión y vaciarlo si es necesario y luego enviar

_apuntador to use del ring de transmisión a la una señal a la tarjeta de red para que transmita. siguiente posición vacía, (3) enviar una señal a la Como se puede observar en el proceso de tarjeta de red para que transmita dicho paquete y (4) transmisión de datos con GAMMA se elimina el limpiar el ring una vez terminada la transmisión.cambio de con texto (modo usuario a modo núcleo)

al igual que las interrupciones de transmisión.Los macros de recepción se encargan de

separar los paquetes IP de los paquetes GAMMA y El proceso de recepción del driver skge redirigir estos últimos para ser manejados en el original también sufrió cambios, ya que ahora el núcleo de GAMMA. Para verificar el tipo de driver debía ser capaz de manejar el tráfico de paquete recibido, se desarrolló una macro que paquetes GAMMA. Con el driver skge original verifica el header del mismo. Si es un paquete IP, es cuando se recibe un paquete, la tarjeta de red genera procesado por una macro que realiza la recepción una interrupción de recepción, la cual es atendida de la misma forma en que lo hace el driver original. por el kernel del sistema operativo. El kernel se Si es un paquete GAMMA, es procesado en el encarga de invocar a la función encargada del núcleo de GAMMA, el cual luego utiliza una manejo de interrupciones propia del driver de red, macro que se encarga de vaciar el ring de recepción, la cual encola los paquetes recibidos en el ring de para que sus posiciones puedan reutilizarse.recepción y envía una señal al kernel para que éste

FARAUTE Ciens. y Tec., 5(1). 2010

5. Resultados Experimentales GAMMA y (2) Pruebas comparativas entre MPI/GAMMA (MPI sobre GAMMA),

5.1. Con?guración de los Experimentos MPI/TCP/IP (MPI sobre TCP/IP) y TCP/IP. Para todas las pruebas se utilizó el tamaño estándar del

Todas las pruebas fueron realizadas sobre el paquete de red para redes Ethernet, es decir, una cluster Mangosta, bajo el mismo sistema operativo MTU (Maximum Transfer Unit) de 1500 Bytes.y con el mismo kernel de Linux, para tener un criterio de comparación equitativo. Mangosta fue 5.2.1. Pruebas de Funcionalidad con GAMMAinstalado como un cluster dedicado de alto rendimiento tipo Beowulf, el cual provee una Para realizar las pruebas de funcionalidad se arquitectura escalable de múltiples computadoras, utilizó una aplicación que se usa por defecto para que puede ser usada para realizar cómputo paralelo medir la latencia de una red, Ping Pong. En un y distribuido (Perozo, 2006). Las características de principio se tomaron sólo dos nodos del cluster los nodos del cluster Mangosta, se presentan a Mangosta, no conectados al switch, con los cuales continuación: se obtuvo una latencia de 9,4µs. Posteriormente en

dos nodos del cluster Mangosta conectados al Hardware: procesador Intel Pentium 4 de 3.0 switch, se determinó que la latencia utilizando

GHz, 1 GigaByte (GB) de memoria RAM, disco TCP/IP fue de 58 , mientras que la latencia duro de 40GB@7200 RPM, una NIC Gigabit obtenida con GAMMA fue de 11,97 s.Ethernet D-Link DGE-530T dedicada a la comunicación entre procesos con MPI, una NIC Con los datos obtenidos en dos nodos Fast Ethernet para administración y servicios conectados al switch, se puede concluir que la para los nodos y una NIC Fast Ethernet disminución de la latencia de la red obtenida con dedicada para la conexión a Internet (sólo el GAMMA, fue de un 79,35% con respecto a la frontend). Todos los nodos están conectados a latencia obtenida con TCP/IP.un switch Linksys Gigabit Ethernet capa 2 de 24 puertos. 5.2 .2 . Pruebas Comparat ivas entre

MPI/GAMMA, MPI/TCP/IP y TCP/IPSoftware: sistema operativo Linux CentOS5 con

Kernel 2.6.18.1 (uno original y uno optimizado Para realizar las pruebas de rendimiento se para GAMMA), Message Passing Interface utilizaron, además de Ping Pong, dos herramientas MPICH versión 1.2.7p1, versión portable de la ampliamente conocidas: NetPIPE y HPL (High librería de paso de mensajes MPI, GAMMA y Performance Linpack) (Petitet & Dongarra, 2004; MPI/GAMMA. Snell et al., 1996).

5.2. Pruebas Al realizar las mediciones mediante Ping Pong, se obtuvo una latencia de 35,5 con

Se realizaron diversos tipos de pruebas tanto MPI/TCP/IP, mientras que con MPI/GAMMA se para probar el funcionamiento del driver skge obtuvo una latencia de 14,6 , es importante notar modificado para GAMMA, como para comparar el que al contrario de lo que se espera, la latencia desempeño del cluster Mangosta antes y después obtenida mediante Ping Pong con TCP/IP es mayor de la incorporación de GAMMA. Las pruebas a la obtenida con MPI, debido a que este último, realizadas se pueden dividir en dos categorías pese a que hace uso de TCP/IP, maneja estructuras respectivamente: (1) Pruebas de funcionalidad con de memoria (caché y buffers) las cuales utiliza para

µsµ

µs

µs

Kiara A. Ottogalli F., Daniel H. Rosquete De M., Amadís A. Martínez M. y Freddy J. Perozo R.

FARAUTE Ciens. y Tec., 5(1). 201052 53

Adaptación del Driver de la Tarjeta de Red D-Link DGE-530t para Gamma

Page 7: ADAPTACIÓN DEL DRIVER DE LATARJETA DE RED D-LINK DGE …servicio.bc.uc.edu.ve/facyt/vol5n1/art05.pdf · 1. Introducción nodo receptor, por cada capa del modelo TCP/IP, antes de

a través de tres apuntadores: start, que

representa la primera posición del ring, _to clean, que representa la primera posición

_llena del ring, y to use, que representa la

primera posición vacía del ring, es decir, donde se guardará un nuevo paquete.

Con el driver skge original, una aplicación que necesita transmitir datos genera una llamada al kernel del sistema operativo, luego, éste se encarga de procesar dichos datos mediante la pila de protocolos TCP/IP y hace una llamada a la función de transmisión del driver de red, la cual se encarga de encolar los paquetes en el ring de transmisión y enviar una señal a la tarjeta de red para que transmita esos paquetes. Por último la tarjeta de red, al finalizar la transmisión de los datos, genera una interrupción para limpiar el ring de transmisión. El proceso de transmisión del driver skge modificado elimina tanto al kernel como al driver del camino de datos, logrando que

entregue los paquetes a una aplicación. Con el driver skge modificado, al igual que con el original, la tarjeta de red genera una interrupción de recepción al recibir un paquete, la cual es atendida por el kernel del sistema operativo, el cual se encarga de invocara la función encargada del manejo de interrupciones. La diferencia está en que el driver modificado redirige la fase de recepción a GAMMA, que procesa los paquetes y los copia directamente en el espacio de memoria de la aplicación.

4.2. Desarrollo de la API (Application Programming Interface) de GAMMA

La API de GAMMA está constituida por un conjunto de operaciones que se encargan de actuar como una interfaz entre el driver de red modificado para GAMMA y el protocolo de comunicación de GAMMA. Esta API contiene macros para la transmisión y recepción de paquetes con GAMMA.una aplicación que necesite transmitir datos pueda

realizar una llamada ligera (lightweight call), la Los macros de transmisión se hacen cargo de cual es atendida por GAMMA, que se encarga de

cuatro operaciones fundamentales: (1) colocar el procesar los datos, encolarlos en el ring de paquete en el ring de transmisión, (2) actualizar el transmisión y vaciarlo si es necesario y luego enviar

_apuntador to use del ring de transmisión a la una señal a la tarjeta de red para que transmita. siguiente posición vacía, (3) enviar una señal a la Como se puede observar en el proceso de tarjeta de red para que transmita dicho paquete y (4) transmisión de datos con GAMMA se elimina el limpiar el ring una vez terminada la transmisión.cambio de con texto (modo usuario a modo núcleo)

al igual que las interrupciones de transmisión.Los macros de recepción se encargan de

separar los paquetes IP de los paquetes GAMMA y El proceso de recepción del driver skge redirigir estos últimos para ser manejados en el original también sufrió cambios, ya que ahora el núcleo de GAMMA. Para verificar el tipo de driver debía ser capaz de manejar el tráfico de paquete recibido, se desarrolló una macro que paquetes GAMMA. Con el driver skge original verifica el header del mismo. Si es un paquete IP, es cuando se recibe un paquete, la tarjeta de red genera procesado por una macro que realiza la recepción una interrupción de recepción, la cual es atendida de la misma forma en que lo hace el driver original. por el kernel del sistema operativo. El kernel se Si es un paquete GAMMA, es procesado en el encarga de invocar a la función encargada del núcleo de GAMMA, el cual luego utiliza una manejo de interrupciones propia del driver de red, macro que se encarga de vaciar el ring de recepción, la cual encola los paquetes recibidos en el ring de para que sus posiciones puedan reutilizarse.recepción y envía una señal al kernel para que éste

FARAUTE Ciens. y Tec., 5(1). 2010

5. Resultados Experimentales GAMMA y (2) Pruebas comparativas entre MPI/GAMMA (MPI sobre GAMMA),

5.1. Con?guración de los Experimentos MPI/TCP/IP (MPI sobre TCP/IP) y TCP/IP. Para todas las pruebas se utilizó el tamaño estándar del

Todas las pruebas fueron realizadas sobre el paquete de red para redes Ethernet, es decir, una cluster Mangosta, bajo el mismo sistema operativo MTU (Maximum Transfer Unit) de 1500 Bytes.y con el mismo kernel de Linux, para tener un criterio de comparación equitativo. Mangosta fue 5.2.1. Pruebas de Funcionalidad con GAMMAinstalado como un cluster dedicado de alto rendimiento tipo Beowulf, el cual provee una Para realizar las pruebas de funcionalidad se arquitectura escalable de múltiples computadoras, utilizó una aplicación que se usa por defecto para que puede ser usada para realizar cómputo paralelo medir la latencia de una red, Ping Pong. En un y distribuido (Perozo, 2006). Las características de principio se tomaron sólo dos nodos del cluster los nodos del cluster Mangosta, se presentan a Mangosta, no conectados al switch, con los cuales continuación: se obtuvo una latencia de 9,4µs. Posteriormente en

dos nodos del cluster Mangosta conectados al Hardware: procesador Intel Pentium 4 de 3.0 switch, se determinó que la latencia utilizando

GHz, 1 GigaByte (GB) de memoria RAM, disco TCP/IP fue de 58 , mientras que la latencia duro de 40GB@7200 RPM, una NIC Gigabit obtenida con GAMMA fue de 11,97 s.Ethernet D-Link DGE-530T dedicada a la comunicación entre procesos con MPI, una NIC Con los datos obtenidos en dos nodos Fast Ethernet para administración y servicios conectados al switch, se puede concluir que la para los nodos y una NIC Fast Ethernet disminución de la latencia de la red obtenida con dedicada para la conexión a Internet (sólo el GAMMA, fue de un 79,35% con respecto a la frontend). Todos los nodos están conectados a latencia obtenida con TCP/IP.un switch Linksys Gigabit Ethernet capa 2 de 24 puertos. 5.2 .2 . Pruebas Comparat ivas entre

MPI/GAMMA, MPI/TCP/IP y TCP/IPSoftware: sistema operativo Linux CentOS5 con

Kernel 2.6.18.1 (uno original y uno optimizado Para realizar las pruebas de rendimiento se para GAMMA), Message Passing Interface utilizaron, además de Ping Pong, dos herramientas MPICH versión 1.2.7p1, versión portable de la ampliamente conocidas: NetPIPE y HPL (High librería de paso de mensajes MPI, GAMMA y Performance Linpack) (Petitet & Dongarra, 2004; MPI/GAMMA. Snell et al., 1996).

5.2. Pruebas Al realizar las mediciones mediante Ping Pong, se obtuvo una latencia de 35,5 con

Se realizaron diversos tipos de pruebas tanto MPI/TCP/IP, mientras que con MPI/GAMMA se para probar el funcionamiento del driver skge obtuvo una latencia de 14,6 , es importante notar modificado para GAMMA, como para comparar el que al contrario de lo que se espera, la latencia desempeño del cluster Mangosta antes y después obtenida mediante Ping Pong con TCP/IP es mayor de la incorporación de GAMMA. Las pruebas a la obtenida con MPI, debido a que este último, realizadas se pueden dividir en dos categorías pese a que hace uso de TCP/IP, maneja estructuras respectivamente: (1) Pruebas de funcionalidad con de memoria (caché y buffers) las cuales utiliza para

µsµ

µs

µs

Kiara A. Ottogalli F., Daniel H. Rosquete De M., Amadís A. Martínez M. y Freddy J. Perozo R.

FARAUTE Ciens. y Tec., 5(1). 201052 53

Adaptación del Driver de la Tarjeta de Red D-Link DGE-530t para Gamma

Page 8: ADAPTACIÓN DEL DRIVER DE LATARJETA DE RED D-LINK DGE …servicio.bc.uc.edu.ve/facyt/vol5n1/art05.pdf · 1. Introducción nodo receptor, por cada capa del modelo TCP/IP, antes de

mejorar las comunicaciones. Por esta razón los resultados con MPI son mejores que los obtenidos con el uso de TCP/IP en este caso. Los resultados obtenidos con Ping Pong demuestran que el uso de MPI/GAMMA disminuye la latenciade la red en un 58,87% con respecto a la latencia de la red obtenida con MPI/TCP/IP.

Con respecto a la velocidad de transmisión, se hicieron cuatro pruebas con Ping Pong en dos nodos del cluster Mangosta: (1) Ping Pong asíncrono con MPI/TCP/IP, (2) Ping Pong asíncrono con MPI/GAMMA, (3) Ping Pong asíncrono bidireccional con MPI/TCP/IP y finalmente (4) Ping Pong asíncrono bidireccional con MPI/GAMMA (al NetPIPE es una herramienta de medición de ejecutar Ping Pong asíncrono bidireccional el emisor rendimiento independiente del protocolo de envía mensajes de cierto tamaño en Bytes al receptor comunicaciones, que calcula la velocidad de y al mismo tiempo el receptor envía mensajes del transmisión de un nodo emisor a un nodo receptor mismo tamaño en Bytes al emisor, por esta razón, en de mensajes de diferentes tamaños, así como la los resultados obtenidos con Ping Pong asíncrono latencia total de la comunicación, como la mayoría bidireccional se ve reducida la velocidad de de los mensajes enviados por NetPIPE tienen transmisión aproximadamente a la mitad en tamaños mayores a la MTU, estos deben ser comparación con los resultados obtenidos con Ping divididos en paquetes más pequeños. La latencia Pong asíncrono). total es la suma de todos los tiempos de latencia

producidos durante el procesamiento de todos los Con Ping Pong asíncrono con MPI/TCP/IP paquetes que forman un mensaje.

se obtuvo una velocidad máxima de transmisión de 498,37 Mbps mientras que, con MPI/GAMMA El tiempo de latencia medido a través de se obtuvo una velocidad máxima de transmisión NetPIPE para mensajes de un Byte fue de 33,3µs de 729,08 Mbps. Asimismo, con Ping Pong para MPI/TCP/IP, 23,81 para TCP/IP y 12,9 asíncrono bidireccional con MPI/TCP/IP se para MPI/GAMMA. La latencia obtenida mediante obtuvo una velocidad máxima de transmisión de el uso de MPI/GAMMA para paquetes de 1 Byte 272,64 Mbps mientras que, con MPI/GAMMA se constituye un 54,17% de la obtenida con TCP/IP y obtuvo una velocidad máxima de transmisión de un 38,73% de la latencia obtenida con MPI (Fig. 4). 367,98 Mbps (Fig. 3). Al ver el aumento de la latencia total obtenida

durante la ejecución de NetPIPE para mensajes Los resultados obtenidos indican que la grandes (hasta 131,069 Bytes), se puede notar que

velocidad de transmisión máxima obtenida la línea que representa la latencia total obtenida con mediante Ping Pong asíncrono con MPI/GAMMA MPI/GAMMA se mantiene por debajo de la es un 46,29% mayor que la velocidad obtenida latencia obtenida con TCP/IP, que a su vez tiene con MPI/TCP/IP y la velocidad de transmisión valores menores a los de MPI/TCP/IP (Fig. 5).máxima obtenida a través de Ping Pong asíncrono bidireccional con MPI/GAMMA es un 34,96% mayor a la obtenida con MPI/TCP/IP.

µs µs

Las velocidades de transmisión de datos máximas alcanzadas con NetPIPE fueron, 473,21

Fig. 3. Velocidad de transmisión obtenida con Ping Pong.

FARAUTE Ciens. y Tec., 5(1). 2010

Fig. 4. Tiempo de latencia total de NetPIPE para paquetes pequeños

Fig. 5. Tiempo de latencia total de NetPIPE.

utiliza la librería ATLAS, sin embargo, para hacer las pruebas con HPL en el cluster Mangosta, se usó una librería mejorada desarrollada por Kazushige Goto, que proporciona las rutinas BLAS optimizadas para Intel Pentium 4.

Se realizaron 16 pruebas en total con HPL en el cluster Mangosta, todas con un tamaño ?jo del problema de 10,000. Ocho de las pruebas se realizaron con MPI/TCP/IP y las ocho restantes con MPI/GAMMA de la siguiente forma: cada una de las ocho pruebas con MPI/TCP/IP y con MPI/GAMMA se realizó con un número de nodos creciente, desde 1

Mbps con MPI/TCP/IP, 495,84 Mbps con TCP/IP y nodo hasta 8 nodos. Las Tablas 1 y 2, muestran los 692,10 Mbps con MPI/GAMMA (Fig. 6). Con estos resultados de estas pruebas, donde: N = Número de datos se puede concluir que la velocidad de nodos, T(s) = Tiempo en segundos, GFP = GFLOPS transmisión lograda mediante el uso de Práctico, GFT = GFLOPS Teóricos y % = Porcentaje

1MPI/GAMMA representa una mejora de 39,58% alcanzado con respecto al rendimiento ideal .con respecto a TCP/IP y un 46,25% con respecto a la .velocidad de transmisión alcanzada con MPI.

HPL es una herramienta de medición de rendimiento ampliamente utilizada y aceptada globalmente para la evaluación de sistemas computacionales paralelos de alto rendimiento. Para la ejecución de HPL fue necesaria la instalación de MPICH, la versión portable de la librería de paso de mensajes MPI, y una librería que proporciona las rutinas de cálculo de álgebra lineal BLAS (Basic Linear Algebra Sub-programs). Usualmente se

Fig. 6. Velocidad de transmisión de datos obtenida con NetPIPE.

Tabla 1: Rendimiento del cluster Mangosta con MPI/GAMMA.

Kiara A. Ottogalli F., Daniel H. Rosquete De M., Amadís A. Martínez M. y Freddy J. Perozo R.

FARAUTE Ciens. y Tec., 5(1). 201054 55

Adaptación del Driver de la Tarjeta de Red D-Link DGE-530t para Gamma

Page 9: ADAPTACIÓN DEL DRIVER DE LATARJETA DE RED D-LINK DGE …servicio.bc.uc.edu.ve/facyt/vol5n1/art05.pdf · 1. Introducción nodo receptor, por cada capa del modelo TCP/IP, antes de

mejorar las comunicaciones. Por esta razón los resultados con MPI son mejores que los obtenidos con el uso de TCP/IP en este caso. Los resultados obtenidos con Ping Pong demuestran que el uso de MPI/GAMMA disminuye la latenciade la red en un 58,87% con respecto a la latencia de la red obtenida con MPI/TCP/IP.

Con respecto a la velocidad de transmisión, se hicieron cuatro pruebas con Ping Pong en dos nodos del cluster Mangosta: (1) Ping Pong asíncrono con MPI/TCP/IP, (2) Ping Pong asíncrono con MPI/GAMMA, (3) Ping Pong asíncrono bidireccional con MPI/TCP/IP y finalmente (4) Ping Pong asíncrono bidireccional con MPI/GAMMA (al NetPIPE es una herramienta de medición de ejecutar Ping Pong asíncrono bidireccional el emisor rendimiento independiente del protocolo de envía mensajes de cierto tamaño en Bytes al receptor comunicaciones, que calcula la velocidad de y al mismo tiempo el receptor envía mensajes del transmisión de un nodo emisor a un nodo receptor mismo tamaño en Bytes al emisor, por esta razón, en de mensajes de diferentes tamaños, así como la los resultados obtenidos con Ping Pong asíncrono latencia total de la comunicación, como la mayoría bidireccional se ve reducida la velocidad de de los mensajes enviados por NetPIPE tienen transmisión aproximadamente a la mitad en tamaños mayores a la MTU, estos deben ser comparación con los resultados obtenidos con Ping divididos en paquetes más pequeños. La latencia Pong asíncrono). total es la suma de todos los tiempos de latencia

producidos durante el procesamiento de todos los Con Ping Pong asíncrono con MPI/TCP/IP paquetes que forman un mensaje.

se obtuvo una velocidad máxima de transmisión de 498,37 Mbps mientras que, con MPI/GAMMA El tiempo de latencia medido a través de se obtuvo una velocidad máxima de transmisión NetPIPE para mensajes de un Byte fue de 33,3µs de 729,08 Mbps. Asimismo, con Ping Pong para MPI/TCP/IP, 23,81 para TCP/IP y 12,9 asíncrono bidireccional con MPI/TCP/IP se para MPI/GAMMA. La latencia obtenida mediante obtuvo una velocidad máxima de transmisión de el uso de MPI/GAMMA para paquetes de 1 Byte 272,64 Mbps mientras que, con MPI/GAMMA se constituye un 54,17% de la obtenida con TCP/IP y obtuvo una velocidad máxima de transmisión de un 38,73% de la latencia obtenida con MPI (Fig. 4). 367,98 Mbps (Fig. 3). Al ver el aumento de la latencia total obtenida

durante la ejecución de NetPIPE para mensajes Los resultados obtenidos indican que la grandes (hasta 131,069 Bytes), se puede notar que

velocidad de transmisión máxima obtenida la línea que representa la latencia total obtenida con mediante Ping Pong asíncrono con MPI/GAMMA MPI/GAMMA se mantiene por debajo de la es un 46,29% mayor que la velocidad obtenida latencia obtenida con TCP/IP, que a su vez tiene con MPI/TCP/IP y la velocidad de transmisión valores menores a los de MPI/TCP/IP (Fig. 5).máxima obtenida a través de Ping Pong asíncrono bidireccional con MPI/GAMMA es un 34,96% mayor a la obtenida con MPI/TCP/IP.

µs µs

Las velocidades de transmisión de datos máximas alcanzadas con NetPIPE fueron, 473,21

Fig. 3. Velocidad de transmisión obtenida con Ping Pong.

FARAUTE Ciens. y Tec., 5(1). 2010

Fig. 4. Tiempo de latencia total de NetPIPE para paquetes pequeños

Fig. 5. Tiempo de latencia total de NetPIPE.

utiliza la librería ATLAS, sin embargo, para hacer las pruebas con HPL en el cluster Mangosta, se usó una librería mejorada desarrollada por Kazushige Goto, que proporciona las rutinas BLAS optimizadas para Intel Pentium 4.

Se realizaron 16 pruebas en total con HPL en el cluster Mangosta, todas con un tamaño ?jo del problema de 10,000. Ocho de las pruebas se realizaron con MPI/TCP/IP y las ocho restantes con MPI/GAMMA de la siguiente forma: cada una de las ocho pruebas con MPI/TCP/IP y con MPI/GAMMA se realizó con un número de nodos creciente, desde 1

Mbps con MPI/TCP/IP, 495,84 Mbps con TCP/IP y nodo hasta 8 nodos. Las Tablas 1 y 2, muestran los 692,10 Mbps con MPI/GAMMA (Fig. 6). Con estos resultados de estas pruebas, donde: N = Número de datos se puede concluir que la velocidad de nodos, T(s) = Tiempo en segundos, GFP = GFLOPS transmisión lograda mediante el uso de Práctico, GFT = GFLOPS Teóricos y % = Porcentaje

1MPI/GAMMA representa una mejora de 39,58% alcanzado con respecto al rendimiento ideal .con respecto a TCP/IP y un 46,25% con respecto a la .velocidad de transmisión alcanzada con MPI.

HPL es una herramienta de medición de rendimiento ampliamente utilizada y aceptada globalmente para la evaluación de sistemas computacionales paralelos de alto rendimiento. Para la ejecución de HPL fue necesaria la instalación de MPICH, la versión portable de la librería de paso de mensajes MPI, y una librería que proporciona las rutinas de cálculo de álgebra lineal BLAS (Basic Linear Algebra Sub-programs). Usualmente se

Fig. 6. Velocidad de transmisión de datos obtenida con NetPIPE.

Tabla 1: Rendimiento del cluster Mangosta con MPI/GAMMA.

Kiara A. Ottogalli F., Daniel H. Rosquete De M., Amadís A. Martínez M. y Freddy J. Perozo R.

FARAUTE Ciens. y Tec., 5(1). 201054 55

Adaptación del Driver de la Tarjeta de Red D-Link DGE-530t para Gamma

Page 10: ADAPTACIÓN DEL DRIVER DE LATARJETA DE RED D-LINK DGE …servicio.bc.uc.edu.ve/facyt/vol5n1/art05.pdf · 1. Introducción nodo receptor, por cada capa del modelo TCP/IP, antes de

(Fig. 7), se puede ver que el rendimiento total del cluster con 8 nodos utilizando MPI/GAMMA es de 62,26% con respecto al valor ideal mientras que el rendimiento utilizando MPI es de 51,61%.

El problema propuesto para probar la influencia del protocolo GAMMA en el de

2sempeño de un cluster tipo Beowulf Clase I para una infraestructura de red Ethernet representa el “peor caso” con respecto al aprovechamiento de

Los resultados obtenidos con HPL la red, es decir, se usa una con?guración “uno a demuestran que las mejoras en la latencia y la todos” donde el parámetro P vale uno (1) y el velocidad de transmisión se re?ejaron en el parámetro Q toma el valor n (número de rendimiento general del cluster, el cual se procesos), esto se debe a que en una topología de incrementó en un 20,62%, alcanzando 20,47 red como la Ethernet los mensajes son GFLOPS en las mediciones hechas con HPL, un transmitidos por un solo cable. 62,26% del rendimiento ideal al cual debería acercarse el rendimiento real del cluster.En una topología de red tipo Ethernet, el

desempeño y la escalabilidad de HPL están 5.2.3. Comparación entre los Drivers para las altamente limitados y, en general, las Tarjetas D-Link DGE-530T e Intel PRO/1000 con?guraciones donde los parámetros P y Q para GAMMAforman una “malla plana”, con valores

aproximadamente iguales, son la mejor opción Para comparar el desempeño del driver skge para alcanzar el máximo rendimiento (Petitet &

para la tarjeta de red DGE-530T se tomaron en Dongarra, 2004).cuenta los resultados de las pruebas realizadas en un cluster con nodos dual Xeon de 2.8 GHz con una Si se comparan los resultados obtenidostarjeta de red Intel PRO/1000 conectados mediante un switch Extreme Networks Summit 7i Gigabit Ethernet de 28 puertos en el cual se corrió la aplicación Ping Pong.

Con el driver para la tarjeta Intel PRO/1000 para GAMMA se obtuvo una latencia de 10,8µs y una velocidad máxima de transmisión de 987,2 Mbps mientras que con el driver para la tarjeta

Tabla 2: Rendimiento del cluster Mangosta con MPI/TCP/IP.

Fig. 7. Rendimiento del Cluster Mangosta con MPI/GAMMA y MPI.

2Un cluster tipo Beowulf se considera de Clase I cuando se construye utilizando hardware y software no especializados para clusters.

1El rendimiento ideal es la cantidad de GFLOPS que puede realizar teóricamente un cluster de n no dos, y es calculado como el producto de la cantidad de GFLOPS que puede realizar un solo nodo del cluster y la cantidad de nodos del cluster. El porcentaje alcanzado con respecto al

GFPrendimiento ideal es calculado como ( ) x 100%.GFT

FARAUTE Ciens. y Tec., 5(1). 2010

DGE-530T se obtuvo una latencia de 14,6 y GAMMA, permitió su incorporación al cluster velocidad máxima de transmisión de 729,08 Mbps. Mangosta, disminuyendo la latencia en un 79,35% No fue posible hasta el momento establecer un y la tasa de transmisión de datos entre los nodos del estudio comparativo completo entre los drivers de cluster en un 39,58%. La mejora en estos dos las tarjetas D-Link DGE-530T e Intel PRO/1000 factores permitió un aumento del rendimiento total adaptados para GAMMA por la falta de datos del cluster Mangosta en un 20,62%. El logro de un comparativos sobre el rendimiento y la latencia aumento significativo en el rendimiento total del entre GAMMA y TCP/IP para el driver de la tarjeta cluster Mangosta implica que un cluster tipo Intel PRO/1000. Beowulf de clase I puede ser utilizado para ejecutar

aplicaciones que necesitan una alta capacidad de 6. Conclusiones y Trabajo Futuro cómputo y paralelismo, dando resultados en un

tiempo de respuesta aceptable por lo que elimina la En este artículo se describió la adaptación de necesidad de un cluster especializado de alto costo,

un driver especializado para una tarjeta de red lo cual es favorable sobretodo a nivel académico.Gigabit Ethernet con su respectiva interfaz, para poder incorporar el uso de GAMMA al cluster de Es importante destacar que, aún cuando no PCs de bajo costo del Departamento de existe un procedimiento estándar para el desarrollo Computación de la FaCyT-UC, llamado Mangosta. de un driver de red para GAMMA y su respectiva

interfaz, se puede aplicar un esquema de Se eligió el driver skge debido a que este conversión similar en el cual se deben realizar

brinda soporte a las tarjetas de red Gigabit Ethernet cuatro pasos específicos: (1) eliminar las de SysKonnect y a los conjuntos de chips de la interrupciones de transmisión del driver, (2) familia Marvell Yukon 1. Las tarjetas de red redirigir la recepción de paquetes a GAMMA, (3) Gigabit Ethernet que posee el cluster Mangosta crear los macros de recepción, (4) crear los macros son D-Link DGE-530T poseen el chipMarvell de transmisión. Este esquema sirve como base para Yukon 88E8001, el cual pertenece a esta última la adaptación de otros drivers para GAMMA, lo categoría. cual da cabida a diferentes implementaciones en el

área. Al finalizar el desarrollo del driver skge para

GAMMA, se hicieron pruebas con Ping Pong para Como trabajo futuro, se tiene pensado comparar el rendimiento del cluster Mangosta con adaptar el driver para el uso de jumbo frames, ya GAMMA y con TCP/IP, y pruebas con Ping Pong, que la versión actual permite el manejo de paquetes NetPIPE y HPL para compararMPI/GAMMA, hasta una MTU menor a 9000 Bytes.MPI/TCP/IP y TCP/IP. Estas pruebas demuestran que el uso de GAMMA mejoró el rendimiento 7. Bibliografíageneral del cluster como consecuencia directa de la disminución de la latencia y el aumento de la tasa de Chiola G. & G. Ciaccio. (1996). GAMMA: transmisión de datos. Con respecto a la Architecture, Programming Interface and comparación con el driver para la tarjeta Intel Preliminary Benchmarking. Technical Report. PRO/1000, el driver skge tuvo un rendimiento Universitá di Genova. Genova. Italia.inferior en cuanto a la latencia y máxima velocidad de transmisión.

La adaptación del driver skge para

µs

Chiola G. & G. Ciaccio. (1997). GAMMA: a lowcost network of workstations based on active messages. Proceedings of the 5th Euromicro

Kiara A. Ottogalli F., Daniel H. Rosquete De M., Amadís A. Martínez M. y Freddy J. Perozo R.

FARAUTE Ciens. y Tec., 5(1). 201056 57

Adaptación del Driver de la Tarjeta de Red D-Link DGE-530t para Gamma

GF

LO

PS

Nodos

Page 11: ADAPTACIÓN DEL DRIVER DE LATARJETA DE RED D-LINK DGE …servicio.bc.uc.edu.ve/facyt/vol5n1/art05.pdf · 1. Introducción nodo receptor, por cada capa del modelo TCP/IP, antes de

(Fig. 7), se puede ver que el rendimiento total del cluster con 8 nodos utilizando MPI/GAMMA es de 62,26% con respecto al valor ideal mientras que el rendimiento utilizando MPI es de 51,61%.

El problema propuesto para probar la influencia del protocolo GAMMA en el de

2sempeño de un cluster tipo Beowulf Clase I para una infraestructura de red Ethernet representa el “peor caso” con respecto al aprovechamiento de

Los resultados obtenidos con HPL la red, es decir, se usa una con?guración “uno a demuestran que las mejoras en la latencia y la todos” donde el parámetro P vale uno (1) y el velocidad de transmisión se re?ejaron en el parámetro Q toma el valor n (número de rendimiento general del cluster, el cual se procesos), esto se debe a que en una topología de incrementó en un 20,62%, alcanzando 20,47 red como la Ethernet los mensajes son GFLOPS en las mediciones hechas con HPL, un transmitidos por un solo cable. 62,26% del rendimiento ideal al cual debería acercarse el rendimiento real del cluster.En una topología de red tipo Ethernet, el

desempeño y la escalabilidad de HPL están 5.2.3. Comparación entre los Drivers para las altamente limitados y, en general, las Tarjetas D-Link DGE-530T e Intel PRO/1000 con?guraciones donde los parámetros P y Q para GAMMAforman una “malla plana”, con valores

aproximadamente iguales, son la mejor opción Para comparar el desempeño del driver skge para alcanzar el máximo rendimiento (Petitet &

para la tarjeta de red DGE-530T se tomaron en Dongarra, 2004).cuenta los resultados de las pruebas realizadas en un cluster con nodos dual Xeon de 2.8 GHz con una Si se comparan los resultados obtenidostarjeta de red Intel PRO/1000 conectados mediante un switch Extreme Networks Summit 7i Gigabit Ethernet de 28 puertos en el cual se corrió la aplicación Ping Pong.

Con el driver para la tarjeta Intel PRO/1000 para GAMMA se obtuvo una latencia de 10,8µs y una velocidad máxima de transmisión de 987,2 Mbps mientras que con el driver para la tarjeta

Tabla 2: Rendimiento del cluster Mangosta con MPI/TCP/IP.

Fig. 7. Rendimiento del Cluster Mangosta con MPI/GAMMA y MPI.

2Un cluster tipo Beowulf se considera de Clase I cuando se construye utilizando hardware y software no especializados para clusters.

1El rendimiento ideal es la cantidad de GFLOPS que puede realizar teóricamente un cluster de n no dos, y es calculado como el producto de la cantidad de GFLOPS que puede realizar un solo nodo del cluster y la cantidad de nodos del cluster. El porcentaje alcanzado con respecto al

GFPrendimiento ideal es calculado como ( ) x 100%.GFT

FARAUTE Ciens. y Tec., 5(1). 2010

DGE-530T se obtuvo una latencia de 14,6 y GAMMA, permitió su incorporación al cluster velocidad máxima de transmisión de 729,08 Mbps. Mangosta, disminuyendo la latencia en un 79,35% No fue posible hasta el momento establecer un y la tasa de transmisión de datos entre los nodos del estudio comparativo completo entre los drivers de cluster en un 39,58%. La mejora en estos dos las tarjetas D-Link DGE-530T e Intel PRO/1000 factores permitió un aumento del rendimiento total adaptados para GAMMA por la falta de datos del cluster Mangosta en un 20,62%. El logro de un comparativos sobre el rendimiento y la latencia aumento significativo en el rendimiento total del entre GAMMA y TCP/IP para el driver de la tarjeta cluster Mangosta implica que un cluster tipo Intel PRO/1000. Beowulf de clase I puede ser utilizado para ejecutar

aplicaciones que necesitan una alta capacidad de 6. Conclusiones y Trabajo Futuro cómputo y paralelismo, dando resultados en un

tiempo de respuesta aceptable por lo que elimina la En este artículo se describió la adaptación de necesidad de un cluster especializado de alto costo,

un driver especializado para una tarjeta de red lo cual es favorable sobretodo a nivel académico.Gigabit Ethernet con su respectiva interfaz, para poder incorporar el uso de GAMMA al cluster de Es importante destacar que, aún cuando no PCs de bajo costo del Departamento de existe un procedimiento estándar para el desarrollo Computación de la FaCyT-UC, llamado Mangosta. de un driver de red para GAMMA y su respectiva

interfaz, se puede aplicar un esquema de Se eligió el driver skge debido a que este conversión similar en el cual se deben realizar

brinda soporte a las tarjetas de red Gigabit Ethernet cuatro pasos específicos: (1) eliminar las de SysKonnect y a los conjuntos de chips de la interrupciones de transmisión del driver, (2) familia Marvell Yukon 1. Las tarjetas de red redirigir la recepción de paquetes a GAMMA, (3) Gigabit Ethernet que posee el cluster Mangosta crear los macros de recepción, (4) crear los macros son D-Link DGE-530T poseen el chipMarvell de transmisión. Este esquema sirve como base para Yukon 88E8001, el cual pertenece a esta última la adaptación de otros drivers para GAMMA, lo categoría. cual da cabida a diferentes implementaciones en el

área. Al finalizar el desarrollo del driver skge para

GAMMA, se hicieron pruebas con Ping Pong para Como trabajo futuro, se tiene pensado comparar el rendimiento del cluster Mangosta con adaptar el driver para el uso de jumbo frames, ya GAMMA y con TCP/IP, y pruebas con Ping Pong, que la versión actual permite el manejo de paquetes NetPIPE y HPL para compararMPI/GAMMA, hasta una MTU menor a 9000 Bytes.MPI/TCP/IP y TCP/IP. Estas pruebas demuestran que el uso de GAMMA mejoró el rendimiento 7. Bibliografíageneral del cluster como consecuencia directa de la disminución de la latencia y el aumento de la tasa de Chiola G. & G. Ciaccio. (1996). GAMMA: transmisión de datos. Con respecto a la Architecture, Programming Interface and comparación con el driver para la tarjeta Intel Preliminary Benchmarking. Technical Report. PRO/1000, el driver skge tuvo un rendimiento Universitá di Genova. Genova. Italia.inferior en cuanto a la latencia y máxima velocidad de transmisión.

La adaptación del driver skge para

µs

Chiola G. & G. Ciaccio. (1997). GAMMA: a lowcost network of workstations based on active messages. Proceedings of the 5th Euromicro

Kiara A. Ottogalli F., Daniel H. Rosquete De M., Amadís A. Martínez M. y Freddy J. Perozo R.

FARAUTE Ciens. y Tec., 5(1). 201056 57

Adaptación del Driver de la Tarjeta de Red D-Link DGE-530t para Gamma

GF

LO

PS

Nodos

Page 12: ADAPTACIÓN DEL DRIVER DE LATARJETA DE RED D-LINK DGE …servicio.bc.uc.edu.ve/facyt/vol5n1/art05.pdf · 1. Introducción nodo receptor, por cada capa del modelo TCP/IP, antes de

Workshop on Parallel and Distributed Processing. IEEE Computer Society Press. London. United Kingdom. 78-83.

IASTED. Washington D.C. USA.196-204.

40-53.

[en línea]. Computer Science Department, University of Tennessee. http://www.netlib.org/benchmark/hpl/. (8/6/2007).

Chiola G. & G. Ciaccio. (1998). Optimal Snell, Q., A. Mikler & J. Gustafson. (1996). communication performance on fast ethernet NetPIPE: A network protocol independent with GAMMA. Proceedings Workshop PC- performance evaluator. IASTED International NOW, IPPS/SPDP’98. IEEE Computer Society Conference on Intelligent Information Management Press Florida. USA. 534-548. and Systems.

Chiola G. & G. Ciaccio. (1999). Porting MPICH ADI on GAMMA with flow control. In Tanenbaum, A. (2003). Redes de Computadoras. MidwestWorkshop on Parallel Processing. Kent Pearson Prentice Hall. Mexico. State University. Ohio. USA.

Von Eicken, T., D. Culler, S. Goldstein & K. Corbet, J., A. Rubini & G. Kroah-Hartman. Schauser. (1992). Active messages: A mechanism (2005). Linux Device Drivers. O’Reilly. for integrated communication and computation. California. USA. ACM SIGARCH Computer Architecture News.

20(2): 256-266.Díaz, A., J. Ortega, A. Cañas, F. Fernández, M. Anguita & A. Prieto. (2003). The ligh-weight Von Eicken, T., A. Basu, V. Buch & W. Vogels. protocol CLIC on gigabit ethernet. Intenational (1995). U-Net: A User-Level Network Interface for Parallel and Distributed Processing Symposium. Parallel and Distributed Computing. Proceedings IEEE Computer Society Press. Nice. France. of the 15th ACM Symposium on Operating 200a. Systems Principles. ACM. Colorado. USA.

Morrison, R. (2003). Architectures, Operating Systems, Parallel Processing and Programing Von Eicken, T. & W. Vogels. (1998). Evolution of Languages. In: Cluster Computing (Richard the Virtual Interface Architecture. Computer. Morrison, Ed.), 12-27. GNU General Public 31(11): 61-68.Licence. Sydney. Australia.

Ottogalli, K. (2007). Software controlador de la tarjeta de red D-Link DGE-530T para GAMMA. Trabajo Especial de Grado. Facultad Experimental de Ciencia y Tecnología. Universidad de Carabobo. Valencia. Venezuela.

Perozo, F. (2006). Cluster Mangosta: Implementación y Evaluación. Faraute Ciens. y Tec. 1(2): 19-30.

Petitet, A. & J. Dongarra. (2004). HPL a portable implementation of the high-performance linpack benchmark for distributed-memory computers

534-548.

FARAUTE Ciens. y Tec., 5(1). 2010

ESTUDIO ELIPSOMÉTRICO DE LA INFLUENCIA DE SURFACTANTES EN LA ADSORCIÓN DE ASFALTENOS SOBRE MICAS DE VIDRIO

Ellipsometry studies of the surfactants influence in the adsorption of asphaltenes on mica of glass

1 2 1JUAN BRITO. , RAFAEL MUÑOZ y HENRY LABRADOR .1Laboratorio de Petróleo, Hidrocarburos y Derivados (PHD), Departamento de Química.

2Laboratorio Espectroscopia Óptica de Superficies. Departamento de Física. Facultad Experimental de Ciencias y Tecnología, Universidad de Carabobo.

Fecha de Recepción: 14/08/2009, Fecha de Revisión: 22/06/2010, Fecha de Aceptación: 17/07/2010

Resumen

thickness of the films with regard to the target, however for the DM-153 asphaltene to a concentration of 0,2% of the natural surfactant the growth of the film is favoured.

Key Words: Asphaltene, Elipsometry, Surfactant.

Valencia, Venezuela.{rmunoz, hjlabrad}@uc.edu.ve

Se utilizaron dos tipos de surfactantes (natural y sintético) en disoluciones de asfaltenos (DM-153 y Guafita) y se estudio los cambios de los espesores de las películas de asfaltenos sobre el sustrato (micas de vidrios) a temperatura ambiente y presión atmosférica, usando la técnica de elipsometría. Se encontró que en ausencia de los surfactantes, los espesores de las películas se incrementaban a medida que aumenta la concentración de asfaltenos en las disoluciones, ocurriendo la formación de multicapas de asfaltenos, dando valores entre los 40 y 190 nm. Con la utilización del surfactante sintético (NFE) se encontró que el asfalteno DM-153 necesitó una concentración de 1% m/v del NFE para que disminuyera los espesores con respecto a su blanco (sin dispersante), en cambio con el asfalteno Guafita no se observó ningún cambio en los espesores con este surfactante. Con la resina natural, se encontró que cuando actuó sobre las disoluciones de asfaltenos Guafita con una concentración de 1 % m/v disminuyó los espesores de las películas con respecto al blanco, en cambio para el asfalteno de DM-153 a una concentración de 0,2% m/v del surfactante natural favoreció el crecimiento de la película.

Palabras Claves: Asfalteno, Elipsometría, Surfactantes.

AbstractTwo surfactants types were used (natural and synthetic) in dissolution of (DM-153 and Guafita) and this way to determine the changes of the thickness of asphaltene films on a substrate (mica of glass) to ambient temperature and atmospheric pressure, using the elipsometry technique. It was found that in absence of the surfactants, the thickness of the films were increased as it increases the concentration of asphaltene in solutions, happening the multilayer formation of asphaltene, giving valour between the 40 and 190 nm. With the use of the synthetic surfactant (NFE) it was found that in the DM-153 asphaltene I need a concentration of 1% m/v of the NFE so that decrease of the thickness with regard to their target (without surfactans), on the other hand with Guafita asphaltene, change some was not observed in the thickness with this surfactant. With the natural resin, was the following: when it acted on the solution asphaltene Guafita with a concentration of 1 % m/v it diminished the

ISSN 1698 - 7418Depósito Legal PP200402CA1617FARAUTE Ciens. y Tec., 5(1): 59-67, 2010

58 59

Adaptación del Driver de la Tarjeta de Red D-Link DGE-530t para Gamma