cloud computing and g traducido

Departamento de Ciencias de la Computacin de la Universidad Estatal de Wayne,

Detroit, MI, EE.UU.

Resumen- Cloud Computing se ha convertido en otra palabra de moda despus de

la Web 2.0. Sin embargo, hay docenas de diferentes definiciones para la nube

Informtica y parece que hay consenso sobre qu es la nube.

Por otro lado, la computacin en nube no es un concepto completamente nuevo;

tiene intrincada conexin a la relativamente nueva, pero trece aos establecida

paradigma Grid Computing, y otra correspondiente tecnologas como utility

computing, computacin en clster, y sistemas distribuidos en general. En este

trabajo se esfuerza por comparar y contrastar Cloud Computing con Grid

Computing desde varios ngulos y dar una visin de las caractersticas esenciales

de ambos.

1 100-Mile Informacin general Cloud Computing est insinuando un futuro en el que no lo haremos calcular en

equipos locales, pero en instalaciones centralizadas operado por informticos y de

almacenamiento utilidades de terceros. Estamos seguros No se perder el software

empaquetado para desenvolver e instalar.

Huelga decir que esto no es una idea nueva. De hecho, en 1961, informtica

pionero John McCarthy predicho que "Computacin algn da puede ser

organizado como un servicio pblico" - y pas a especular cmo esto podra

ocurrir.

A mediados de 1990, el trmino de cuadrcula fue acuado para describir

tecnologas que permitan a los consumidores a obtener la informtica el poder de

la demanda. Ian Foster y otros postularon que por la estandarizacin de los

protocolos utilizados para solicitar la potencia de clculo, podramos estimular la

creacin de un Grid Computing, anlogo en forma y utilidad a la red de energa

elctrica. Investigadores posteriormente desarrollado estas ideas de muchas

maneras emocionantes, producir, por ejemplo, sistemas federados a gran escala

(TeraGrid, Open Science Grid, caBIG, EGEE, Tierra Grid System) que

proporcionar energa no slo la computacin, sino tambin los datos y software,

bajo demanda. Las organizaciones de normalizacin (por ejemplo, OGF, OASIS)

normas pertinentes definidos. Ms prosaicamente, el trmino tambin fue

cooptados por la industria como un trmino de marketing para los clsteres. Pero

no proveedores de grid computing comerciales viables surgieron, al menos

No hasta hace poco. As es el "Cloud Computing" slo un nuevo nombre para la

red? En tecnologa de la informacin, donde las escalas de tecnologa por una

orden de magnitud, y en el proceso se reinventa, cada cinco aos, no hay ninguna

respuesta clara a estas preguntas. S: la visin es el mismo para reducir el costo de

la computacin, aumentar la fiabilidad y aumentar la flexibilidad mediante la

transformacin computadoras de algo que compramos y operamos nosotros a algo

que es operado por un tercero.

Pero no: las cosas son diferentes de lo que eran hace 10 aos. Tenemos una nueva

necesidad de analizar los datos masivos, motivando as aumentado

considerablemente la demanda de la informtica. Despus de haber realizado la

beneficios de pasar de mainframes a las agrupaciones de las materias primas, nos

encontramos con que esos grupos son bastante caros de operar. Nosotros tener la

virtualizacin de bajo costo. Y, sobre todo, tenemos mltiples miles de millones

de dlares gastados por los gustos de Amazon, Google, y Microsoft para crear

sistemas de bienes comerciales a gran escala que contiene cientos de miles de

ordenadores. El prospecto de necesitar solamente una tarjeta de crdito para

obtener acceso bajo demanda a 100.000 computadoras en decenas de centros de

datos distribuidos todo el mundo de recursos que pueden aplicar a problemas con

masiva de datos, potencialmente distribuido, es emocionante! As que se opera a

una escala diferente, y operando a estos nuevos, ms escalas masivas pueden exigir

fundamentalmente diferente enfoques para abordar los problemas. Tambin

permite -en realidad es a menudo slo es aplicable a-totalmente nuevos problemas.

Sin embargo, s: los problemas son en su mayora los mismos en las nubes y

Grids. Hay una necesidad comn de ser capaces de gestionar grandes

instalaciones; para definir los mtodos por los cuales los consumidores descubren,

peticin, y utilizar los recursos proporcionados por las instalaciones centrales; y

poner en prctica los clculos a menudo altamente paralelos que ejecutar en esos

recursos. Detalles difieren, pero los dos las comunidades estn luchando con

muchos de los mismos problemas.

Definicin de Cloud Computing Hay poco consenso sobre cmo definir la nube [49]. Nosotros aadir otra

definicin a la lista ya saturada de definiciones para Cloud Computing:

Un paradigma de computacin distribuida a gran escala que es impulsada por las

economas de escala, en la que un grupo de abstrada, virtualizado,

dinmicamente escalable, logr el poder de computacin, almacenamiento,

plataformas y servicios son entregado en la demanda de los clientes externos sobre

el Internet.

Hay algunos puntos clave en esta definicin. En primer lugar, la nube Computing

es un paradigma de computacin distribuida especializado; eso difiere de las

tradicionales en que 1) es masivamente escalable, 2) se pueden encapsular como

una entidad abstracta que ofrece diferentes niveles de servicios a los clientes fuera

de la Nube, 3) es impulsada por las economas de escala [44], y 4) los servicios

pueden ser configurado dinmicamente (a travs de la virtualizacin o otros

enfoques) y se entregan bajo demanda.

Los gobiernos, institutos de investigacin, y lderes de la industria son apresurarse

a adoptar el Cloud Computing para solucionar su en constante aumento de los

problemas de clculo y almacenamiento que surgen en el Era de Internet. Hay tres

factores principales que contribuyen a la sobretensiones y los intereses en Cloud

Computing: 1) disminucin rpida de la costo de hardware y aumento de la

potencia de computacin y almacenamiento la capacidad, y el advenimiento de la

arquitectura multi-core y moderno supercomputadoras que consisten en cientos de

miles de ncleos;

2) el crecimiento exponencial en el tamao de los datos cientficos instrumentacin

/ simulacin y publicacin en Internet y archivado; y 3) la adopcin extendida de

Servicios Informtica y aplicaciones Web 2.0.

Nubes, Sistemas Grids y Distribuidos Muchos lectores exigentes dar cuenta de inmediato de que nuestro

definicin de Cloud Computing se superpone con muchos existente tecnologas,

como Grid Computing, Utilidad de Computacin, Servicios de Informtica y

computacin distribuida en general. Nosotros argumentan que la computacin en

nube no slo se solapa con cuadrcula Informtica, es de hecho evolucion a partir

de Grid Computing y se basa en Grid Computing como su columna vertebral y la

infraestructura apoyo. La evolucin ha sido el resultado de un cambio de enfoque

de una infraestructura que proporciona almacenamiento y cmputo recursos (tal es

el caso en Grids) a uno que es la economa based con el objetivo de ofrecer recursos

y servicios ms abstractos (Como es el caso de nubes). En cuanto a la utilidad

Computing, no es un nuevo paradigma de la infraestructura informtica; ms bien,

es una modelo de negocio en el que los recursos informticos, como cmputo y

almacenamiento, se empaquetan como servicios medidos similar a un servicio

pblico fsico, como la electricidad y el red telefnica pblica conmutada. Utility

computing es normalmente implementado usando otra infraestructura informtica

(Por ejemplo, Grids) con servicios de contabilidad y de control adicionales.

Una infraestructura de la nube puede ser utilizada internamente por una empresa o

expuesto al pblico como utility computing. Ver Figura 1 para una visin general

de la relacin entre

Nubes y otros dominios que se superponga con. Web 2.0 cubre casi todo el espectro

de servicios orientados a aplicaciones en las que la computacin en nube se

encuentra en la gran escala lado. Supercomputacin y Computacin Cluster han

sido ms centrado en aplicaciones que no son de servicio tradicionales. Cuadrcula

Computing se solapa con todos estos campos donde es generalmente considerada

de menor escala que las supercomputadoras y nubes.

Figura 1: Grids y nubes Informacin general Grid Computing pretende "activar el uso compartido de recursos y problema

coordinada de problemas en dinmica, multi-institucional organizaciones virtuales

"[18] [20]. Hay tambin unos pocos clave caractersticas a esta definicin: En

primer lugar, las redes de proporcionar una paradigma de la computacin

distribuida o infraestructura que abarca a travs de mltiples organizaciones

virtuales (VO), donde cada uno puede VO constituido, o bien instituciones

distribuidas fsica o lgicamente relacionados con proyectos / grupos. El objetivo

de este paradigma es habilitar el uso compartido de recursos federada en dinmico,

distribuido ambientes. El enfoque adoptado por el estndar de facto aplicacin - El

Globus Toolkit [16] [23], es la construccin de un entorno informtico uniforme

de diversos recursos por la definicin de protocolos de red estndar y proporcionar

middleware para mediar el acceso a una amplia gama de recursos heterogneos.

Globus aborda diversos temas como la seguridad, los recursos descubrimiento, el

aprovisionamiento de recursos y gestin, trabajo programacin, seguimiento y

gestin de datos.

Hace media dcada, Ian Foster, dio una lista de control de tres puntos [19] para

ayudar a definir lo que es, y lo que no es un Grid: 1) las coordenadas recursos que

no estn sujetos a un control centralizado, 2) utiliza estndar,, protocolos e

interfaces de propsito general abiertos, y 3) ofrece cualidades no triviales de

servicio. Aunque el punto 3 contiene cierto para Cloud Computing, ni el punto 1,

ni el punto 2 es claro que es el caso para las nubes de hoy en da. La visin de las

nubes y Grids son similares, los detalles y las tecnologas utilizadas pueden ser

diferentes, pero las dos comunidades estn luchando con muchos de los mismos

cuestiones. En este trabajo se esfuerza por comparar y contrastar la nube

Informtica con Grid Computing desde varios ngulos y dar conocimientos sobre

las caractersticas esenciales de ambos, con la esperanza para pintar un panorama

menos nublado de lo que son las nubes, qu tipo de aplicaciones pueden Nubes

esperar para apoyar, y cules son los desafos

Nubes tendrn que hacer frente en los prximos aos a medida que adquieren

impulso y adopcin. Esperamos que esto ayudar tanto comunidades obtienen una

comprensin ms profunda de los objetivos, supuestos, el estado y las direcciones,

y proporcionar una mayor vista detallada de ambas tecnologas para el pblico

general.

2 Comparando Grids y nubes Side-by-Side

Esta seccin tiene como objetivo comparar Grids y nubes en un amplio variedad

de perspectivas, desde la arquitectura, modelo de seguridad, modelo de negocio,

modelo de programacin, la virtualizacin, los datos modelo, modelo de clculo,

a la procedencia y aplicaciones. Nosotros tambin esbozar una serie de retos y

oportunidades que la red Informtica y Cloud Computing aportar a los

investigadores y el Industria de TI, ms comn a ambos, pero algunos son

especficos para uno o el otro.

2.1

Modelo de Negocio Modelo de negocio tradicional de software ha sido una sola vez pago por uso

ilimitado (por lo general en 1 equipo) de la software. En un modelo de negocio

basado en la nube, un cliente pagar el proveedor sobre una base de consumo, muy

parecido a la utilidad compaas cobran por los servicios pblicos bsicos, como

la electricidad, el gas, y agua, y el modelo se basa en economas de escala con el

fin de bajar los precios para los usuarios y las ganancias hasta para los

proveedores. Hoy en da, Amazon ofrece esencialmente una nube centralizada que

consiste en Compute Cloud EC2 y S3 nube de datos. El primero es pagan en base

a por instancia horas consumidas por cada tipo de instancia y la tarde se pagan

directamente por GB-mes de almacenamiento utilizado. Adems, la transferencia

de datos se cobra por TB / la transferencia de datos por mes, dependiendo de la

fuente y el destino de dicha transferencia. La perspectiva de que slo necesitan una

tarjeta de crdito para obtener acceso bajo demanda a 100.000 procesadores en

decenas de datos centros distribuidos por todo el mundo-recursos fcticos aplicada

a problemas con los datos masivos, potencialmente distribuidos, es emocionante!

El modelo de negocio para Grids (al menos la que se encuentra en el mundo

acadmico o laboratorios del gobierno) es orientado a los proyectos en los que los

usuarios o comunidad representada por esa propuesta tiene cierto nmero de

unidades de servicio (es decir, horas de CPU) que pueden gastar. Por ejemplo, el

TeraGrid opera de esta manera, y requiere cada vez ms propuestas complejas para

ser escritos creciente nmero de potencia de clculo. El TeraGrid tiene ms de una

docena

Sitios de cuadrcula, todas organizadas en diversas instituciones de todo el pas.

Qu hace que una institucin quiere unirse a la TeraGrid? Cuando una institucin

se une a la TeraGrid con un conjunto de recursos, sabe que otros en la comunidad

pueden ahora utilizar estos recursos a travs del pas. Tambin reconoce el hecho

de que gana acceso a una docena de otros sitios Grid. Este mismo modelo tiene

trabajado bastante bien durante muchos Rejillas de todo el mundo, dando

incentivos instituciones se unan varias rejillas para el acceso a recursos adicionales

para todos los usuarios de la correspondiente institucin.

Tambin hay esfuerzos para construir una economa de cuadrcula para un mundial

Infraestructura Grid que apoya el comercio, la negociacin, aprovisionamiento, y

la asignacin de recursos basado en los niveles de servicios prestados, riesgo y

costo, y las preferencias de los usuarios; Hasta aqu, intercambio de recursos (por

ejemplo, almacenamiento comercial para ciclos de clculo), subastas, la teora de

coordinacin de recursos basado en juego, virtuales monedas, corredores e

intermediarios de recursos, y varios

Se han propuesto y aplicado en otros modelos econmicos la prctica [8].

2.2 arquitectura

Rejillas ubic a mediados de los aos 90 para hacer frente a gran escala problemas

de clculo utilizando una red de intercambio de recursos mquinas de productos

bsicos que proporcionan la potencia de clculo accesible solamente por los

superordenadores y grandes grupos dedicados En ese tiempo. La principal

motivacin era que stas alta recursos de computacin de rendimiento eran caros

y difciles de tener acceso a, por lo que el punto de partida era utilizar federado

recursos que podran comprender de cmputo, almacenamiento y redes recursos

de mltiples instituciones distribuidas geogrficamente, y dichos recursos son

generalmente heterognea y dinmica. Rejillas centran en la integracin de los

recursos existentes, con su hardware, sistemas operativos, la gestin de los

recursos locales, y infraestructura de seguridad.

Con el fin de apoyar la creacin de la llamada "virtual Organizaciones ", una

entidad lgica dentro de la cual distribuye los recursos pueden ser descubiertos y

compartidos como si fueran de de la misma organizacin, Rejillas definir y

proporcionar un conjunto de protocolos estndar, middleware, herramientas y

servicios construidos sobre Adems de estos protocolos. La interoperabilidad y la

seguridad son los las preocupaciones principales de la infraestructura Grid como

recursos pueden provienen de diferentes dominios administrativos, que tienen

tanto las polticas de uso de recursos globales y locales, hardware diferente y

configuraciones de software y plataformas, y varan en disponibilidad y capacidad.

Rejillas proporcionan protocolos y servicios en cinco capas diferentes como

identificado en la arquitectura de protocolo de cuadrcula (vase la Figura 2). En

la capa de tejido, Grids proporcionar acceso a diferentes recursos tipos, tales como

computacin, almacenamiento y recursos de red, cdigo repositorio, etc. Rejillas

generalmente dependen de tejido existente componentes, por ejemplo,

administradores de recursos locales (es decir, PBS [5], Condor [48],

etc). Componentes de propsito general, como GARA (arquitectura general para

la reserva avanzada) [17], y los servicios especializados de gestin de recursos

tales como Falkon [40] (aunque estrictamente hablando, Falkon tambin

proporciona servicios ms all de la capa de tejido).

Figura 2: Red Protocolo de Arquitectura La capa de conectividad define la comunicacin ncleo y protocolos de

autenticacin de red fcil y seguro transacciones. El (Infraestructura Red de

Seguridad) GSI [27] protocolo subyace cada transaccin cuadrcula.

La capa de recurso define protocolos para la publicacin, descubrimiento,

negociacin, supervisin, contabilidad y pago de compartir operaciones sobre los

recursos individuales. El GRAM (Grid Acceso de Recursos y Gestin) [16]

protocolo se utiliza para asignacin de recursos computacionales y para el

seguimiento y el control de la computacin en esos recursos, y GridFTP [2] para

el acceso de datos y la transferencia de datos de alta velocidad.

La capa colectiva capta las interacciones a travs de las colecciones de recursos,

servicios de directorio, como MDS (Monitoreo y Servicio Discovery) [43] permite

la supervisin y descubrimiento de recursos VO, Condor-G [24] y Nimrod-G [7]

son ejemplos de co-se distribuyen, la programacin y la intermediacin servicios

y MPICH [32] para activar la rejilla de programacin

sistemas y CAS (servicio comunitario de autorizacin) [21] para polticas de

recursos globales.

La capa de aplicacin comprende cualesquiera que sean las aplicaciones de

usuario construido en la cima de los protocolos y APIs anteriores y operar en VO

ambientes. Dos ejemplos son los sistemas de flujo de trabajo de cuadrcula, y

Portales grid (es decir Quarknet entorno de e-learning [52], Nacional Virtual

Observatorio (Http://www.us-vo.org), TeraGrid Ciencia pasarela

(http://www.teragrid.org)).

Las nubes estn desarrollando para hacer frente a la informtica a escala de Internet

problemas en los que algunos supuestos son diferentes de las de el Grids. Las nubes

se refieren generalmente como un gran nmero de informticos y / o

almacenamiento de los recursos, que se puede acceder a travs de protocolos
http://www.us-vo.org/http://www.teragrid.org)/

estndar a travs de una interfaz abstracta. Las nubes pueden ser construido en la

cima de muchos protocolos existentes, como Servicios Web (WSDL, SOAP), y

algunas avanzadas tecnologas Web 2.0 tales como el descanso, RSS, AJAX, etc.

De hecho, detrs de la cubierta, es posible que las nubes que se aplicarn sobre red

existente tecnologas que aprovechan ms de una dcada de la comunidad

esfuerzos en la normalizacin, la seguridad, la gestin de recursos, y soporte de

virtualizacin. Tambin hay varias versiones de definicin para la nube

arquitectura, definimos una arquitectura de cuatro capas de la nube Computing en

comparacin con la arquitectura de la red, compuesta de 1) la tela, 2) recursos

unificado, 3) plataforma, y 4) la aplicacin

Capas.

Figura 3: Arquitectura de la nube La capa de tejido contiene los recursos a nivel de hardware en bruto, tales como

los recursos informticos, recursos de almacenamiento y de red recursos. La capa

de recursos unificada contiene recursos que han sido resumidas / encapsulado

(generalmente por la virtualizacin) de modo que puedan estar expuestos a los

usuarios de la capa y de extremo superior como integrada de los recursos, por

ejemplo, un ordenador / cluster virtual, un sistema de archivo lgico, un sistema

de base de datos, etc. La capa de plataforma aade en una coleccin de

herramientas especializadas, middleware y servicios en la parte superior de los

recursos unificadas para proporcionar una desarrollo y / o plataforma de

despliegue. Por ejemplo, un Web medio ambiente, un servicio de programacin,

etc. hospedaje ltimo, el capa de aplicacin contiene las aplicaciones que se

ejecutan en las nubes.

Nubes en general ofrecen servicios en tres niveles diferentes

(IaaS, PaaS y Saas [50]) de la siguiente manera, aunque algunos los proveedores

pueden optar por exponer servicios en ms de un nivel. Infraestructura como

Servicio (IaaS) de hardware [50] disposiciones, software y equipos (sobre todo en

la capa recurso unificado, pero tambin puede incluir la parte de la capa de tejido)

para entregar software entornos de aplicaciones con una fijacin de precios basada

en el uso de recursos modelo. Infraestructura puede escalar hacia arriba y abajo de

forma dinmica basado en las necesidades de recursos de aplicacin. Ejemplos

tpicos son Amazon EC2 (Elastic Cloud Computing) Servicio [3] y S3 (Simple

Storage Service) [4], donde cmputo y almacenamiento infraestructuras estn

abiertas al acceso pblico con un pago por uso modelo; Eucalyptus [15] es un

cdigo abierto Nube aplicacin que proporciona una interfaz compatible para EC2

de Amazon, y permite a las personas para establecer una nube infraestructura en

premisa y experimentar antes de comprar servicios comerciales.

Plataforma como servicio (PaaS) [50] ofrece un alto nivel entorno integrado para

construir, probar y desplegar personalizada aplicaciones. En general, los

desarrolladores tendrn que aceptar algunas restricciones sobre el tipo de software

que pueden escribir a cambio para una funcin de escalabilidad de la

aplicacin. Un ejemplo es la de Google App Engine [28], que permite a los

usuarios construir Web aplicaciones en los mismos sistemas escalables que poder

Google aplicaciones.

Software como Servicio (SaaS) [50] proporciona para fines especiales software que

es accesible de forma remota por los consumidores a travs de la Internet con un

modelo de precios basado en el uso. Salesforce es una lder de la industria en el

suministro de CRM en lnea (Cliente Relationship Management) Servicios. Live

Mesh de Microsoft permite que los archivos y carpetas que se comparten y

sincronizado a travs de mltiples dispositivos. Aunque las nubes proporcionan

servicios en tres niveles diferentes (IaaS, PaaS y SaaS), normas para las interfaces

a estas diferentes niveles an no se han definido. Esto lleva a problemas de

interoperabilidad entre nubes de hoy en da, y no hay pocos incentivos comerciales

para los proveedores de la nube para invertir recursos adicionales en la definicin

e implementacin nueva interfaces. Como Nubes maduran, y ms sofisticados

aplicaciones y servicios surgir que requieren el uso de mltiples nubes, habr cada

vez ms incentivos para adoptar interfaces estndares que faciliten la

interoperabilidad con el fin de capturar emergentes y crecientes mercados en una

nube saturada mercado.

2.3 Administracion De Recursos En esta seccin se describe el manejo de los recursos que se encuentra en Grids y

nubes, que abarcan temas como el modelo de clculo, modelo de datos, la

virtualizacin, la supervisin, y la procedencia. Estas los temas son muy

importantes para entender la principal retos que a mbas Grids y nubes enfrentan

hoy en da, y lo har que superar en el futuro.

Calcular Modelo: La mayora de los Grids utilizar un clculo por lotes regulares

modelo, en el que un gestor de recursos local (LRM), tal como PBS, Cndor, SGE

gestiona los recursos informticos para un sitio de la red, y los usuarios envan

trabajos por lotes (a travs de GRAM) para solicitar alguna recursos durante algn

tiempo. Muchos Grids tienen polticas establecidas que hacen cumplir estos

trabajos por lotes para identificar al usuario y credenciales con las que el trabajo

tendr una duracin de contabilidad y fines de seguridad, el nmero de

procesadores necesarios, y el duracin de la asignacin. Por ejemplo, un trabajo

pudiera decir, la etapa en los datos de entrada de una direccin URL para el

almacenamiento local, ejecute el aplicacin durante 60 minutos a 100

procesadores, y organizar la resultados a algn servidor FTP. El trabajo sera

esperar en el LRM de esperar cola hasta los procesadores 100 estaban disponibles

para 60 minutos, momento en el que se asignaran los procesadores 100 y dedicada

a la solicitud de la duracin del trabajo.

Debido a las decisiones de planificacin caros, los datos en la estadificacin y

cabo, y, potencialmente, los tiempos de cola larga, muchos no lo hacen Grids

apoyar de forma nativa aplicaciones interactivas; aunque hay los esfuerzos de la

comunidad de cuadrcula para permitir latencias inferiores a recursos a travs de

la programacin de varios niveles, que permiten que las aplicaciones con muchas

tareas a corto funcionamiento para ejecutar de manera eficiente en Grids [40].

Modelo de computacin Cloud Computing probablemente ser muy diferente, con

recursos en la nube estn compartidos por todos los usuarios al mismo tiempo (en

contraste con recursos dedicados gobernados por un sistema de colas). Esto debera

permitir latencia sensibles aplicaciones funcionen de forma nativa en las nubes,

aunque garantizando un buen nivel suficiente de calidad de servicio se est

entregando a los usuarios finales no ser trivial, y probablemente ser una de las

principales desafos para el Cloud Computing como las Nubes crecen en escala, y

el nmero de usuarios.

Modelo de datos: Si bien algunas personas audazmente predican que el futuro

Informtica Internet ser hacia el Cloud Computing centralizado, en el que el

almacenamiento, computacin, y todo tipo de otros recursos principalmente

aprovisionar por la Nube, que imaginar que la prxima generacin de Internet

Informtica tomar el modelo de tringulo que se muestra en la Figura 4: Internet

Computacin voluntad centralizarse en torno datos, nublando Informtica, as

como Informtica Cliente. Cloud Computing y Client Computing coexistirn y

evolucionar de la mano, mientras que la gestin de datos (Cartografa, la particin,

de consulta, el movimiento, el almacenamiento en cach, replicacin, etc) ser

cada vez ms importante, tanto para

Cloud Computing y Computacin de cliente con el aumento de aplicaciones

intensivas de datos.

El papel fundamental de la computacin en nube es evidente, pero la importancia

de la informtica de cliente no puede ser pasado por alto o bien por varias razones:

1) Por razones de seguridad, las personas podran no estar dispuestos a ejecutar

aplicaciones de misin crtica en la Nube y enviar datos sensibles a la nube para el

procesamiento y almacenamiento; 2) Los usuarios desean obtener sus cosas por

hacer, incluso cuando el Internet y Cloud estn abajo o la comunicacin de red es

lento; 3) Con los avances de la tecnologa multi-ncleo, el prxima dcada traer

las posibilidades de tener un escritorio superordenador con 100s a 1000 de

hardware hilos / ncleos.

Adems, muchos usuarios finales tendrn diversas hardware -funcionalidades

extremo accionado, tales como la visualizacin y reproduccin multimedia, que

normalmente se ejecutar localmente.

Figura 4 El modelo de tringulo de la prxima generacin de Internet

Computacin.

La importancia de los datos ha llamado la atencin de la Red comunidad en la

ltima dcada; Datos Grids [10] han sido diseado especficamente para hacer

frente a aplicaciones de uso intensivo de datos en Entornos grid, con el concepto

de datos virtuales [22] juega un papel crucial. Datos virtual capta la relacin entre

los datos, los programas y los clculos y prescribe diversas abstracciones que una

cuadrcula de datos puede proporcionar: ubicacin la transparencia en que los datos

se pueden solicitar sin tener en cuenta ubicacin de los datos, un catlogo de

metadatos distribuido se dedica a mantener pista de la ubicacin de cada pieza de

datos (junto con su rplicas) a travs de los sitios de la red y el control de la

privacidad y el acceso son forzada; transparencia materializacin: datos puede ser

re- calculado sobre la marcha o transferido a peticin, dependiendo de la

disponibilidad de los datos y el costo para re-clculo.

Hay Tambin la transparencia representacin donde se pueden consumir datos y

producido sin importar sus formatos fsicos reales y almacenamiento estn, los

datos se asignan en algn estructural abstracta representacin y manipulado de esa

manera.

Datos Localidad: Como los ciclos de CPU se convierten en conjuntos de datos

ms barato y duplicar su tamao cada ao, el principal desafo para una eficiente

escalado de aplicaciones es la ubicacin de los datos relativos a la recursos

computacionales disponibles - que se mueven los datos repetidamente para CPUs

distantes se est convirtiendo en el cuello de botella. [46] Hay grandes diferencias

en las velocidades de IO de disco local almacenamiento para redes de rea amplia,

que puede afectar drsticamente rendimiento de las aplicaciones. Para lograr una

buena escalabilidad a Escalas de Internet para las nubes, Rejas, y sus aplicaciones,

datos deben ser distribuidos en muchos ordenadores, y clculos debe ser dirigido

hacia el mejor lugar para ejecutar con el fin de reducir al mnimo los costos de

comunicacin [46]. MapReduce de Google

[13] El sistema se ejecuta en la parte superior del sistema de archivos Google,

dentro que los datos se cargan, dividida en trozos, y cada trozo replicado. Por lo

tanto el procesamiento de datos se coubicarse con almacenamiento de datos:

cuando un archivo necesita ser procesada, el planificador de tareas consulta a un

servicio de metadatos de almacenamiento para obtener el nodo de host para cada

trozo, y despus programa un "mapa" proceso en ese nodo, por lo que los datos

localidad se explota de manera eficiente. En Rejas, almacenamiento de datos por

lo general se basa en un sistema de archivos compartidos (por ejemplo, NFS,

GPFS, PVFS, Luster), donde localidad de datos no se puede aplicar fcilmente. Un

enfoque es para mejorar programadores a ser consciente de datos, y para ser capaz

de apalancamiento localidad de datos informacin Cundo programacin tareas de

clculo; este enfoque ha demostrado que mejora el trabajo tiempo de vuelta de

manera significativa [41].

La combinacin de clculo y gestin de datos: An ms crtico es la

combinacin de la computacin y de datos de recursos gestin, que aprovecha la

localidad de datos de patrones de acceso para minimizar la cantidad de movimiento

de datos y mejorar End- rendimiento de las aplicaciones y la escalabilidad. El

intento de abordar el almacenamiento y problemas computacionales obliga

separado mucho movimiento de datos entre cmputo y almacenamiento recursos,

que no escalan a peta-escala de maana conjuntos de datos y millones de

procesadores y rendir significativa subutilizacin de los recursos primas. Es

importante programar tareas computacionales cerca de los datos, y para entender

los costos de mover el trabajo en lugar de en movimiento los datos. Programadores

de datos-aware y de dispersin de datos cerca de procesadores es fundamental para

lograr una buena escalabilidad y actuacin. Por ltimo, como el nmero de ncleos

de procesador es aumentando (las supercomputadoras ms grandes hoy en da

tienen ms de 200K procesadores y Rejillas superando 100K procesadores), hay

una nfasis cada vez mayor de apoyo de alto rendimiento la computacin con altas

tasas de expedicin y ejecucin sostenibles.

Creemos que las arquitecturas de gestin de datos son importantes para asegurar

que las implementaciones de gestin de datos escalan a los tamaos de conjuntos

de datos requeridos en el nmero de archivos, objetos y conjunto de datos de uso

de espacio en disco, mientras que al mismo tiempo, asegurando que informacin

de elemento de datos se puede recuperar con rapidez y eficacia. Rejillas han estado

haciendo avances en la combinacin de clculo y gestin de datos con los

programadores para datos [41], pero nosotros creen que las nubes se enfrentarn a

retos importantes en el manejo aplicaciones intensivas de datos sin grandes

esfuerzos invertidos en el aprovechamiento de la localidad de datos de patrones de

acceso de la aplicacin. Aunque las aplicaciones intensivas de datos pueden no ser

tpicos Nubes aplicaciones que tienen que ver con la actualidad, como las escalas

de Nubes crecen, puede ser slo una cuestin de tiempo para muchas nubes.

Virtualizacin: La virtualizacin se ha convertido en un elemento indispensable

ingrediente para casi todos Nube, las razones ms obvias son para la abstraccin y

la encapsulacin. Apenas eran las discusiones como introducido para proporcionar

a los usuarios la "ilusin", como si el ordenador corran todos los hilos

simultneamente, y cada hilo estaban utilizando todos los recursos disponibles, las

nubes tienen que ejecutar mltiples usuarios (o incluso hasta miles o millones de)

aplicaciones y todas las aplicaciones aparecen a los usuarios como si que estaban

corriendo al mismo tiempo y se poda utilizar todo el los recursos disponibles en

la nube. La virtualizacin proporciona la abstraccin necesario de tal manera que

el tejido subyacente (en bruto computacin, almacenamiento, recursos de red)

puede unificarse como una piscina

de los recursos y superposiciones de recursos (por ejemplo, servicios de

almacenamiento de datos, Entornos de hosting) web se puede construir encima de

ellos.

La virtualizacin tambin permite a cada aplicacin a encapsular de tal manera que

se pueden configurar, desplegado, comenzado, migran, suspendido, reanudado, se

detuvo, etc., y por lo tanto proporciona una mejor la seguridad, capacidad de

gestin, y el aislamiento.

Tambin hay muchas otras razones por las que las nubes tienden a adoptar

virtualizacin: 1) de servidores y aplicaciones de consolidacin, como varias

aplicaciones pueden ejecutarse en el mismo servidor, recursos puede ser utilizado

de manera ms eficiente; 2) configurabilidad, como la necesidades de recursos para

diversas aplicaciones podran diferir significativamente, algunos requieren gran

almacenamiento, algunos de cmputo, en Para configurar de forma dinmica y

paquete (agregado) recursos para diversas necesidades, la virtualizacin es

necesario ya que esto no se puede lograr a nivel de hardware; 3) aumento de la

disponibilidad de las aplicaciones, la virtualizacin permite la recuperacin rpida

de interrupciones no planificadas, como los entornos virtuales pueden ser copia de

seguridad y emigrado sin interrupcin en el servicio; 4) mayor capacidad de

respuesta: el aprovisionamiento de recursos, el seguimiento y el mantenimiento se

puede automatizar, y los recursos comunes pueden ser almacenado en cach y

reutilizada. Todas estas caractersticas de la virtualizacin servir de base para las

nubes para cumplir con estrictos SLA (Service Acuerdo de Nivel) requisitos en un

entorno de negocios, que no puede ser alcanzado fcilmente con un entorno no

virtualizado de una manera rentable como sistemas tendra que ser excesiva

aprovisionado de manejar carga y residuos recursos pico en ralent

perodos. Despus de todo, una infraestructura de virtualizacin puede ser slo

pensado como una asignacin de recursos de TI a las necesidades empresariales.

Las rejillas no se basan en la virtualizacin tanto como las nubes hacen, pero que

podran ser ms debido a la poltica y que tiene cada individuo organizacin

mantener el control total de sus recursos (es decir, por no la virtualizacin de

ellos). Sin embargo, hay esfuerzos en Grids para utilizar virtualizacin, as como

Nimbus [56] (anteriormente conocido como el Servicio de rea de trabajo virtual

[26]), que proporcionan la misma abstraccin y capacidades de despliegue

dinmicos. LA espacio de trabajo virtual es un entorno de ejecucin que puede ser

desplegado de forma dinmica y con seguridad en la Red. Nimbo proporciona dos

niveles de garantas: 1) la calidad de vida: los usuarios obtienen exactamente el

(software) medio ambiente que necesitan, y 2) la calidad de servicio: suministro y

garantizar todos los recursos de los espacio de trabajo necesita para funcionar

correctamente (CPU, memoria, disco, ancho de banda, disponibilidad), lo que

permite renegociacin dinmica para reflejar los cambios en los requisitos y

condiciones. Adicionalmente, Nimbus tambin puede aprovisionar un clster

virtual de la red aplicaciones (por ejemplo, un planificador de lote, o un sistema de

flujo de trabajo), que tambin es configurable de forma dinmica, una tendencia

creciente en Grid Computing.

Tambin vale la pena sealar que la virtualizacin - en el pasado tena las

prdidas de rendimiento significativas para algunas aplicaciones, que ha sido uno

de la desventaja principal de utilizar virtualizacin. Sin embargo, en los ltimos

aos, el procesador fabricantes como AMD e Intel han sido la introduccin de

soporte de hardware para virtualizacin, que est ayudando estrecha la diferencia

de rendimiento entre el rendimiento de las aplicaciones en virtualizado recursos ya

que se compara con el de las tradicionales sistemas operativos sin virtualizacin.

Monitoreo: Otro reto que la virtualizacin aporta a Las nubes es la dificultad

potencial en un control fino sobre el vigilancia de los recursos. Aunque muchos

Grids (como TeraGrid) tambin hacer cumplir las restricciones sobre qu tipo de

sensores o servicios de un usuario puede lanzar de larga duracin, el seguimiento

de la nube es no tan sencillo como en Rejas, Rejillas porque, en general, tener un

modelo de confianza diferente en el que los usuarios a travs de su identidad

delegacin puede acceder y navegar por los recursos a diferentes Cuadrcula sitios

y recursos grid no son muy abstrados y virtualizado como en las nubes; por

ejemplo, los ganglios [25] distribuye (y jerrquico) sistema de monitoreo puede

supervisar un federacin de clusters y Grids y ha visto una amplia adopcin en la

comunidad de cuadrcula. En una nube, diferentes niveles de servicios se puede

ofrecer a un usuario final, el usuario slo se expone a un pre- API definida, y los

recursos de nivel inferior son opacos a la usuario (especialmente a nivel PaaS y

SaaS, aunque algunos proveedores pueden optar por exponer la informacin de

monitoreo en estos niveles). El usuario no tiene la libertad para desplegar su propia

infraestructura de monitoreo, y la limitada informacin devuelto al usuario no

puede proporcionar el nivel necesario de detalles de ella para averiguar cul es el

estado de los recursos es. Los potencialmente existen mismos problemas para los

desarrolladores de la nube y administradores, ya que los recursos abstractos /

unificadas suelen ir a travs de la virtualizacin y algn otro nivel de

encapsulacin, y el seguimiento de los problemas para entrar por el software /

hardware de pila podra ser ms difcil. Monitoreo Esencialmente en nubes

requiere un delicado equilibrio de la monitorizacin de aplicaciones de negocio, la

administracin de servidores de la empresa, el seguimiento de la mquina virtual,

y mantenimiento de hardware, y ser un reto importante para Cloud Computing

que considere la adopcin y despliegues ms amplio.

Por otra parte, la vigilancia puede argumentar a ser menos importante en las nubes,

ya que los usuarios interactan con una ms capa abstracta que es potencialmente

ms sofisticado; este capa abstracta podra responder a las fallas y calidad del

servicio (QoS) de forma automtica en una forma de propsito general

independientemente de la lgica de aplicacin. En un futuro prximo, el usuario

final monitoreo podra ser un reto importante para las nubes, pero se vuelven

menos importantes como las nubes se vuelven ms sofisticado y ms auto-

mantenido y auto-sanacin.

Procedencia: Procedencia refiere a la historia de la derivacin de un producto de

datos, incluyendo todas las fuentes de datos, los datos intermedia productos, y los

procedimientos que se aplicaron para producir el producto de datos. Procedencia

informacin es de vital importancia en la comprensin, descubrir, validar y

compartir un producto de datos fiables como as como las aplicaciones y

programas utilizados para obtener la misma. En algunas disciplinas, como las

finanzas y la medicina, tambin es obligatoria para proporcionar lo que se llama

una "auditora" de propsito audicin. En Rejas, gestin de procedencia ha sido en

general, integrado en un sistema de flujo de trabajo, desde principios de los

pioneros como quimera [22], a los sistemas de flujo de trabajo cientficos

modernos, tales como Swift [53], Kepler [35], y ver [34] para apoyar la

descubrimiento y la reproducibilidad de los resultados cientficos. Tambin tiene

ha construido como un servicio independiente, como Preserv [29], para facilitar la

integracin de los componentes de procedencia en ms modelos informticos

generales y trato con problemas de confianza en afirmacin de

procedencia. Utilizando la informacin de procedencia, los cientficos puede

depurar la ejecucin del flujo de trabajo, validar o invalidar cientfica los resultados

y orientar el diseo de flujo de trabajo futuro y la exploracin de datos.

Mientras procedencia ha demostrado por primera vez su promesa en la cientfica

sistemas de flujo de trabajo [22] y los sistemas de bases de datos [47], un largo

plazo visin es que procedencia ser til en otros sistemas como as, lo que exige

el desarrollo de un estndar, abierto, y representacin universal y el modelo de

consulta. Actualmente, la serie reto procedencia [39] y la procedencia abierta

iniciativa modelo [38] proporcionar los foros activos de stos esfuerzo de

estandarizacin y la interaccin. Por otra parte,

Las nubes estn convirtiendo en el patio de recreo de futuro para la e-ciencia la

investigacin y la gestin de procedencia es muy importante con el fin de realizar

un seguimiento de los procesos y apoyar la reproducibilidad de los resultados

cientficos [45]. Procedencia sigue siendo un rea inexplorada en entornos de nube,

en la que tenemos que lidiar con incluso cuestiones ms difciles, como la

produccin de datos de seguimiento a travs de diferentes proveedores de servicios

(con diferente plataforma la visibilidad y el acceso polticas) ya travs de diferentes

programas y hardware capas de abstraccin dentro de un solo proveedor. En otro

Es decir, la captura y gestin de procedencia en la nube entornos pueden llegar a

ser ms difcil que en Rejas, ya que en este ltimo ya hay unos sistemas de

procedencia y las iniciativas, consulta procedencia embargo escalable [55] y

acceso seguro de la informacin de procedencia siguen abiertas problemas tanto

para los Grids y entornos nubes.

2.4 Programacin Modelo Aunque el modelo de programacin en entornos de cuadrcula no difieren

fundamentalmente de forma paralela tradicional y distribuido ambientes,

obviamente complica por cuestiones como la mltiples dominios

administrativos; grandes variaciones en los recursos heterogeneidad, la estabilidad

y el rendimiento; manejo de excepciones en altamente dinmico (en que los

recursos pueden unirse y dejar bastante tanto en cualquier momento) ambientes,

etc. rejillas apuntar principalmente clculos cientficos a gran escala, por lo que

deben escalar para aprovechar gran nmero / cantidad de recursos, y nosotros

tambin lo hara naturalmente, quieren hacer que los programas se ejecutan rpido

y eficiente en la red ambientes y programas tambin deben terminar correctamente,

por lo fiabilidad y tolerancia a fallos deben ser considerados.

Nosotros discutimos brevemente aqu algunos modelos de programacin generales

Grids. MPI (Message Passing Interface) [36] es el ms modelo de programacin

de uso general en computacin paralela, en que un conjunto de tareas utilizan su

propia memoria local durante computacin y comunicacin mediante el envo y

recepcin mensajes. MPICH-G2 [32] es una implementacin de red habilitado de

MPI. Da la interfaz familiar de MPI mientras que proporciona integracin con el

Globus Toolkit. Lenguas de coordinacin tambin permitir que un nmero de

componentes posiblemente heterogneos a comunicarse e interactuar, ofreciendo

facilidades para la especificacin, la interaccin y la composicin dinmica de

distribuidos componentes (concurrentes). Por ejemplo, Linda [1] define un

conjunto de primitivas de coordinacin para poner y recuperar tuplas de un espacio

de datos compartida llamado el espacio de tuplas . Tiene ha demostrado que es

fcil de usar tales primitivas a implementar un programador paralelo maestro-

trabajador. La Novena-G GridRPC [37] sistema integra una red de RPC (Remote

Procedure Call) capa en la parte superior de la caja de herramientas

Globus. Publica interfaces y libreras de funciones en MDS, y utiliza GRAM para

invocar ejecutables remotas. En Rejas, sin embargo, muchos aplicaciones estn

dbilmente acoplados en que la salida de uno puede ser pasado como entrada a uno

o ms otros, por ejemplo, como una presentar, oa travs de una invocacin de

servicios web. Mientras que tales "en trminos generales "clculos acoplados

pueden implicar grandes cantidades de computacin y comunicacin, las

preocupaciones de la programador tienden a ser diferentes de los de alta tradicional

computing rendimiento, siendo enfocada en temas de gestin en relacin con el

gran nmero de conjuntos de datos y tareas en lugar de la optimizacin de la

comunicacin interprocessor. De tal casos, los sistemas de flujo de trabajo [54] se

adapte mejor en la especificacin y la ejecucin de este tipo de aplicaciones. Ms

especficamente, una sistema de flujo de trabajo permite que la composicin del

individuo (single paso) componentes en un grafo de dependencias complejo, y

regula el flujo de datos y / o control a travs de estos componentes. Un ejemplo es

el sistema Swift [53], que puentes flujos de trabajo cientfico con la computacin

paralela. Es un herramienta de programacin paralela para la especificacin rpida

y fiable, ejecucin y gestin de la ciencia a gran escala y los flujos de trabajo de

ingeniera. El sistema de ejecucin Swift se basa en la CoG Karajan [33] motor de

flujo de trabajo para la planificacin eficiente y el equilibrio de carga, y se integra

el ligero Falkon servicio de ejecucin de la tarea para un rendimiento optimizado

y la tarea eficiencia de los recursos [40]. WSRF (Web Services Recursos Marco)

ha surgido de OGSA (Open Grid Service Arquitectura) [11] a medida que ms y

ms aplicaciones de rejilla estn desarrollado como servicios. WSRF Web Services

permite a convertirse estado, y proporciona un conjunto de operaciones para

establecer y recuperar los estados (recursos). La versin Globus Toolkit 4 contiene

Java y C implementaciones de WSRF, la mayora de la Globus servicios bsicos

se han rediseado para construir alrededor WSRF, stos por completo permitirn

orientada a servicios de programacin de cuadrcula modelo.

MapReduce [13] sin embargo, slo es otra programacin paralela modelo, que

proporciona un modelo de programacin y sistema de ejecucin para el

procesamiento de grandes conjuntos de datos, y se basa en una simple modelar con

slo dos funciones clave: "mapa" y "reducir" tomado de los lenguajes

funcionales. Se aplica la funcin de mapa una operacin especfica a cada uno de

un conjunto de elementos, produciendo un nuevo conjunto de elementos; una

funcin realiza reducir la agregacin de un conjunto de artculos. El sistema de

ejecucin automtica MapReduce Los horarios de las particiones de datos de

entrada y la ejecucin de los programas en un gran grupo de mquinas de productos

bsicos. El sistema est compuesto quejar tolerante comprobando peridicamente

nodos de trabajo y reasignacin de tareas fallidas a otros nodos de trabajo. Sawzall

es una lenguaje interpretado que se basa en MapReduce y separa las fases de

filtrado y agregacin para el programa ms conciso especificacin y mejor

paralelizacin. Hadoop [30] es el implementacin de cdigo abierto del modelo

MapReduce y cerdo es un lenguaje de programacin declarativa ofreci en la parte

superior de la Hadoop. Microsoft ha desarrollado el Cosmos distribuidos sistema

de almacenamiento y procesamiento marco Dryad y ofertas DryadLINQ [31] y

alcance como modelo de programacin declarativa en la parte superior de la

infraestructura de almacenamiento y computacin. DryadLINQ utiliza la sintaxis

orientada a objetos consulta LINQ donde mbito de aplicacin proporciona a los

operadores bsicos similares a los de SQL tales como Seleccionar, Ingreso,

agregacin, etc., tanto en traducir lo abstracto especificacin en el plan de

ejecucin detallado.

De scripting y Mesh-up (Java Script, PHP, Python, etc) tienen estado tomando el

lugar de un sistema de flujo de trabajo en el mundo de la nube, ya que no hay

manera fcil de integrar los servicios y aplicaciones de diferentes proveedores. Son

esencialmente los datos la integracin se acerca, porque toman las salidas de un

servicio / aplicacin, transformarlos y alimentar a otro. Google App Engine utiliza

un tiempo de ejecucin de Python modificado y elige Python lenguaje de scripting

para la aplicacin web el desarrollo, la interfaz para su almacenamiento BigTable

subyacente sistema es un lenguaje de consulta de propiedad (con nombre, como

usted pensara, GQL) es una reminiscencia de SQL, aunque todos stos

probablemente cambiarn. Nubes (como Amazon Web Servicios, Servicios Azure

Platform de Microsoft) tienen en general adoptadas API de servicios Web, donde

el acceso a los usuarios, configurar y los servicios del programa de la nube usando

APIs predefinidos expuestos como Servicios Web y HTTP y SOAP son los

protocolos comunes elegido para tales servicios. Aunque Nubes adoptaron algunos

protocolos de comunicacin comunes, tales como HTTP y SOAP, la integracin y

la interoperabilidad de todos los servicios y aplicaciones siguen siendo el mayor

desafo, ya que los usuarios necesitan para aprovechar en una federacin de nubes

en lugar de un nico proveedor de la nube.

2.5 Solicitud de Modelo Rejillas generalmente apoyan muchos tipos diferentes de aplicaciones, que van

desde la informtica de alto rendimiento (HPC) de alta informtica rendimiento

(HTC). Aplicaciones HPC son eficientes en la ejecucin de trabajos paralelos

fuertemente acoplados dentro de un particular, mquina con interconexiones de

baja latencia y generalmente no son ejecutada a travs de una amplia red de red de

rea; estas aplicaciones suelen utilizar Message Passing Interface (MPI) para

lograr el comunicacin entre procesos necesarios. Por otro lado, las redes Tambin

han tenido gran xito en la ejecucin de manera ms flexible aplicaciones

acopladas que tienden a ser gestionados y ejecutados a travs de sistemas de flujo

de trabajo u otro complejo y sofisticado aplicaciones. En cuanto a las aplicaciones

de HTC dbilmente acoplados naturaleza, hay otras clases de la aplicacin, tales

mltiple Programa de mltiples datos (MPMD), MTC, capacidad de clculo, utility

computing, y vergonzosamente paralelas, cada una con su propios nichos

[42]. Estas aplicaciones dbilmente acoplados pueden ser compuesta de muchas

tareas (tanto independientes como dependientes tareas) que se pueden programar

individualmente en muchos diferentes los recursos informticos a travs de

mltiples fronteras administrativas para lograr alguna meta aplicacin ms

grande. Las tareas pueden ser pequeos o grande, monoprocesador o

multiprocesador, compute-intensivo o gran volumen de datos. El conjunto de

tareas puede ser esttica o dinmica, homogneo o heterogneo, sin apretar o

estrechamente acoplado.

El nmero total de tareas, cantidad de la informtica, y volmenes de datos podran

ser pequea, pero tambin extremadamente grande. Por otro lado, la computacin

en nube podra en principio abastezca a un conjunto similar de aplicaciones. La

nica excepcin que se har probablemente ser difcil de lograr en el Cloud

Computing (pero ha tenido mucho xito en Grids) son aplicaciones HPC que

requieren rpida e interconexiones de redes de latencia bajos de la escala eficiente

muchos procesadores. Como Cloud Computing es todava en su infancia, las

aplicaciones que se ejecutarn en las nubes no estn bien definidos, pero sin duda

podemos caracterizar a ser imprecisa, orientado transaccin (pequeas tareas en el

orden de milisegundos de segundos), y es probable que ser interactivo (en

oposicin a por lotes programados, ya que se encuentran actualmente en Grids).

Otra clase emergente de las aplicaciones en las rejillas es cientfico puertas de

enlace [51], que son frontales a una variedad de aplicaciones que puede ser

cualquier cosa, desde dbilmente acoplado fuertemente acoplado.

Una puerta de enlace de la Ciencia es un conjunto desarrollado por la comunidad

de herramientas, las aplicaciones y los datos de las colecciones que se integran a

travs de un portal o un conjunto de aplicaciones. Gateways proporcionan acceso

a una variedad de capacidades, incluyendo los flujos de trabajo, la visualizacin,

servicios de descubrimiento de recursos y la ejecucin del trabajo a travs de un

interfaz de usuario basada en navegador (que sin duda puede ocultar mucho de la

complejidad). Gateways cientficos estn empezando a adoptar una amplia

variedad de tecnologas web 2.0, pero hasta la fecha, gran parte de los desarrollos

en cuadrculas y la Web 2.0 han sido realizado en paralelo con poca interaccin

entre ellos. Estas las nuevas tecnologas son importantes mejoras a los caminos

gateways interactan con los servicios y proporcionan ricos usuario

interactividad. Aunque las puertas de enlace cientficos slo han surgido en Grids

hace poco, las nubes parecen haber adoptado el uso de puertas de acceso a los

recursos de la nube casi exclusivamente para el usuario final interaccin. El

navegador y tecnologas Web 2.0 lo har sin duda, juegan un papel central en cmo

los usuarios interactan con Grids y nubes en el futuro.

2.6 Modelo de Seguridad

Nubes comprenden principalmente los centros de datos dedicados perteneciente a

de la misma organizacin, y dentro de cada centro de datos, hardware y

configuraciones de software y plataformas de apoyo estn en en general ms

homognea en comparacin con los de cuadrcula ambientes. Interoperabilidad

puede convertirse en un problema grave para centro de datos cruz, dominio de las

interacciones cruzadas administracin, imaginar el funcionamiento de su servicio

de contabilidad en Amazon EC2 mientras que sus otras operaciones de negocios

en la infraestructura Google. Grids sin embargo se basan en la suposicin de que

los recursos son heterognea y dinmica, y cada sitio de la red puede tener su

dominio de administracin propia y autonoma operacin. Por lo tanto, la

seguridad ha sido diseado en la cuadrcula fundamental infraestructura. Las

cuestiones clave que se consideran son: inicio de sesin nico, por lo que los

usuarios pueden iniciar sesin en una sola vez y tener acceso a mltiples Sitios de

cuadrcula, esto tambin facilitarn contabilidad y auditora; delegacin, por lo que

un programa puede ser autorizado a acceder recursos en nombre de un usuario y

que puede delegar a otra programas; la privacidad, la integridad y la segregacin,

los recursos perteneciente a un usuario no se puede acceder por no autorizada

usuarios, y no puede ser manipulado durante la transferencia; coordinado la

asignacin de recursos, reservas, y el intercambio, teniendo en consideracin de

ambas polticas globales y locales de uso de recursos.

La clave pblica basado (Infraestructura Red de Seguridad) GSI protocolos se

utilizan para la autenticacin, la comunicacin proteccin, y la

autorizacin. Adems, CAS (Comunidad Authorization Service) est diseado

para el recurso avanzada autorizacin dentro ya travs de las comunidades. Gruber

(A Cuadrcula Uso de recursos de SLA Broker) [14] es un ejemplo que tiene puntos

de aplicacin de la poltica de distribucin para hacer cumplir tanto locales

polticas de uso y SLAs globales (Service Level Agreement), que permite que los

recursos en los sitios individuales para ser eficiente compartida en mltiples sitios,

entornos multi-VO. Actualmente, el modelo de seguridad para las nubes parece ser

relativamente ms simple y menos seguro que el modelo de seguridad adoptada

por Grids. Infraestructura de nube generalmente se basan en formularios web (ms

de SSL) para crear y gestionar la informacin de cuenta para los usuarios finales,

y permite a los usuarios restablecer sus contraseas y recibir nueva contraseas a

travs de correos electrnicos en un inseguro y sin cifrar la comunicacin. Tenga

en cuenta que los nuevos usuarios podran utilizar Nubes con relativa facilidad y

casi al instante, con una tarjeta de crdito y / o direccin de correo electrnico. Para

contrastar esto, Grids son ms estrictas sobre su seguridad. Por ejemplo, aunque

los formularios web se utilizan para gestionar cuentas de usuario, informacin

sensible acerca de nuevas cuentas y contraseas requiere tambin una persona a

otra conversacin verificar que la persona, tal vez la verificacin de un

patrocinador persona que ya tiene una cuenta y contraseas slo sern por fax o

por correo, pero en ningn caso van a ser enviado por correo electrnico. El

enfoque de la red a la seguridad podra ser ms tiempo consumir, pero aade un

nivel adicional de seguridad para ayudar a

evitar el acceso no autorizado.

La seguridad es una de las mayores preocupaciones para la adopcin de

Computacin En La Nube. Nos esbozar siete riesgos de un usuario de la nube debe

plantear a los proveedores antes de comprometerse [6]: 1) el usuario privilegiado

Acceso: datos confidenciales procesados fuera de las necesidades de la empresa la

seguridad de que slo son accesibles y propagado a usuarios

privilegiados; 2) Cumplimiento de normas: a las necesidades del cliente para

verificar si un proveedor de nube tiene auditoras y seguridad exterior

certificaciones y si su infraestructura cumple con alguna requisitos de seguridad

reglamentarios; 3) la ubicacin de los datos: desde un cliente no sabr donde se

almacenarn sus datos, es importante que el proveedor de la nube se comprometen

a almacenar y el procesamiento de datos en jurisdicciones especficas y para

obedecer locales requisitos de privacidad en nombre del cliente; 4) Datos la

segregacin: uno tiene que asegurarse de que los datos de un cliente es totalmente

separados de los datos de otro cliente; 5) Recuperacin: se Es importante que el

proveedor de la nube tiene una replicacin eficiente y el mecanismo de

recuperacin para restaurar los datos en caso de desastre; 6)

Apoyo a la Investigacin: Servicios en la nube son especialmente difciles de

investigar, si esto es importante para un cliente, entonces tal apoyo debe

garantizarse con un compromiso contractual; y 7) la viabilidad a largo plazo: los

datos deben ser viables incluso el Proveedor de la nube es adquirida por otra

empresa.

3 Conclusiones y luces para el futuro

En este trabajo, se muestra que las nubes y Rejillas comparten una gran cantidad

comunalidad en su visin, la arquitectura y la tecnologa, pero tambin difieren en

varios aspectos como la seguridad, modelo de programacin, modelo de negocio,

modelo de clculo, los datos modelo, las aplicaciones y las abstracciones. Tambin

identificamos retos y oportunidades en ambos campos. Creemos que una estrecha

esa comparacin ya que esto puede ayudar a las dos comunidades comprender,

compartir y desarrollar la infraestructura y la tecnologa dentro y fuera, y acelerar

Cloud Computing desde temprano prototipos a los sistemas de produccin.

Qu nos depara el futuro? Vamos a aventurar algunas predicciones, basado en

nuestras creencias de que la economa de la computacin buscarn ms y ms

como los de la energa. Ni la energa ni la computar redes del maana se ver como

el de ayer red de energa elctrica. Ambos avanzar hacia una mezcla de micro

produccin y grandes empresas de servicios pblicos, con un nmero creciente de

los pequeos productores (elica, solar, biomasa, etc., para la energa; para la

informtica, las agrupaciones locales e incrustado en procesadores zapatos y

paredes) coexistiendo con gran escala regional productores y carga que se

distribuyen entre ellos de forma dinmica.

S, la informtica no es realmente como la electricidad, pero s creo que, sin

embargo vamos a ver la evolucin paralela, impulsada por fuerzas similares.

En la construccin de esta distribuida "nube" o "Grid", tendremos que apoyo

aprovisionamiento y configuracin de on-demand "Sistemas virtuales" integrados

que proporcionan las capacidades precisas es necesario por un usuario

final. Tendremos que definir protocolos que permiten a los usuarios y proveedores

de servicios para descubrir y mano de exige a otros proveedores, para monitorear

y administrar su reservas, y organizar el pago. Necesitaremos herramientas para

gestionar tanto los recursos subyacentes y la resultante clculos

distribuidos. Vamos a necesitar la escala centralizada de los servicios pblicos de

la nube de hoy, y la distribucin y la interoperabilidad de las instalaciones de la

cuadrcula de hoy.

Desafortunadamente, al menos hasta la fecha, los mtodos utilizados para lograr

estos objetivos en las nubes comerciales de hoy no han sido abiertos y de propsito

general, pero en su lugar ha sido en su mayora de propiedad y especializado para

los usos internos especficos (por ejemplo, datos a gran escala anlisis) de las

empresas que los desarrollan. La idea de que lo que se quiere permitir la

interoperabilidad entre los proveedores (como en la red de energa elctrica) an

no ha salido a la superficie. Cuadrcula tecnologas y protocolos hablan

precisamente a estas cuestiones, y debera ser considerado.

Algunos de los protocolos y herramientas necesarios procedern del gente

inteligente de la industria en Amazon, Google, Yahoo, Microsoft e IBM. Otros

vendrn de las personas inteligentes del mundo acadmico y del gobierno

laboratorios. Otros vendrn de los que crean lo que llamamos estas cosas despus

de cuadrcula y Cloud. Ser interesante ver en qu medida estos diferentes

comunidades logran encontrar una causa comn, o en su lugar continuar por

caminos paralelos.

cloud computing and g traducido

Documents

utility computing

cloud computing slo

computacin algn

nube informtica

open science grid

tierra grid system

trmino tambin

nueva necesidad