cloud computing and g traducido

23
Departamento de Ciencias de la Computación de la Universidad Estatal de Wayne, Detroit, MI, EE.UU. Resumen- Cloud Computing se ha convertido en otra palabra de moda después de la Web 2.0. Sin embargo, hay docenas de diferentes definiciones para la nube Informática y parece que hay consenso sobre qué es la nube. Por otro lado, la computación en nube no es un concepto completamente nuevo; tiene intrincada conexión a la relativamente nueva, pero trece años establecida paradigma Grid Computing, y otra correspondiente tecnologías como utility computing, computación en clúster, y sistemas distribuidos en general. En este trabajo se esfuerza por comparar y contrastar Cloud Computing con Grid Computing desde varios ángulos y dar una visión de las características esenciales de ambos. 1 100-Mile Información general Cloud Computing está insinuando un futuro en el que no lo haremos calcular en equipos locales, pero en instalaciones centralizadas operado por informáticos y de almacenamiento utilidades de terceros. Estamos seguros No se perderá el software empaquetado para desenvolver e instalar. Huelga decir que esto no es una idea nueva. De hecho, en 1961, informática pionero John McCarthy predicho que "Computación algún día puede ser organizado como un servicio público" - y pasó a especular cómo esto podría ocurrir. A mediados de 1990, el término de cuadrícula fue acuñado para describir tecnologías que permitan a los consumidores a obtener la informática el poder de la demanda. Ian Foster y otros postularon que por la estandarización de los protocolos utilizados para solicitar la potencia de cálculo, podríamos estimular la creación de un Grid Computing, análogo en forma y utilidad a la red de energía eléctrica. Investigadores posteriormente desarrollado estas ideas de muchas maneras emocionantes, producir, por ejemplo, sistemas federados a gran escala (TeraGrid, Open Science Grid, caBIG, EGEE, Tierra Grid System) que proporcionar energía no sólo la computación, sino también los datos y software, bajo demanda. Las organizaciones de normalización (por ejemplo, OGF, OASIS) normas pertinentes definidos. Más prosaicamente, el término también fue cooptados por la industria como un término de marketing para los clústeres. Pero no proveedores de grid computing comerciales viables surgieron, al menos No hasta hace poco. Así es el "Cloud Computing" sólo un nuevo nombre para la red? En tecnología de la información, donde las escalas de tecnología por una

Upload: harby-scanlux

Post on 03-Sep-2015

12 views

Category:

Documents


0 download

DESCRIPTION

Cloud Computing

TRANSCRIPT

  • Departamento de Ciencias de la Computacin de la Universidad Estatal de Wayne,

    Detroit, MI, EE.UU.

    Resumen- Cloud Computing se ha convertido en otra palabra de moda despus de

    la Web 2.0. Sin embargo, hay docenas de diferentes definiciones para la nube

    Informtica y parece que hay consenso sobre qu es la nube.

    Por otro lado, la computacin en nube no es un concepto completamente nuevo;

    tiene intrincada conexin a la relativamente nueva, pero trece aos establecida

    paradigma Grid Computing, y otra correspondiente tecnologas como utility

    computing, computacin en clster, y sistemas distribuidos en general. En este

    trabajo se esfuerza por comparar y contrastar Cloud Computing con Grid

    Computing desde varios ngulos y dar una visin de las caractersticas esenciales

    de ambos.

    1 100-Mile Informacin general Cloud Computing est insinuando un futuro en el que no lo haremos calcular en

    equipos locales, pero en instalaciones centralizadas operado por informticos y de

    almacenamiento utilidades de terceros. Estamos seguros No se perder el software

    empaquetado para desenvolver e instalar.

    Huelga decir que esto no es una idea nueva. De hecho, en 1961, informtica

    pionero John McCarthy predicho que "Computacin algn da puede ser

    organizado como un servicio pblico" - y pas a especular cmo esto podra

    ocurrir.

    A mediados de 1990, el trmino de cuadrcula fue acuado para describir

    tecnologas que permitan a los consumidores a obtener la informtica el poder de

    la demanda. Ian Foster y otros postularon que por la estandarizacin de los

    protocolos utilizados para solicitar la potencia de clculo, podramos estimular la

    creacin de un Grid Computing, anlogo en forma y utilidad a la red de energa

    elctrica. Investigadores posteriormente desarrollado estas ideas de muchas

    maneras emocionantes, producir, por ejemplo, sistemas federados a gran escala

    (TeraGrid, Open Science Grid, caBIG, EGEE, Tierra Grid System) que

    proporcionar energa no slo la computacin, sino tambin los datos y software,

    bajo demanda. Las organizaciones de normalizacin (por ejemplo, OGF, OASIS)

    normas pertinentes definidos. Ms prosaicamente, el trmino tambin fue

    cooptados por la industria como un trmino de marketing para los clsteres. Pero

    no proveedores de grid computing comerciales viables surgieron, al menos

    No hasta hace poco. As es el "Cloud Computing" slo un nuevo nombre para la

    red? En tecnologa de la informacin, donde las escalas de tecnologa por una

  • orden de magnitud, y en el proceso se reinventa, cada cinco aos, no hay ninguna

    respuesta clara a estas preguntas. S: la visin es el mismo para reducir el costo de

    la computacin, aumentar la fiabilidad y aumentar la flexibilidad mediante la

    transformacin computadoras de algo que compramos y operamos nosotros a algo

    que es operado por un tercero.

    Pero no: las cosas son diferentes de lo que eran hace 10 aos. Tenemos una nueva

    necesidad de analizar los datos masivos, motivando as aumentado

    considerablemente la demanda de la informtica. Despus de haber realizado la

    beneficios de pasar de mainframes a las agrupaciones de las materias primas, nos

    encontramos con que esos grupos son bastante caros de operar. Nosotros tener la

    virtualizacin de bajo costo. Y, sobre todo, tenemos mltiples miles de millones

    de dlares gastados por los gustos de Amazon, Google, y Microsoft para crear

    sistemas de bienes comerciales a gran escala que contiene cientos de miles de

    ordenadores. El prospecto de necesitar solamente una tarjeta de crdito para

    obtener acceso bajo demanda a 100.000 computadoras en decenas de centros de

    datos distribuidos todo el mundo de recursos que pueden aplicar a problemas con

    masiva de datos, potencialmente distribuido, es emocionante! As que se opera a

    una escala diferente, y operando a estos nuevos, ms escalas masivas pueden exigir

    fundamentalmente diferente enfoques para abordar los problemas. Tambin

    permite -en realidad es a menudo slo es aplicable a-totalmente nuevos problemas.

    Sin embargo, s: los problemas son en su mayora los mismos en las nubes y

    Grids. Hay una necesidad comn de ser capaces de gestionar grandes

    instalaciones; para definir los mtodos por los cuales los consumidores descubren,

    peticin, y utilizar los recursos proporcionados por las instalaciones centrales; y

    poner en prctica los clculos a menudo altamente paralelos que ejecutar en esos

    recursos. Detalles difieren, pero los dos las comunidades estn luchando con

    muchos de los mismos problemas.

    Definicin de Cloud Computing Hay poco consenso sobre cmo definir la nube [49]. Nosotros aadir otra

    definicin a la lista ya saturada de definiciones para Cloud Computing:

    Un paradigma de computacin distribuida a gran escala que es impulsada por las

    economas de escala, en la que un grupo de abstrada, virtualizado,

    dinmicamente escalable, logr el poder de computacin, almacenamiento,

    plataformas y servicios son entregado en la demanda de los clientes externos sobre

    el Internet.

  • Hay algunos puntos clave en esta definicin. En primer lugar, la nube Computing

    es un paradigma de computacin distribuida especializado; eso difiere de las

    tradicionales en que 1) es masivamente escalable, 2) se pueden encapsular como

    una entidad abstracta que ofrece diferentes niveles de servicios a los clientes fuera

    de la Nube, 3) es impulsada por las economas de escala [44], y 4) los servicios

    pueden ser configurado dinmicamente (a travs de la virtualizacin o otros

    enfoques) y se entregan bajo demanda.

    Los gobiernos, institutos de investigacin, y lderes de la industria son apresurarse

    a adoptar el Cloud Computing para solucionar su en constante aumento de los

    problemas de clculo y almacenamiento que surgen en el Era de Internet. Hay tres

    factores principales que contribuyen a la sobretensiones y los intereses en Cloud

    Computing: 1) disminucin rpida de la costo de hardware y aumento de la

    potencia de computacin y almacenamiento la capacidad, y el advenimiento de la

    arquitectura multi-core y moderno supercomputadoras que consisten en cientos de

    miles de ncleos;

    2) el crecimiento exponencial en el tamao de los datos cientficos instrumentacin

    / simulacin y publicacin en Internet y archivado; y 3) la adopcin extendida de

    Servicios Informtica y aplicaciones Web 2.0.

    Nubes, Sistemas Grids y Distribuidos Muchos lectores exigentes dar cuenta de inmediato de que nuestro

    definicin de Cloud Computing se superpone con muchos existente tecnologas,

    como Grid Computing, Utilidad de Computacin, Servicios de Informtica y

    computacin distribuida en general. Nosotros argumentan que la computacin en

    nube no slo se solapa con cuadrcula Informtica, es de hecho evolucion a partir

    de Grid Computing y se basa en Grid Computing como su columna vertebral y la

    infraestructura apoyo. La evolucin ha sido el resultado de un cambio de enfoque

    de una infraestructura que proporciona almacenamiento y cmputo recursos (tal es

    el caso en Grids) a uno que es la economa based con el objetivo de ofrecer recursos

    y servicios ms abstractos (Como es el caso de nubes). En cuanto a la utilidad

    Computing, no es un nuevo paradigma de la infraestructura informtica; ms bien,

    es una modelo de negocio en el que los recursos informticos, como cmputo y

    almacenamiento, se empaquetan como servicios medidos similar a un servicio

    pblico fsico, como la electricidad y el red telefnica pblica conmutada. Utility

    computing es normalmente implementado usando otra infraestructura informtica

    (Por ejemplo, Grids) con servicios de contabilidad y de control adicionales.

  • Una infraestructura de la nube puede ser utilizada internamente por una empresa o

    expuesto al pblico como utility computing. Ver Figura 1 para una visin general

    de la relacin entre

    Nubes y otros dominios que se superponga con. Web 2.0 cubre casi todo el espectro

    de servicios orientados a aplicaciones en las que la computacin en nube se

    encuentra en la gran escala lado. Supercomputacin y Computacin Cluster han

    sido ms centrado en aplicaciones que no son de servicio tradicionales. Cuadrcula

    Computing se solapa con todos estos campos donde es generalmente considerada

    de menor escala que las supercomputadoras y nubes.

    Figura 1: Grids y nubes Informacin general Grid Computing pretende "activar el uso compartido de recursos y problema

    coordinada de problemas en dinmica, multi-institucional organizaciones virtuales

    "[18] [20]. Hay tambin unos pocos clave caractersticas a esta definicin: En

    primer lugar, las redes de proporcionar una paradigma de la computacin

    distribuida o infraestructura que abarca a travs de mltiples organizaciones

    virtuales (VO), donde cada uno puede VO constituido, o bien instituciones

    distribuidas fsica o lgicamente relacionados con proyectos / grupos. El objetivo

    de este paradigma es habilitar el uso compartido de recursos federada en dinmico,

    distribuido ambientes. El enfoque adoptado por el estndar de facto aplicacin - El

    Globus Toolkit [16] [23], es la construccin de un entorno informtico uniforme

    de diversos recursos por la definicin de protocolos de red estndar y proporcionar

    middleware para mediar el acceso a una amplia gama de recursos heterogneos.

    Globus aborda diversos temas como la seguridad, los recursos descubrimiento, el

    aprovisionamiento de recursos y gestin, trabajo programacin, seguimiento y

    gestin de datos.

    Hace media dcada, Ian Foster, dio una lista de control de tres puntos [19] para

    ayudar a definir lo que es, y lo que no es un Grid: 1) las coordenadas recursos que

    no estn sujetos a un control centralizado, 2) utiliza estndar,, protocolos e

    interfaces de propsito general abiertos, y 3) ofrece cualidades no triviales de

    servicio. Aunque el punto 3 contiene cierto para Cloud Computing, ni el punto 1,

    ni el punto 2 es claro que es el caso para las nubes de hoy en da. La visin de las

    nubes y Grids son similares, los detalles y las tecnologas utilizadas pueden ser

    diferentes, pero las dos comunidades estn luchando con muchos de los mismos

    cuestiones. En este trabajo se esfuerza por comparar y contrastar la nube

    Informtica con Grid Computing desde varios ngulos y dar conocimientos sobre

    las caractersticas esenciales de ambos, con la esperanza para pintar un panorama

    menos nublado de lo que son las nubes, qu tipo de aplicaciones pueden Nubes

    esperar para apoyar, y cules son los desafos

  • Nubes tendrn que hacer frente en los prximos aos a medida que adquieren

    impulso y adopcin. Esperamos que esto ayudar tanto comunidades obtienen una

    comprensin ms profunda de los objetivos, supuestos, el estado y las direcciones,

    y proporcionar una mayor vista detallada de ambas tecnologas para el pblico

    general.

    2 Comparando Grids y nubes Side-by-Side

    Esta seccin tiene como objetivo comparar Grids y nubes en un amplio variedad

    de perspectivas, desde la arquitectura, modelo de seguridad, modelo de negocio,

    modelo de programacin, la virtualizacin, los datos modelo, modelo de clculo,

    a la procedencia y aplicaciones. Nosotros tambin esbozar una serie de retos y

    oportunidades que la red Informtica y Cloud Computing aportar a los

    investigadores y el Industria de TI, ms comn a ambos, pero algunos son

    especficos para uno o el otro.

    2.1

    Modelo de Negocio Modelo de negocio tradicional de software ha sido una sola vez pago por uso

    ilimitado (por lo general en 1 equipo) de la software. En un modelo de negocio

    basado en la nube, un cliente pagar el proveedor sobre una base de consumo, muy

    parecido a la utilidad compaas cobran por los servicios pblicos bsicos, como

    la electricidad, el gas, y agua, y el modelo se basa en economas de escala con el

    fin de bajar los precios para los usuarios y las ganancias hasta para los

    proveedores. Hoy en da, Amazon ofrece esencialmente una nube centralizada que

    consiste en Compute Cloud EC2 y S3 nube de datos. El primero es pagan en base

    a por instancia horas consumidas por cada tipo de instancia y la tarde se pagan

    directamente por GB-mes de almacenamiento utilizado. Adems, la transferencia

    de datos se cobra por TB / la transferencia de datos por mes, dependiendo de la

    fuente y el destino de dicha transferencia. La perspectiva de que slo necesitan una

    tarjeta de crdito para obtener acceso bajo demanda a 100.000 procesadores en

    decenas de datos centros distribuidos por todo el mundo-recursos fcticos aplicada

    a problemas con los datos masivos, potencialmente distribuidos, es emocionante!

    El modelo de negocio para Grids (al menos la que se encuentra en el mundo

    acadmico o laboratorios del gobierno) es orientado a los proyectos en los que los

    usuarios o comunidad representada por esa propuesta tiene cierto nmero de

    unidades de servicio (es decir, horas de CPU) que pueden gastar. Por ejemplo, el

    TeraGrid opera de esta manera, y requiere cada vez ms propuestas complejas para

    ser escritos creciente nmero de potencia de clculo. El TeraGrid tiene ms de una

    docena

  • Sitios de cuadrcula, todas organizadas en diversas instituciones de todo el pas.

    Qu hace que una institucin quiere unirse a la TeraGrid? Cuando una institucin

    se une a la TeraGrid con un conjunto de recursos, sabe que otros en la comunidad

    pueden ahora utilizar estos recursos a travs del pas. Tambin reconoce el hecho

    de que gana acceso a una docena de otros sitios Grid. Este mismo modelo tiene

    trabajado bastante bien durante muchos Rejillas de todo el mundo, dando

    incentivos instituciones se unan varias rejillas para el acceso a recursos adicionales

    para todos los usuarios de la correspondiente institucin.

    Tambin hay esfuerzos para construir una economa de cuadrcula para un mundial

    Infraestructura Grid que apoya el comercio, la negociacin, aprovisionamiento, y

    la asignacin de recursos basado en los niveles de servicios prestados, riesgo y

    costo, y las preferencias de los usuarios; Hasta aqu, intercambio de recursos (por

    ejemplo, almacenamiento comercial para ciclos de clculo), subastas, la teora de

    coordinacin de recursos basado en juego, virtuales monedas, corredores e

    intermediarios de recursos, y varios

    Se han propuesto y aplicado en otros modelos econmicos la prctica [8].

    2.2 arquitectura

    Rejillas ubic a mediados de los aos 90 para hacer frente a gran escala problemas

    de clculo utilizando una red de intercambio de recursos mquinas de productos

    bsicos que proporcionan la potencia de clculo accesible solamente por los

    superordenadores y grandes grupos dedicados En ese tiempo. La principal

    motivacin era que stas alta recursos de computacin de rendimiento eran caros

    y difciles de tener acceso a, por lo que el punto de partida era utilizar federado

    recursos que podran comprender de cmputo, almacenamiento y redes recursos

    de mltiples instituciones distribuidas geogrficamente, y dichos recursos son

    generalmente heterognea y dinmica. Rejillas centran en la integracin de los

    recursos existentes, con su hardware, sistemas operativos, la gestin de los

    recursos locales, y infraestructura de seguridad.

    Con el fin de apoyar la creacin de la llamada "virtual Organizaciones ", una

    entidad lgica dentro de la cual distribuye los recursos pueden ser descubiertos y

    compartidos como si fueran de de la misma organizacin, Rejillas definir y

    proporcionar un conjunto de protocolos estndar, middleware, herramientas y

    servicios construidos sobre Adems de estos protocolos. La interoperabilidad y la

    seguridad son los las preocupaciones principales de la infraestructura Grid como

    recursos pueden provienen de diferentes dominios administrativos, que tienen

    tanto las polticas de uso de recursos globales y locales, hardware diferente y

    configuraciones de software y plataformas, y varan en disponibilidad y capacidad.

  • Rejillas proporcionan protocolos y servicios en cinco capas diferentes como

    identificado en la arquitectura de protocolo de cuadrcula (vase la Figura 2). En

    la capa de tejido, Grids proporcionar acceso a diferentes recursos tipos, tales como

    computacin, almacenamiento y recursos de red, cdigo repositorio, etc. Rejillas

    generalmente dependen de tejido existente componentes, por ejemplo,

    administradores de recursos locales (es decir, PBS [5], Condor [48],

    etc). Componentes de propsito general, como GARA (arquitectura general para

    la reserva avanzada) [17], y los servicios especializados de gestin de recursos

    tales como Falkon [40] (aunque estrictamente hablando, Falkon tambin

    proporciona servicios ms all de la capa de tejido).

    Figura 2: Red Protocolo de Arquitectura La capa de conectividad define la comunicacin ncleo y protocolos de

    autenticacin de red fcil y seguro transacciones. El (Infraestructura Red de

    Seguridad) GSI [27] protocolo subyace cada transaccin cuadrcula.

    La capa de recurso define protocolos para la publicacin, descubrimiento,

    negociacin, supervisin, contabilidad y pago de compartir operaciones sobre los

    recursos individuales. El GRAM (Grid Acceso de Recursos y Gestin) [16]

    protocolo se utiliza para asignacin de recursos computacionales y para el

    seguimiento y el control de la computacin en esos recursos, y GridFTP [2] para

    el acceso de datos y la transferencia de datos de alta velocidad.

    La capa colectiva capta las interacciones a travs de las colecciones de recursos,

    servicios de directorio, como MDS (Monitoreo y Servicio Discovery) [43] permite

    la supervisin y descubrimiento de recursos VO, Condor-G [24] y Nimrod-G [7]

    son ejemplos de co-se distribuyen, la programacin y la intermediacin servicios

    y MPICH [32] para activar la rejilla de programacin

    sistemas y CAS (servicio comunitario de autorizacin) [21] para polticas de

    recursos globales.

    La capa de aplicacin comprende cualesquiera que sean las aplicaciones de

    usuario construido en la cima de los protocolos y APIs anteriores y operar en VO

    ambientes. Dos ejemplos son los sistemas de flujo de trabajo de cuadrcula, y

    Portales grid (es decir Quarknet entorno de e-learning [52], Nacional Virtual

    Observatorio (Http://www.us-vo.org), TeraGrid Ciencia pasarela

    (http://www.teragrid.org)).

    Las nubes estn desarrollando para hacer frente a la informtica a escala de Internet

    problemas en los que algunos supuestos son diferentes de las de el Grids. Las nubes

    se refieren generalmente como un gran nmero de informticos y / o

    almacenamiento de los recursos, que se puede acceder a travs de protocolos

    http://www.us-vo.org/http://www.teragrid.org)/
  • estndar a travs de una interfaz abstracta. Las nubes pueden ser construido en la

    cima de muchos protocolos existentes, como Servicios Web (WSDL, SOAP), y

    algunas avanzadas tecnologas Web 2.0 tales como el descanso, RSS, AJAX, etc.

    De hecho, detrs de la cubierta, es posible que las nubes que se aplicarn sobre red

    existente tecnologas que aprovechan ms de una dcada de la comunidad

    esfuerzos en la normalizacin, la seguridad, la gestin de recursos, y soporte de

    virtualizacin. Tambin hay varias versiones de definicin para la nube

    arquitectura, definimos una arquitectura de cuatro capas de la nube Computing en

    comparacin con la arquitectura de la red, compuesta de 1) la tela, 2) recursos

    unificado, 3) plataforma, y 4) la aplicacin

    Capas.

    Figura 3: Arquitectura de la nube La capa de tejido contiene los recursos a nivel de hardware en bruto, tales como

    los recursos informticos, recursos de almacenamiento y de red recursos. La capa

    de recursos unificada contiene recursos que han sido resumidas / encapsulado

    (generalmente por la virtualizacin) de modo que puedan estar expuestos a los

    usuarios de la capa y de extremo superior como integrada de los recursos, por

    ejemplo, un ordenador / cluster virtual, un sistema de archivo lgico, un sistema

    de base de datos, etc. La capa de plataforma aade en una coleccin de

    herramientas especializadas, middleware y servicios en la parte superior de los

    recursos unificadas para proporcionar una desarrollo y / o plataforma de

    despliegue. Por ejemplo, un Web medio ambiente, un servicio de programacin,

    etc. hospedaje ltimo, el capa de aplicacin contiene las aplicaciones que se

    ejecutan en las nubes.

    Nubes en general ofrecen servicios en tres niveles diferentes

    (IaaS, PaaS y Saas [50]) de la siguiente manera, aunque algunos los proveedores

    pueden optar por exponer servicios en ms de un nivel. Infraestructura como

    Servicio (IaaS) de hardware [50] disposiciones, software y equipos (sobre todo en

    la capa recurso unificado, pero tambin puede incluir la parte de la capa de tejido)

    para entregar software entornos de aplicaciones con una fijacin de precios basada

    en el uso de recursos modelo. Infraestructura puede escalar hacia arriba y abajo de

    forma dinmica basado en las necesidades de recursos de aplicacin. Ejemplos

    tpicos son Amazon EC2 (Elastic Cloud Computing) Servicio [3] y S3 (Simple

    Storage Service) [4], donde cmputo y almacenamiento infraestructuras estn

    abiertas al acceso pblico con un pago por uso modelo; Eucalyptus [15] es un

    cdigo abierto Nube aplicacin que proporciona una interfaz compatible para EC2

    de Amazon, y permite a las personas para establecer una nube infraestructura en

    premisa y experimentar antes de comprar servicios comerciales.

  • Plataforma como servicio (PaaS) [50] ofrece un alto nivel entorno integrado para

    construir, probar y desplegar personalizada aplicaciones. En general, los

    desarrolladores tendrn que aceptar algunas restricciones sobre el tipo de software

    que pueden escribir a cambio para una funcin de escalabilidad de la

    aplicacin. Un ejemplo es la de Google App Engine [28], que permite a los

    usuarios construir Web aplicaciones en los mismos sistemas escalables que poder

    Google aplicaciones.

    Software como Servicio (SaaS) [50] proporciona para fines especiales software que

    es accesible de forma remota por los consumidores a travs de la Internet con un

    modelo de precios basado en el uso. Salesforce es una lder de la industria en el

    suministro de CRM en lnea (Cliente Relationship Management) Servicios. Live

    Mesh de Microsoft permite que los archivos y carpetas que se comparten y

    sincronizado a travs de mltiples dispositivos. Aunque las nubes proporcionan

    servicios en tres niveles diferentes (IaaS, PaaS y SaaS), normas para las interfaces

    a estas diferentes niveles an no se han definido. Esto lleva a problemas de

    interoperabilidad entre nubes de hoy en da, y no hay pocos incentivos comerciales

    para los proveedores de la nube para invertir recursos adicionales en la definicin

    e implementacin nueva interfaces. Como Nubes maduran, y ms sofisticados

    aplicaciones y servicios surgir que requieren el uso de mltiples nubes, habr cada

    vez ms incentivos para adoptar interfaces estndares que faciliten la

    interoperabilidad con el fin de capturar emergentes y crecientes mercados en una

    nube saturada mercado.

    2.3 Administracion De Recursos En esta seccin se describe el manejo de los recursos que se encuentra en Grids y

    nubes, que abarcan temas como el modelo de clculo, modelo de datos, la

    virtualizacin, la supervisin, y la procedencia. Estas los temas son muy

    importantes para entender la principal retos que a mbas Grids y nubes enfrentan

    hoy en da, y lo har que superar en el futuro.

    Calcular Modelo: La mayora de los Grids utilizar un clculo por lotes regulares

    modelo, en el que un gestor de recursos local (LRM), tal como PBS, Cndor, SGE

    gestiona los recursos informticos para un sitio de la red, y los usuarios envan

    trabajos por lotes (a travs de GRAM) para solicitar alguna recursos durante algn

    tiempo. Muchos Grids tienen polticas establecidas que hacen cumplir estos

    trabajos por lotes para identificar al usuario y credenciales con las que el trabajo

    tendr una duracin de contabilidad y fines de seguridad, el nmero de

    procesadores necesarios, y el duracin de la asignacin. Por ejemplo, un trabajo

    pudiera decir, la etapa en los datos de entrada de una direccin URL para el

    almacenamiento local, ejecute el aplicacin durante 60 minutos a 100

  • procesadores, y organizar la resultados a algn servidor FTP. El trabajo sera

    esperar en el LRM de esperar cola hasta los procesadores 100 estaban disponibles

    para 60 minutos, momento en el que se asignaran los procesadores 100 y dedicada

    a la solicitud de la duracin del trabajo.

    Debido a las decisiones de planificacin caros, los datos en la estadificacin y

    cabo, y, potencialmente, los tiempos de cola larga, muchos no lo hacen Grids

    apoyar de forma nativa aplicaciones interactivas; aunque hay los esfuerzos de la

    comunidad de cuadrcula para permitir latencias inferiores a recursos a travs de

    la programacin de varios niveles, que permiten que las aplicaciones con muchas

    tareas a corto funcionamiento para ejecutar de manera eficiente en Grids [40].

    Modelo de computacin Cloud Computing probablemente ser muy diferente, con

    recursos en la nube estn compartidos por todos los usuarios al mismo tiempo (en

    contraste con recursos dedicados gobernados por un sistema de colas). Esto debera

    permitir latencia sensibles aplicaciones funcionen de forma nativa en las nubes,

    aunque garantizando un buen nivel suficiente de calidad de servicio se est

    entregando a los usuarios finales no ser trivial, y probablemente ser una de las

    principales desafos para el Cloud Computing como las Nubes crecen en escala, y

    el nmero de usuarios.

    Modelo de datos: Si bien algunas personas audazmente predican que el futuro

    Informtica Internet ser hacia el Cloud Computing centralizado, en el que el

    almacenamiento, computacin, y todo tipo de otros recursos principalmente

    aprovisionar por la Nube, que imaginar que la prxima generacin de Internet

    Informtica tomar el modelo de tringulo que se muestra en la Figura 4: Internet

    Computacin voluntad centralizarse en torno datos, nublando Informtica, as

    como Informtica Cliente. Cloud Computing y Client Computing coexistirn y

    evolucionar de la mano, mientras que la gestin de datos (Cartografa, la particin,

    de consulta, el movimiento, el almacenamiento en cach, replicacin, etc) ser

    cada vez ms importante, tanto para

    Cloud Computing y Computacin de cliente con el aumento de aplicaciones

    intensivas de datos.

    El papel fundamental de la computacin en nube es evidente, pero la importancia

    de la informtica de cliente no puede ser pasado por alto o bien por varias razones:

    1) Por razones de seguridad, las personas podran no estar dispuestos a ejecutar

    aplicaciones de misin crtica en la Nube y enviar datos sensibles a la nube para el

    procesamiento y almacenamiento; 2) Los usuarios desean obtener sus cosas por

    hacer, incluso cuando el Internet y Cloud estn abajo o la comunicacin de red es

    lento; 3) Con los avances de la tecnologa multi-ncleo, el prxima dcada traer

  • las posibilidades de tener un escritorio superordenador con 100s a 1000 de

    hardware hilos / ncleos.

    Adems, muchos usuarios finales tendrn diversas hardware -funcionalidades

    extremo accionado, tales como la visualizacin y reproduccin multimedia, que

    normalmente se ejecutar localmente.

    Figura 4 El modelo de tringulo de la prxima generacin de Internet

    Computacin.

    La importancia de los datos ha llamado la atencin de la Red comunidad en la

    ltima dcada; Datos Grids [10] han sido diseado especficamente para hacer

    frente a aplicaciones de uso intensivo de datos en Entornos grid, con el concepto

    de datos virtuales [22] juega un papel crucial. Datos virtual capta la relacin entre

    los datos, los programas y los clculos y prescribe diversas abstracciones que una

    cuadrcula de datos puede proporcionar: ubicacin la transparencia en que los datos

    se pueden solicitar sin tener en cuenta ubicacin de los datos, un catlogo de

    metadatos distribuido se dedica a mantener pista de la ubicacin de cada pieza de

    datos (junto con su rplicas) a travs de los sitios de la red y el control de la

    privacidad y el acceso son forzada; transparencia materializacin: datos puede ser

    re- calculado sobre la marcha o transferido a peticin, dependiendo de la

    disponibilidad de los datos y el costo para re-clculo.

    Hay Tambin la transparencia representacin donde se pueden consumir datos y

    producido sin importar sus formatos fsicos reales y almacenamiento estn, los

    datos se asignan en algn estructural abstracta representacin y manipulado de esa

    manera.

    Datos Localidad: Como los ciclos de CPU se convierten en conjuntos de datos

    ms barato y duplicar su tamao cada ao, el principal desafo para una eficiente

    escalado de aplicaciones es la ubicacin de los datos relativos a la recursos

    computacionales disponibles - que se mueven los datos repetidamente para CPUs

    distantes se est convirtiendo en el cuello de botella. [46] Hay grandes diferencias

    en las velocidades de IO de disco local almacenamiento para redes de rea amplia,

    que puede afectar drsticamente rendimiento de las aplicaciones. Para lograr una

    buena escalabilidad a Escalas de Internet para las nubes, Rejas, y sus aplicaciones,

    datos deben ser distribuidos en muchos ordenadores, y clculos debe ser dirigido

    hacia el mejor lugar para ejecutar con el fin de reducir al mnimo los costos de

    comunicacin [46]. MapReduce de Google

    [13] El sistema se ejecuta en la parte superior del sistema de archivos Google,

    dentro que los datos se cargan, dividida en trozos, y cada trozo replicado. Por lo

    tanto el procesamiento de datos se coubicarse con almacenamiento de datos:

  • cuando un archivo necesita ser procesada, el planificador de tareas consulta a un

    servicio de metadatos de almacenamiento para obtener el nodo de host para cada

    trozo, y despus programa un "mapa" proceso en ese nodo, por lo que los datos

    localidad se explota de manera eficiente. En Rejas, almacenamiento de datos por

    lo general se basa en un sistema de archivos compartidos (por ejemplo, NFS,

    GPFS, PVFS, Luster), donde localidad de datos no se puede aplicar fcilmente. Un

    enfoque es para mejorar programadores a ser consciente de datos, y para ser capaz

    de apalancamiento localidad de datos informacin Cundo programacin tareas de

    clculo; este enfoque ha demostrado que mejora el trabajo tiempo de vuelta de

    manera significativa [41].

    La combinacin de clculo y gestin de datos: An ms crtico es la

    combinacin de la computacin y de datos de recursos gestin, que aprovecha la

    localidad de datos de patrones de acceso para minimizar la cantidad de movimiento

    de datos y mejorar End- rendimiento de las aplicaciones y la escalabilidad. El

    intento de abordar el almacenamiento y problemas computacionales obliga

    separado mucho movimiento de datos entre cmputo y almacenamiento recursos,

    que no escalan a peta-escala de maana conjuntos de datos y millones de

    procesadores y rendir significativa subutilizacin de los recursos primas. Es

    importante programar tareas computacionales cerca de los datos, y para entender

    los costos de mover el trabajo en lugar de en movimiento los datos. Programadores

    de datos-aware y de dispersin de datos cerca de procesadores es fundamental para

    lograr una buena escalabilidad y actuacin. Por ltimo, como el nmero de ncleos

    de procesador es aumentando (las supercomputadoras ms grandes hoy en da

    tienen ms de 200K procesadores y Rejillas superando 100K procesadores), hay

    una nfasis cada vez mayor de apoyo de alto rendimiento la computacin con altas

    tasas de expedicin y ejecucin sostenibles.

    Creemos que las arquitecturas de gestin de datos son importantes para asegurar

    que las implementaciones de gestin de datos escalan a los tamaos de conjuntos

    de datos requeridos en el nmero de archivos, objetos y conjunto de datos de uso

    de espacio en disco, mientras que al mismo tiempo, asegurando que informacin

    de elemento de datos se puede recuperar con rapidez y eficacia. Rejillas han estado

    haciendo avances en la combinacin de clculo y gestin de datos con los

    programadores para datos [41], pero nosotros creen que las nubes se enfrentarn a

    retos importantes en el manejo aplicaciones intensivas de datos sin grandes

    esfuerzos invertidos en el aprovechamiento de la localidad de datos de patrones de

    acceso de la aplicacin. Aunque las aplicaciones intensivas de datos pueden no ser

    tpicos Nubes aplicaciones que tienen que ver con la actualidad, como las escalas

    de Nubes crecen, puede ser slo una cuestin de tiempo para muchas nubes.

    Virtualizacin: La virtualizacin se ha convertido en un elemento indispensable

  • ingrediente para casi todos Nube, las razones ms obvias son para la abstraccin y

    la encapsulacin. Apenas eran las discusiones como introducido para proporcionar

    a los usuarios la "ilusin", como si el ordenador corran todos los hilos

    simultneamente, y cada hilo estaban utilizando todos los recursos disponibles, las

    nubes tienen que ejecutar mltiples usuarios (o incluso hasta miles o millones de)

    aplicaciones y todas las aplicaciones aparecen a los usuarios como si que estaban

    corriendo al mismo tiempo y se poda utilizar todo el los recursos disponibles en

    la nube. La virtualizacin proporciona la abstraccin necesario de tal manera que

    el tejido subyacente (en bruto computacin, almacenamiento, recursos de red)

    puede unificarse como una piscina

    de los recursos y superposiciones de recursos (por ejemplo, servicios de

    almacenamiento de datos, Entornos de hosting) web se puede construir encima de

    ellos.

    La virtualizacin tambin permite a cada aplicacin a encapsular de tal manera que

    se pueden configurar, desplegado, comenzado, migran, suspendido, reanudado, se

    detuvo, etc., y por lo tanto proporciona una mejor la seguridad, capacidad de

    gestin, y el aislamiento.

    Tambin hay muchas otras razones por las que las nubes tienden a adoptar

    virtualizacin: 1) de servidores y aplicaciones de consolidacin, como varias

    aplicaciones pueden ejecutarse en el mismo servidor, recursos puede ser utilizado

    de manera ms eficiente; 2) configurabilidad, como la necesidades de recursos para

    diversas aplicaciones podran diferir significativamente, algunos requieren gran

    almacenamiento, algunos de cmputo, en Para configurar de forma dinmica y

    paquete (agregado) recursos para diversas necesidades, la virtualizacin es

    necesario ya que esto no se puede lograr a nivel de hardware; 3) aumento de la

    disponibilidad de las aplicaciones, la virtualizacin permite la recuperacin rpida

    de interrupciones no planificadas, como los entornos virtuales pueden ser copia de

    seguridad y emigrado sin interrupcin en el servicio; 4) mayor capacidad de

    respuesta: el aprovisionamiento de recursos, el seguimiento y el mantenimiento se

    puede automatizar, y los recursos comunes pueden ser almacenado en cach y

    reutilizada. Todas estas caractersticas de la virtualizacin servir de base para las

    nubes para cumplir con estrictos SLA (Service Acuerdo de Nivel) requisitos en un

    entorno de negocios, que no puede ser alcanzado fcilmente con un entorno no

    virtualizado de una manera rentable como sistemas tendra que ser excesiva

    aprovisionado de manejar carga y residuos recursos pico en ralent

    perodos. Despus de todo, una infraestructura de virtualizacin puede ser slo

    pensado como una asignacin de recursos de TI a las necesidades empresariales.

    Las rejillas no se basan en la virtualizacin tanto como las nubes hacen, pero que

    podran ser ms debido a la poltica y que tiene cada individuo organizacin

  • mantener el control total de sus recursos (es decir, por no la virtualizacin de

    ellos). Sin embargo, hay esfuerzos en Grids para utilizar virtualizacin, as como

    Nimbus [56] (anteriormente conocido como el Servicio de rea de trabajo virtual

    [26]), que proporcionan la misma abstraccin y capacidades de despliegue

    dinmicos. LA espacio de trabajo virtual es un entorno de ejecucin que puede ser

    desplegado de forma dinmica y con seguridad en la Red. Nimbo proporciona dos

    niveles de garantas: 1) la calidad de vida: los usuarios obtienen exactamente el

    (software) medio ambiente que necesitan, y 2) la calidad de servicio: suministro y

    garantizar todos los recursos de los espacio de trabajo necesita para funcionar

    correctamente (CPU, memoria, disco, ancho de banda, disponibilidad), lo que

    permite renegociacin dinmica para reflejar los cambios en los requisitos y

    condiciones. Adicionalmente, Nimbus tambin puede aprovisionar un clster

    virtual de la red aplicaciones (por ejemplo, un planificador de lote, o un sistema de

    flujo de trabajo), que tambin es configurable de forma dinmica, una tendencia

    creciente en Grid Computing.

    Tambin vale la pena sealar que la virtualizacin - en el pasado tena las

    prdidas de rendimiento significativas para algunas aplicaciones, que ha sido uno

    de la desventaja principal de utilizar virtualizacin. Sin embargo, en los ltimos

    aos, el procesador fabricantes como AMD e Intel han sido la introduccin de

    soporte de hardware para virtualizacin, que est ayudando estrecha la diferencia

    de rendimiento entre el rendimiento de las aplicaciones en virtualizado recursos ya

    que se compara con el de las tradicionales sistemas operativos sin virtualizacin.

    Monitoreo: Otro reto que la virtualizacin aporta a Las nubes es la dificultad

    potencial en un control fino sobre el vigilancia de los recursos. Aunque muchos

    Grids (como TeraGrid) tambin hacer cumplir las restricciones sobre qu tipo de

    sensores o servicios de un usuario puede lanzar de larga duracin, el seguimiento

    de la nube es no tan sencillo como en Rejas, Rejillas porque, en general, tener un

    modelo de confianza diferente en el que los usuarios a travs de su identidad

    delegacin puede acceder y navegar por los recursos a diferentes Cuadrcula sitios

    y recursos grid no son muy abstrados y virtualizado como en las nubes; por

    ejemplo, los ganglios [25] distribuye (y jerrquico) sistema de monitoreo puede

    supervisar un federacin de clusters y Grids y ha visto una amplia adopcin en la

    comunidad de cuadrcula. En una nube, diferentes niveles de servicios se puede

    ofrecer a un usuario final, el usuario slo se expone a un pre- API definida, y los

    recursos de nivel inferior son opacos a la usuario (especialmente a nivel PaaS y

    SaaS, aunque algunos proveedores pueden optar por exponer la informacin de

    monitoreo en estos niveles). El usuario no tiene la libertad para desplegar su propia

    infraestructura de monitoreo, y la limitada informacin devuelto al usuario no

    puede proporcionar el nivel necesario de detalles de ella para averiguar cul es el

  • estado de los recursos es. Los potencialmente existen mismos problemas para los

    desarrolladores de la nube y administradores, ya que los recursos abstractos /

    unificadas suelen ir a travs de la virtualizacin y algn otro nivel de

    encapsulacin, y el seguimiento de los problemas para entrar por el software /

    hardware de pila podra ser ms difcil. Monitoreo Esencialmente en nubes

    requiere un delicado equilibrio de la monitorizacin de aplicaciones de negocio, la

    administracin de servidores de la empresa, el seguimiento de la mquina virtual,

    y mantenimiento de hardware, y ser un reto importante para Cloud Computing

    que considere la adopcin y despliegues ms amplio.

    Por otra parte, la vigilancia puede argumentar a ser menos importante en las nubes,

    ya que los usuarios interactan con una ms capa abstracta que es potencialmente

    ms sofisticado; este capa abstracta podra responder a las fallas y calidad del

    servicio (QoS) de forma automtica en una forma de propsito general

    independientemente de la lgica de aplicacin. En un futuro prximo, el usuario

    final monitoreo podra ser un reto importante para las nubes, pero se vuelven

    menos importantes como las nubes se vuelven ms sofisticado y ms auto-

    mantenido y auto-sanacin.

    Procedencia: Procedencia refiere a la historia de la derivacin de un producto de

    datos, incluyendo todas las fuentes de datos, los datos intermedia productos, y los

    procedimientos que se aplicaron para producir el producto de datos. Procedencia

    informacin es de vital importancia en la comprensin, descubrir, validar y

    compartir un producto de datos fiables como as como las aplicaciones y

    programas utilizados para obtener la misma. En algunas disciplinas, como las

    finanzas y la medicina, tambin es obligatoria para proporcionar lo que se llama

    una "auditora" de propsito audicin. En Rejas, gestin de procedencia ha sido en

    general, integrado en un sistema de flujo de trabajo, desde principios de los

    pioneros como quimera [22], a los sistemas de flujo de trabajo cientficos

    modernos, tales como Swift [53], Kepler [35], y ver [34] para apoyar la

    descubrimiento y la reproducibilidad de los resultados cientficos. Tambin tiene

    ha construido como un servicio independiente, como Preserv [29], para facilitar la

    integracin de los componentes de procedencia en ms modelos informticos

    generales y trato con problemas de confianza en afirmacin de

    procedencia. Utilizando la informacin de procedencia, los cientficos puede

    depurar la ejecucin del flujo de trabajo, validar o invalidar cientfica los resultados

    y orientar el diseo de flujo de trabajo futuro y la exploracin de datos.

    Mientras procedencia ha demostrado por primera vez su promesa en la cientfica

    sistemas de flujo de trabajo [22] y los sistemas de bases de datos [47], un largo

    plazo visin es que procedencia ser til en otros sistemas como as, lo que exige

  • el desarrollo de un estndar, abierto, y representacin universal y el modelo de

    consulta. Actualmente, la serie reto procedencia [39] y la procedencia abierta

    iniciativa modelo [38] proporcionar los foros activos de stos esfuerzo de

    estandarizacin y la interaccin. Por otra parte,

    Las nubes estn convirtiendo en el patio de recreo de futuro para la e-ciencia la

    investigacin y la gestin de procedencia es muy importante con el fin de realizar

    un seguimiento de los procesos y apoyar la reproducibilidad de los resultados

    cientficos [45]. Procedencia sigue siendo un rea inexplorada en entornos de nube,

    en la que tenemos que lidiar con incluso cuestiones ms difciles, como la

    produccin de datos de seguimiento a travs de diferentes proveedores de servicios

    (con diferente plataforma la visibilidad y el acceso polticas) ya travs de diferentes

    programas y hardware capas de abstraccin dentro de un solo proveedor. En otro

    Es decir, la captura y gestin de procedencia en la nube entornos pueden llegar a

    ser ms difcil que en Rejas, ya que en este ltimo ya hay unos sistemas de

    procedencia y las iniciativas, consulta procedencia embargo escalable [55] y

    acceso seguro de la informacin de procedencia siguen abiertas problemas tanto

    para los Grids y entornos nubes.

    2.4 Programacin Modelo Aunque el modelo de programacin en entornos de cuadrcula no difieren

    fundamentalmente de forma paralela tradicional y distribuido ambientes,

    obviamente complica por cuestiones como la mltiples dominios

    administrativos; grandes variaciones en los recursos heterogeneidad, la estabilidad

    y el rendimiento; manejo de excepciones en altamente dinmico (en que los

    recursos pueden unirse y dejar bastante tanto en cualquier momento) ambientes,

    etc. rejillas apuntar principalmente clculos cientficos a gran escala, por lo que

    deben escalar para aprovechar gran nmero / cantidad de recursos, y nosotros

    tambin lo hara naturalmente, quieren hacer que los programas se ejecutan rpido

    y eficiente en la red ambientes y programas tambin deben terminar correctamente,

    por lo fiabilidad y tolerancia a fallos deben ser considerados.

    Nosotros discutimos brevemente aqu algunos modelos de programacin generales

    Grids. MPI (Message Passing Interface) [36] es el ms modelo de programacin

    de uso general en computacin paralela, en que un conjunto de tareas utilizan su

    propia memoria local durante computacin y comunicacin mediante el envo y

    recepcin mensajes. MPICH-G2 [32] es una implementacin de red habilitado de

    MPI. Da la interfaz familiar de MPI mientras que proporciona integracin con el

    Globus Toolkit. Lenguas de coordinacin tambin permitir que un nmero de

    componentes posiblemente heterogneos a comunicarse e interactuar, ofreciendo

    facilidades para la especificacin, la interaccin y la composicin dinmica de

    distribuidos componentes (concurrentes). Por ejemplo, Linda [1] define un

  • conjunto de primitivas de coordinacin para poner y recuperar tuplas de un espacio

    de datos compartida llamado el espacio de tuplas . Tiene ha demostrado que es

    fcil de usar tales primitivas a implementar un programador paralelo maestro-

    trabajador. La Novena-G GridRPC [37] sistema integra una red de RPC (Remote

    Procedure Call) capa en la parte superior de la caja de herramientas

    Globus. Publica interfaces y libreras de funciones en MDS, y utiliza GRAM para

    invocar ejecutables remotas. En Rejas, sin embargo, muchos aplicaciones estn

    dbilmente acoplados en que la salida de uno puede ser pasado como entrada a uno

    o ms otros, por ejemplo, como una presentar, oa travs de una invocacin de

    servicios web. Mientras que tales "en trminos generales "clculos acoplados

    pueden implicar grandes cantidades de computacin y comunicacin, las

    preocupaciones de la programador tienden a ser diferentes de los de alta tradicional

    computing rendimiento, siendo enfocada en temas de gestin en relacin con el

    gran nmero de conjuntos de datos y tareas en lugar de la optimizacin de la

    comunicacin interprocessor. De tal casos, los sistemas de flujo de trabajo [54] se

    adapte mejor en la especificacin y la ejecucin de este tipo de aplicaciones. Ms

    especficamente, una sistema de flujo de trabajo permite que la composicin del

    individuo (single paso) componentes en un grafo de dependencias complejo, y

    regula el flujo de datos y / o control a travs de estos componentes. Un ejemplo es

    el sistema Swift [53], que puentes flujos de trabajo cientfico con la computacin

    paralela. Es un herramienta de programacin paralela para la especificacin rpida

    y fiable, ejecucin y gestin de la ciencia a gran escala y los flujos de trabajo de

    ingeniera. El sistema de ejecucin Swift se basa en la CoG Karajan [33] motor de

    flujo de trabajo para la planificacin eficiente y el equilibrio de carga, y se integra

    el ligero Falkon servicio de ejecucin de la tarea para un rendimiento optimizado

    y la tarea eficiencia de los recursos [40]. WSRF (Web Services Recursos Marco)

    ha surgido de OGSA (Open Grid Service Arquitectura) [11] a medida que ms y

    ms aplicaciones de rejilla estn desarrollado como servicios. WSRF Web Services

    permite a convertirse estado, y proporciona un conjunto de operaciones para

    establecer y recuperar los estados (recursos). La versin Globus Toolkit 4 contiene

    Java y C implementaciones de WSRF, la mayora de la Globus servicios bsicos

    se han rediseado para construir alrededor WSRF, stos por completo permitirn

    orientada a servicios de programacin de cuadrcula modelo.

    MapReduce [13] sin embargo, slo es otra programacin paralela modelo, que

    proporciona un modelo de programacin y sistema de ejecucin para el

    procesamiento de grandes conjuntos de datos, y se basa en una simple modelar con

    slo dos funciones clave: "mapa" y "reducir" tomado de los lenguajes

    funcionales. Se aplica la funcin de mapa una operacin especfica a cada uno de

    un conjunto de elementos, produciendo un nuevo conjunto de elementos; una

    funcin realiza reducir la agregacin de un conjunto de artculos. El sistema de

    ejecucin automtica MapReduce Los horarios de las particiones de datos de

  • entrada y la ejecucin de los programas en un gran grupo de mquinas de productos

    bsicos. El sistema est compuesto quejar tolerante comprobando peridicamente

    nodos de trabajo y reasignacin de tareas fallidas a otros nodos de trabajo. Sawzall

    es una lenguaje interpretado que se basa en MapReduce y separa las fases de

    filtrado y agregacin para el programa ms conciso especificacin y mejor

    paralelizacin. Hadoop [30] es el implementacin de cdigo abierto del modelo

    MapReduce y cerdo es un lenguaje de programacin declarativa ofreci en la parte

    superior de la Hadoop. Microsoft ha desarrollado el Cosmos distribuidos sistema

    de almacenamiento y procesamiento marco Dryad y ofertas DryadLINQ [31] y

    alcance como modelo de programacin declarativa en la parte superior de la

    infraestructura de almacenamiento y computacin. DryadLINQ utiliza la sintaxis

    orientada a objetos consulta LINQ donde mbito de aplicacin proporciona a los

    operadores bsicos similares a los de SQL tales como Seleccionar, Ingreso,

    agregacin, etc., tanto en traducir lo abstracto especificacin en el plan de

    ejecucin detallado.

    De scripting y Mesh-up (Java Script, PHP, Python, etc) tienen estado tomando el

    lugar de un sistema de flujo de trabajo en el mundo de la nube, ya que no hay

    manera fcil de integrar los servicios y aplicaciones de diferentes proveedores. Son

    esencialmente los datos la integracin se acerca, porque toman las salidas de un

    servicio / aplicacin, transformarlos y alimentar a otro. Google App Engine utiliza

    un tiempo de ejecucin de Python modificado y elige Python lenguaje de scripting

    para la aplicacin web el desarrollo, la interfaz para su almacenamiento BigTable

    subyacente sistema es un lenguaje de consulta de propiedad (con nombre, como

    usted pensara, GQL) es una reminiscencia de SQL, aunque todos stos

    probablemente cambiarn. Nubes (como Amazon Web Servicios, Servicios Azure

    Platform de Microsoft) tienen en general adoptadas API de servicios Web, donde

    el acceso a los usuarios, configurar y los servicios del programa de la nube usando

    APIs predefinidos expuestos como Servicios Web y HTTP y SOAP son los

    protocolos comunes elegido para tales servicios. Aunque Nubes adoptaron algunos

    protocolos de comunicacin comunes, tales como HTTP y SOAP, la integracin y

    la interoperabilidad de todos los servicios y aplicaciones siguen siendo el mayor

    desafo, ya que los usuarios necesitan para aprovechar en una federacin de nubes

    en lugar de un nico proveedor de la nube.

    2.5 Solicitud de Modelo Rejillas generalmente apoyan muchos tipos diferentes de aplicaciones, que van

    desde la informtica de alto rendimiento (HPC) de alta informtica rendimiento

    (HTC). Aplicaciones HPC son eficientes en la ejecucin de trabajos paralelos

  • fuertemente acoplados dentro de un particular, mquina con interconexiones de

    baja latencia y generalmente no son ejecutada a travs de una amplia red de red de

    rea; estas aplicaciones suelen utilizar Message Passing Interface (MPI) para

    lograr el comunicacin entre procesos necesarios. Por otro lado, las redes Tambin

    han tenido gran xito en la ejecucin de manera ms flexible aplicaciones

    acopladas que tienden a ser gestionados y ejecutados a travs de sistemas de flujo

    de trabajo u otro complejo y sofisticado aplicaciones. En cuanto a las aplicaciones

    de HTC dbilmente acoplados naturaleza, hay otras clases de la aplicacin, tales

    mltiple Programa de mltiples datos (MPMD), MTC, capacidad de clculo, utility

    computing, y vergonzosamente paralelas, cada una con su propios nichos

    [42]. Estas aplicaciones dbilmente acoplados pueden ser compuesta de muchas

    tareas (tanto independientes como dependientes tareas) que se pueden programar

    individualmente en muchos diferentes los recursos informticos a travs de

    mltiples fronteras administrativas para lograr alguna meta aplicacin ms

    grande. Las tareas pueden ser pequeos o grande, monoprocesador o

    multiprocesador, compute-intensivo o gran volumen de datos. El conjunto de

    tareas puede ser esttica o dinmica, homogneo o heterogneo, sin apretar o

    estrechamente acoplado.

    El nmero total de tareas, cantidad de la informtica, y volmenes de datos podran

    ser pequea, pero tambin extremadamente grande. Por otro lado, la computacin

    en nube podra en principio abastezca a un conjunto similar de aplicaciones. La

    nica excepcin que se har probablemente ser difcil de lograr en el Cloud

    Computing (pero ha tenido mucho xito en Grids) son aplicaciones HPC que

    requieren rpida e interconexiones de redes de latencia bajos de la escala eficiente

    muchos procesadores. Como Cloud Computing es todava en su infancia, las

    aplicaciones que se ejecutarn en las nubes no estn bien definidos, pero sin duda

    podemos caracterizar a ser imprecisa, orientado transaccin (pequeas tareas en el

    orden de milisegundos de segundos), y es probable que ser interactivo (en

    oposicin a por lotes programados, ya que se encuentran actualmente en Grids).

    Otra clase emergente de las aplicaciones en las rejillas es cientfico puertas de

    enlace [51], que son frontales a una variedad de aplicaciones que puede ser

    cualquier cosa, desde dbilmente acoplado fuertemente acoplado.

    Una puerta de enlace de la Ciencia es un conjunto desarrollado por la comunidad

    de herramientas, las aplicaciones y los datos de las colecciones que se integran a

    travs de un portal o un conjunto de aplicaciones. Gateways proporcionan acceso

    a una variedad de capacidades, incluyendo los flujos de trabajo, la visualizacin,

    servicios de descubrimiento de recursos y la ejecucin del trabajo a travs de un

    interfaz de usuario basada en navegador (que sin duda puede ocultar mucho de la

  • complejidad). Gateways cientficos estn empezando a adoptar una amplia

    variedad de tecnologas web 2.0, pero hasta la fecha, gran parte de los desarrollos

    en cuadrculas y la Web 2.0 han sido realizado en paralelo con poca interaccin

    entre ellos. Estas las nuevas tecnologas son importantes mejoras a los caminos

    gateways interactan con los servicios y proporcionan ricos usuario

    interactividad. Aunque las puertas de enlace cientficos slo han surgido en Grids

    hace poco, las nubes parecen haber adoptado el uso de puertas de acceso a los

    recursos de la nube casi exclusivamente para el usuario final interaccin. El

    navegador y tecnologas Web 2.0 lo har sin duda, juegan un papel central en cmo

    los usuarios interactan con Grids y nubes en el futuro.

    2.6 Modelo de Seguridad

    Nubes comprenden principalmente los centros de datos dedicados perteneciente a

    de la misma organizacin, y dentro de cada centro de datos, hardware y

    configuraciones de software y plataformas de apoyo estn en en general ms

    homognea en comparacin con los de cuadrcula ambientes. Interoperabilidad

    puede convertirse en un problema grave para centro de datos cruz, dominio de las

    interacciones cruzadas administracin, imaginar el funcionamiento de su servicio

    de contabilidad en Amazon EC2 mientras que sus otras operaciones de negocios

    en la infraestructura Google. Grids sin embargo se basan en la suposicin de que

    los recursos son heterognea y dinmica, y cada sitio de la red puede tener su

    dominio de administracin propia y autonoma operacin. Por lo tanto, la

    seguridad ha sido diseado en la cuadrcula fundamental infraestructura. Las

    cuestiones clave que se consideran son: inicio de sesin nico, por lo que los

    usuarios pueden iniciar sesin en una sola vez y tener acceso a mltiples Sitios de

    cuadrcula, esto tambin facilitarn contabilidad y auditora; delegacin, por lo que

    un programa puede ser autorizado a acceder recursos en nombre de un usuario y

    que puede delegar a otra programas; la privacidad, la integridad y la segregacin,

    los recursos perteneciente a un usuario no se puede acceder por no autorizada

    usuarios, y no puede ser manipulado durante la transferencia; coordinado la

    asignacin de recursos, reservas, y el intercambio, teniendo en consideracin de

    ambas polticas globales y locales de uso de recursos.

    La clave pblica basado (Infraestructura Red de Seguridad) GSI protocolos se

    utilizan para la autenticacin, la comunicacin proteccin, y la

    autorizacin. Adems, CAS (Comunidad Authorization Service) est diseado

    para el recurso avanzada autorizacin dentro ya travs de las comunidades. Gruber

    (A Cuadrcula Uso de recursos de SLA Broker) [14] es un ejemplo que tiene puntos

    de aplicacin de la poltica de distribucin para hacer cumplir tanto locales

    polticas de uso y SLAs globales (Service Level Agreement), que permite que los

    recursos en los sitios individuales para ser eficiente compartida en mltiples sitios,

  • entornos multi-VO. Actualmente, el modelo de seguridad para las nubes parece ser

    relativamente ms simple y menos seguro que el modelo de seguridad adoptada

    por Grids. Infraestructura de nube generalmente se basan en formularios web (ms

    de SSL) para crear y gestionar la informacin de cuenta para los usuarios finales,

    y permite a los usuarios restablecer sus contraseas y recibir nueva contraseas a

    travs de correos electrnicos en un inseguro y sin cifrar la comunicacin. Tenga

    en cuenta que los nuevos usuarios podran utilizar Nubes con relativa facilidad y

    casi al instante, con una tarjeta de crdito y / o direccin de correo electrnico. Para

    contrastar esto, Grids son ms estrictas sobre su seguridad. Por ejemplo, aunque

    los formularios web se utilizan para gestionar cuentas de usuario, informacin

    sensible acerca de nuevas cuentas y contraseas requiere tambin una persona a

    otra conversacin verificar que la persona, tal vez la verificacin de un

    patrocinador persona que ya tiene una cuenta y contraseas slo sern por fax o

    por correo, pero en ningn caso van a ser enviado por correo electrnico. El

    enfoque de la red a la seguridad podra ser ms tiempo consumir, pero aade un

    nivel adicional de seguridad para ayudar a

    evitar el acceso no autorizado.

    La seguridad es una de las mayores preocupaciones para la adopcin de

    Computacin En La Nube. Nos esbozar siete riesgos de un usuario de la nube debe

    plantear a los proveedores antes de comprometerse [6]: 1) el usuario privilegiado

    Acceso: datos confidenciales procesados fuera de las necesidades de la empresa la

    seguridad de que slo son accesibles y propagado a usuarios

    privilegiados; 2) Cumplimiento de normas: a las necesidades del cliente para

    verificar si un proveedor de nube tiene auditoras y seguridad exterior

    certificaciones y si su infraestructura cumple con alguna requisitos de seguridad

    reglamentarios; 3) la ubicacin de los datos: desde un cliente no sabr donde se

    almacenarn sus datos, es importante que el proveedor de la nube se comprometen

    a almacenar y el procesamiento de datos en jurisdicciones especficas y para

    obedecer locales requisitos de privacidad en nombre del cliente; 4) Datos la

    segregacin: uno tiene que asegurarse de que los datos de un cliente es totalmente

    separados de los datos de otro cliente; 5) Recuperacin: se Es importante que el

    proveedor de la nube tiene una replicacin eficiente y el mecanismo de

    recuperacin para restaurar los datos en caso de desastre; 6)

    Apoyo a la Investigacin: Servicios en la nube son especialmente difciles de

    investigar, si esto es importante para un cliente, entonces tal apoyo debe

    garantizarse con un compromiso contractual; y 7) la viabilidad a largo plazo: los

    datos deben ser viables incluso el Proveedor de la nube es adquirida por otra

    empresa.

    3 Conclusiones y luces para el futuro

  • En este trabajo, se muestra que las nubes y Rejillas comparten una gran cantidad

    comunalidad en su visin, la arquitectura y la tecnologa, pero tambin difieren en

    varios aspectos como la seguridad, modelo de programacin, modelo de negocio,

    modelo de clculo, los datos modelo, las aplicaciones y las abstracciones. Tambin

    identificamos retos y oportunidades en ambos campos. Creemos que una estrecha

    esa comparacin ya que esto puede ayudar a las dos comunidades comprender,

    compartir y desarrollar la infraestructura y la tecnologa dentro y fuera, y acelerar

    Cloud Computing desde temprano prototipos a los sistemas de produccin.

    Qu nos depara el futuro? Vamos a aventurar algunas predicciones, basado en

    nuestras creencias de que la economa de la computacin buscarn ms y ms

    como los de la energa. Ni la energa ni la computar redes del maana se ver como

    el de ayer red de energa elctrica. Ambos avanzar hacia una mezcla de micro

    produccin y grandes empresas de servicios pblicos, con un nmero creciente de

    los pequeos productores (elica, solar, biomasa, etc., para la energa; para la

    informtica, las agrupaciones locales e incrustado en procesadores zapatos y

    paredes) coexistiendo con gran escala regional productores y carga que se

    distribuyen entre ellos de forma dinmica.

    S, la informtica no es realmente como la electricidad, pero s creo que, sin

    embargo vamos a ver la evolucin paralela, impulsada por fuerzas similares.

    En la construccin de esta distribuida "nube" o "Grid", tendremos que apoyo

    aprovisionamiento y configuracin de on-demand "Sistemas virtuales" integrados

    que proporcionan las capacidades precisas es necesario por un usuario

    final. Tendremos que definir protocolos que permiten a los usuarios y proveedores

    de servicios para descubrir y mano de exige a otros proveedores, para monitorear

    y administrar su reservas, y organizar el pago. Necesitaremos herramientas para

    gestionar tanto los recursos subyacentes y la resultante clculos

    distribuidos. Vamos a necesitar la escala centralizada de los servicios pblicos de

    la nube de hoy, y la distribucin y la interoperabilidad de las instalaciones de la

    cuadrcula de hoy.

    Desafortunadamente, al menos hasta la fecha, los mtodos utilizados para lograr

    estos objetivos en las nubes comerciales de hoy no han sido abiertos y de propsito

    general, pero en su lugar ha sido en su mayora de propiedad y especializado para

    los usos internos especficos (por ejemplo, datos a gran escala anlisis) de las

    empresas que los desarrollan. La idea de que lo que se quiere permitir la

    interoperabilidad entre los proveedores (como en la red de energa elctrica) an

    no ha salido a la superficie. Cuadrcula tecnologas y protocolos hablan

    precisamente a estas cuestiones, y debera ser considerado.

    Algunos de los protocolos y herramientas necesarios procedern del gente

    inteligente de la industria en Amazon, Google, Yahoo, Microsoft e IBM. Otros

  • vendrn de las personas inteligentes del mundo acadmico y del gobierno

    laboratorios. Otros vendrn de los que crean lo que llamamos estas cosas despus

    de cuadrcula y Cloud. Ser interesante ver en qu medida estos diferentes

    comunidades logran encontrar una causa comn, o en su lugar continuar por

    caminos paralelos.