la web 2.0. Sin embargo, hay docenas de definiciones diferentes de Nube La informtica y no parece haber un consenso sobre lo que una nube. Por otra parte, Nube. La informtica no es un concepto totalmente nuevo; tiene relacin compleja a la relativamente nueva, sino trece aos establecido de paradigma Red Informtica, y otros pertinentes tecnologas como la utilidad, la informtica en racimo, y distribuidos los sistemas en general. Este papel se esfuerza por comparar y Cloud la clase de Computacin contraste con la Red Informtica de ngulos diferentes y dar ideas sobre las caractersticas esenciales de los dos. 1 Anlisis 100-Mile Cloud Computing est haciendo alusin a un futuro en el cual no calculamos en equipos locales, pero en instalaciones centralizadas operadas por utilidades compute y almacenamiento de informacin de terceros. Nosotros seguro No perderemos el software cubetas para desenvolver e instalar. No hace falta decirlo, esto no es una idea nueva. De hecho, en 1961, el pionero de la computacin John McCarthy predijo "el cmputo algn da puede ser organizado como un servicio pblico" y lleg a especular cmo esto pudo ocurrir. A mediados de 1990, el trmino Grid fue acuado para describir tecnologas que permitiran a los consumidores obtener poder de computacin bajo demanda. Ian Foster y otros postulados que por estandarizacin de los protocolos utilizados para solicitar poder de computacin, nosotros podramos impulsar la creacin de una red informtica, anlogo en forma y utilidad a la red de energa elctrica. Posteriormente Investigadores desarrollaron estas ideas en muchas maneras emocionantes, produciendo sistemas federados por ejemplo a gran escala (TeraGrid, Open Science Grid, caBIG, EGEE, Earth System Grid) que proporcionan no slo la potencia de procesamiento, pero tambin datos y software, en la demanda. Organizaciones de estndares (e.g., OGF, OASIS) definen las normas pertinentes. Ms prosaically, el trmino fue tambin cooptado por la industria como un trmino de marketing para clsteres. Sin embargo, hay proveedores de informatizacin en red comerciales viables, al menos hasta hace poco. Es 'Cloud Computing' slo un nuevo nombre para la red? En informacin de tecnologa, donde la tecnologa escalas en un orden de magnitud y en el proceso reinventa, cada cinco aos, no hay ninguna respuesta simple a este tipo de preguntas. S: la visin es el mismo para reducir el costo de la informtica, aumentar la fiabilidad y aumentar la flexibilidad mediante la transformacin de los equipos de algo que compramos y nosotros mismos operan a algo que es operado por un tercero. Pero no: las cosas son diferentes ahora que hace 10 aos. Tenemos una nueva necesidad para analizar datos masivos, motivando as demanda acrecentada de computacin. Habiendo realizado las ventajas de pasar de mainframes a grupos de productos bsicos, nos encontramos con que esos grupos son bastante caros operar. Tenemos virtualizacin de bajo costo. Y, sobre todo, tenemos varios miles de millones de dlares siendo gastados por los gustos de Amazon, Google y Microsoft para crear sistemas a gran escala comerciales que contiene cientos de miles de ordenadores. La posibilidad de necesitar solamente una tarjeta de crdito para obtener acceso bajo demanda a 100.000 ordenadores en decenas de centros de datos distribuidos por todo el mundo recursos que ser aplicada a problemas de datos masivos, potencialmente distribuidos, es emocionante! As que estamos operando en una escala diferente y operando en estos nuevos, escalas ms masivas pueden exigir fundamentalmente diferentes enfoques para abordar problemas. Tambin permite de hecho, a menudo slo es aplicable a enteramente nuevos problemas. Sin embargo, s: los problemas en su mayora son los mismos en las nubes y rejillas. Hay una necesidad comn a ser capaz de manejar grandes instalaciones; para definir los mtodos por los cuales los consumidores descubren, solicitar y utilizan los recursos proporcionados por las instalaciones de las centrales;<br>e implementar los cmputos a menudo altamente paralelos que se ejecutan en esos recursos. Los detalles difieren, pero las dos comunidades estn luchando con muchos de los mismos temas. 1.1 definicin de Cloud Computing Hay poco consenso sobre cmo definir la nube [49]. Aadimos otra definicin a la lista ya saturada de definiciones para Cloud Computing: A gran escala un paradigma computacin distribuido que es impulsado por las economas de escala, en el cual un grupo de poder de computacin abstrada, virtualizado, dinmicamente escalables, administrado, almacenamiento, plataformas y servicios se entregan en demanda a los clientes externos por Internet. Hay algunos puntos claves en esta definicin. En primer lugar, Cloud Computing es un paradigma de computacin distribuido especializado; se diferencia de los tradicionales en 1) es escalable, 2) puede ser encapsulado como una entidad abstracta que proporciona diferentes niveles de servicios a clientes fuera de la nube, 3) es conducida por las economas de escala [44], y 4) los servicios pueden ser configurados dinmicamente (va virtualizacin u otros enfoques) y entregado en la demanda. Los gobiernos, institutos de investigacin y lderes de la industria se apresuran para adoptar Cloud Computing para resolver sus problemas de computacin y almacenamiento de creciente que se presenta en la Era de Internet. Hay tres principales factores que contribuyen a la oleada e intereses en Cloud Computing: 1) rpida disminucin en el coste del hardware y aumento en la informtica potencia y capacidad de almacenamiento y el advenimiento de la arquitectura multincleo y superordenadores modernos compuesto de cientos de miles de corazones; 2) el tamao de datos crecimiento exponencial en instrumentacin/simulacin cientfica y publicacin en Internet y archivar; y 3) la adopcin extensa de aplicaciones de servicios de informtica y Web 2.0. 1,2 nubes, redes y sistemas distribuidos Muchos lectores exigentes inmediatamente dar cuenta de que nuestra definicin de Cloud Computing superpone con muchas tecnologas existentes, como Grid Computing, Utility Computing, Servicios de informtica y computacin distribuida en general. Argumentamos que Cloud Computing no slo coincide con la informatizacin, es de hecho evolucion de la informatizacin y se basa en la informatizacin como su espina dorsal y la infraestructura de apoyo. La evolucin ha sido el resultado de un cambio de enfoque de una infraestructura que ofrece almacenamiento de informacin y recursos computacionales (tal es el caso de las rejillas) a una economa basan con el objetivo de entregar ms abstracta los recursos y servicios (tal es el caso de las nubes). En cuanto a Utility Computing, no es un nuevo paradigma de la infraestructura informtica; por el contrario, es un modelo de negocio en el cual los recursos informticos, tales como computacin y almacenamiento, se empaquetan como inhaladores servicios similares a una utilidad pblica fsica, tales como electricidad y red telefnica pblica conmutada. Utility computing es tpicamente implementada usando otra infraestructura informtica (e.g. Grids) con contabilidad y servicios de monitoreo adicional. Una infraestructura en la nube puede ser utilizada internamente por una empresa o expuesta al pblico como utility computing. Vea la figura 1 para tener una visin general de la relacin entre las nubes y otros dominios que se superponga con. Web 2.0 cubre casi todo el espectro de aplicaciones orientadas a servicios, donde Cloud Computing se encuentra en el lado a gran escala. Supercomputacin y Cluster de computacin se han enfocado ms en las aplicaciones tradicionales no son de servicio. Rejilla Informtica se traslapa con todos estos campos donde generalmente se considera de menor escala que los superordenadores y nubes.
Figura 1: Las rejillas y las nubes Resumen Grid Computing pretende "permitir compartir recursos y coordinado de problemas en organizaciones virtuales dinmicas, multi- institucional" [18] [20]. Tambin hay algunas caractersticas claves de esta definicin: en primer lugar, las rejillas proporcionan un paradigma de computacin distribuida o infraestructura que se extiende a travs de mltiples organizaciones virtuales (VO) donde puede cada VO constan de instituciones fsicamente distribuidas o proyectos o grupos relacionados lgicamente. El objetivo de tal paradigma es habilitar FED recursos compartidos en entornos dinmicos, distribuidos. El enfoque adoptado por la implementacin estndar de facto el lobus Toolkit [16] [23], es construir un entorno informtico uniforme de diversos recursos mediante la definicin de protocolos de red estndar y proporcionando middleware para mediar el acceso a una amplia gama de recursos heterogneos. Globus aborda diversos temas tales como seguridad, descubrimiento de recursos, provisin de recursos y gestin, trabajo de programacin, supervisin y administracin de datos. 2 comparando las rejillas y las nubes Side-by- Side Esta seccin pretende comparar las rejillas y las nubes en una amplia variedad de perspectivas, de arquitectura, modelo de seguridad, modelo de negocio, programacin modelo, virtualizacin, modelo de datos, calcular el modelo, procedencia y aplicaciones. Tambin describimos una serie de retos y oportunidades que la informatizacin y Cloud Computing traen a los investigadores y la industria de ti, ms comunes a los dos, pero algunos son especficos para uno u otro. 2.1 modelo de negocio Modelo de negocio tradicional para el software ha sido un pago nico para uso ilimitado (generalmente de 1 computadora) del software. En un modelo de negocio basado en la nube, un cliente pagar al proveedor sobre una base de consumo, muy parecida a la utilidad empresas cargo por servicios bsicos como electricidad, gas y agua, y el modelo se basa en las economas de escala en orden a los precios en coche hacia abajo para los usuarios y los beneficios para los proveedores. Hoy, Amazon esencialmente proporciona una nube centralizada consiste en calcular nube EC2 y datos nube S3. El ex se calcula en base por ejemplo-hora consumida por cada uno tipo de instancia y ms adelante se cobra por GB mensuales de almacenamiento usada. Adems, la transferencia de datos es cargada por TB / mes de transferencia, dependiendo de la fuente y el destino de esas transferencias. La posibilidad de necesitar solamente una tarjeta de crdito para obtener acceso bajo demanda a 100.000 + procesadores en decenas de centros de datos distribuidos por todo el mundo recursos que ser aplicada a problemas de datos masivos, potencialmente distribuidos, es emocionante! El modelo de negocio para las rejillas (al menos que encontr en los laboratorios de academia o gobierno) est orientado a proyectos en que los usuarios o comunidad representada por esa propuesta cierto nmero de unidades de mantenimiento (es decir, horas de CPU) puedan pasar. Por ejemplo, el TeraGrid funciona de esta manera y requiere cada vez ms complejas propuestas escribirse para aumentar el nmero de poder computacional. El TeraGrid cuenta con sitios de red ms de una docena, todos alojados en diversas instituciones del pas. Qu hace a una institucin quiere unirse a la TeraGrid? Cuando una institucin se une a la TeraGrid con un conjunto de recursos, sabe que otros en la comunidad ahora pueden utilizar estos recursos en todo el pas. Tambin reconoce el hecho de que gana acceso a una docena otros sitios de la red. Este mismo modelo ha funcionado bastante bien para muchas redes alrededor del mundo, dando incentivos de las instituciones para unir distintas redes para tener acceso a recursos adicionales para todos los usuarios de la institucin correspondiente. Tambin existen esfuerzos para construir una economa de red para una infraestructura de red global que apoya el comercio, la negociacin, el aprovisionamiento y asignacin de recursos basado en los niveles de los servicios prestados, riesgo y costo y las preferencias del usuario; hasta ahora, intercambio de recursos (e.g. comercio almacenamiento para calcular ciclos), subastas, teora de juego basado en coordinacin de recursos, las monedas virtuales, recursos brokers e intermediarios y varios otros modelos econmicos han sido propuestos y aplicado en la prctica [8]. 2.2 arquitectura Rejillas comenzaron en mediados de los 90 para abordar problemas de computacin a gran escala utilizando una red de mquinas de materia compartir recursos que entrega el poder de cmputo accesible solamente por supercomputadoras y grandes agrupaciones dedicadas en aquel momento. La motivacin principal era que estos recursos de computacin de alto rendimiento eran caros y difciles de conseguir acceso a, as que el punto de partida era utilizar recursos federados que podran comprenden compute, almacenamiento y red de recursos de mltiples instituciones distribuidos geogrficamente y esos recursos son generalmente heterogneo y dinmico. Rejillas centradas en la integracin de los recursos existentes con su hardware, sistemas operativos, infraestructura de seguridad y gestin de los recursos locales. Con el fin de apoyar la creacin de las llamadas "organizaciones virtuales" una entidad lgica dentro de los cuales recursos distribuidos pueden descubrir y compartir como si fueran de la misma organizacin, rejillas de definir y proporcionar un conjunto de protocolos estndar, middleware, herramientas y servicios basados en la cima de estos protocolos. Interoperabilidad y seguridad son las principales preocupaciones para la infraestructura de red como recursos que provienen de diferentes dominios administrativos, que tienen tanto las polticas de uso de recursos locales y globales, diverso hardware y configuraciones de software y plataformas, y varan en la disponibilidad y capacidad. Rejillas proporcionan protocolos y servicios en cinco diferentes capas como se identifica en la arquitectura de protocolo de red (ver figura 2). En la capa de tela, rejillas proporcionan acceso a tipos de diferentes recursos como recursos computacionales, almacenamiento y red, repositorio de cdigo, etc.. Rejillas dependen generalmente de componentes existentes en tela, por ejemplo, los administradores de recursos locales (es decir, PBS [5], Condor [48], etc.). Componentes de propsito generales como GARA (arquitectura general de reserva avanzada) [17], y especializados Servicios de gestin de recursos tales como Falkon [40] (aunque estrictamente hablando, Falkon tambin proporciona servicios ms all de la capa de tela).
Figura 2: Arquitectura de protocolo de red La capa de conectividad define comunicacin ncleo y protocolos de autenticacin de red fcil y seguro transacciones. El GSI (infraestructura de seguridad de la red) [27] Protocolo subyace en todas las transacciones de la red. La capa de recursos define los protocolos para la publicacin, descubrimiento, negociacin, supervisin, contabilidad y pago de compartir las operaciones sobre los recursos individuales. El gramo (red de acceso a los recursos y gestin) [16] protocolo se utiliza para la asignacin de los recursos computacionales y para el seguimiento y control de cmputo sobre esos recursos y GridFTP [2] para el acceso a los datos y la transferencia de datos a alta velocidad. La capa colectiva capta las interacciones a travs de colecciones de recursos, servicios de directorio como MDS (monitoreo y Discovery Service) [43] permite el monitoreo y el descubrimiento de recursos VO, Condor-G [24] y Nimrod-G [7] son ejemplos de asignacin de Co, programacin y servicios de corretaje y MPICH [32] para red permiti a sistemas de programacin y CAS (servicio comunitario autorizacin) [21] para las polticas de recursos globales. La capa de aplicacin se compone de lo que las aplicaciones de usuario construidas en la cima de los protocolos y APIs y operar en entornos de VO. Dos ejemplos son los sistemas de flujo de trabajo de la red y portales de la red (es decir, QuarkNet entorno e-learning [52], Observatorio Virtual nacional (http://www.us-vo.org), TeraGrid Science gateway (http://www.teragrid.org)). Las nubes se desarrollan a escala de Internet de abordar los problemas de computacin donde algunas suposiciones son diferentes a las de las rejillas. Las nubes se refieren generalmente como una gran piscina de recursos de computacin o almacenamiento, que se puede acceder mediante protocolos estndar va una interfaz abstracta. Las nubes pueden ser construidas en la parte superior de muchos protocolos existentes tales como servicios Web (WSDL, SOAP) y algunas tecnologas avanzadas de la Web 2.0 como el resto, RSS, AJAX, etc.. De hecho, detrs de la cubierta, es posible que las nubes aplicarlos a las tecnologas Grid existentes aprovechando ms de una dcada de esfuerzos de la comunidad de normalizacin, seguridad, gestin de los recursos y soporte de virtualizacin. Tambin hay varias versiones de definicin para la nube arquitectura, se define una arquitectura de cuatro capas de la nube Informtica en comparacin con la arquitectura de la red, compuesta de 1) tela,2) recursos unificados, 3) plataforma, y 4) la aplicacin Capas. La capa de tejido contiene los recursos a nivel de hardware en bruto, tales como los recursos informticos, recursos de almacenamiento y de red recursos. La capa uniforme de recursos contiene recursos que se preparan / encapsulado (generalmente por la virtualizacin) de modo que puedan estar expuestos a los usuarios de la capa y el extremo superior como integrada de los recursos, por ejemplo, un ordenador / cluster virtual, un sistema de archivo lgico, un sistema de base de datos, etc La capa de plataforma aade en una coleccin de herramientas especializadas, middleware y los servicios en la parte superior de los recursos unificadas para proporcionar una desarrollo y / o plataforma de despliegue. Por ejemplo, un Web medio ambiente, un servicio de programacin, etc alojamiento Finalmente, la capa de aplicacin contiene las aplicaciones que se ejecutan en las Nubes. Nubes en general proporcionan servicios en tres niveles diferentes (IaaS, PaaS y Saas [50]) de la siguiente manera, aunque algunos los proveedores pueden optar por exponer servicios en ms de un nivel. Infraestructura como Servicio (IaaS) de hardware [50] disposiciones, software y equipos (sobre todo en la capa uniforme de recursos, pero tambin puede incluir una parte de la capa de tejido) para entregar software entornos de aplicaciones con una fijacin de precios basada en el uso de recursos modelo. Infraestructura puede escalar hacia arriba y abajo de forma dinmica basado en las necesidades de recursos de aplicacin. Ejemplos tpicos son Amazon EC2 (Elastic Cloud Computing) Servicio [3] y S3 (Simple Storage Service) [4] donde computacin y almacenamiento infraestructuras estn abiertas al acceso pblico con un pago por uso modelo; Eucalyptus [15] es una fuente abierta de la nube aplicacin que proporciona una interfaz compatible con EC2 de Amazon, y permite a las personas a crear una nube infraestructura en premisa y experimentar antes de comprar servicios comerciales. Plataforma como servicio (PaaS) [50] ofrece un alto nivel entorno integrado para crear, probar y desplegar personalizada aplicaciones. Por lo general, los desarrolladores tendrn que aceptar algunas restricciones sobre el tipo de software que pueden escribir a cambio para una funcin de escalabilidad de la aplicacin. Un ejemplo es Google de App Engine [28], lo que permite a los usuarios construir Web aplicaciones en los mismos sistemas escalables que el poder Google aplicaciones. Software como Servicio (SaaS) [50] proporciona para fines especiales software que es accesible de forma remota por los consumidores a travs de la Internet con un modelo de precios basado en el uso. Salesforce es una lder de la industria en el suministro de CRM en lnea (Customer Relationship Management) Servicios. Live Mesh de Microsoft permite que los archivos y carpetas que se comparten y sincronizado a travs de mltiples dispositivos. Aunque las nubes proporcionan servicios en tres niveles diferentes (IaaS, PaaS y SaaS), las normas para las interfaces a estos diferentes niveles an no se han definido. Esto conduce a problemas de interoperabilidad entre nubes de hoy en da, y no hay pocos incentivos comerciales para los proveedores de la nube para invertir recursos adicionales en la definicin y la implementacin de nuevas interfaces. Como Nubes maduran, y ms sofisticado aplicaciones y servicios surgir que requieren el uso de mltiples nubes, habr cada vez ms incentivos para adoptar interfaces estndar que facilitan la interoperabilidad con el fin de capturar emergentes y crecientes mercados en una nube saturada mercado. 2.3 Gestin de los Recursos En esta seccin se describe el manejo de los recursos se encuentran en Grids y nubes, que cubren temas tales como el modelo de clculo, modelo de datos, virtualizacin, monitorizacin, y la procedencia. Estos los temas son muy importantes para entender el principal desafos que ambos Grids y Clouds enfrentan hoy en da, y lo har que superar en el futuro. Compute Modelo: La mayora de los Grids utilizar un clculo por lotes regulares modelo, en el que un gestor de recursos local (LRM), tal como PBS, Condor, SGE gestiona los recursos informticos para un sitio de la red, y los usuarios envan trabajos por lotes (a travs de GRAM) para solicitar alguna recursos durante algn tiempo. Muchos Grids tienen polticas que hacen cumplir estas tareas por lotes para identificar al usuario y credenciales con las que se ejecutar el trabajo de la contabilidad y fines de seguridad, el nmero de procesadores necesarios, y el duracin de la asignacin. Por ejemplo, un trabajo pudo decir, etapa en los datos de entrada de una direccin URL para el almacenamiento local, ejecute elaplicacin durante 60 minutos a 100 procesadores, y organizar el resultados a algn servidor FTP. El trabajo sera esperar en el LRM de esperar cola hasta que los procesadores 100 estaban disponibles para 60 minutos, momento en el cual se asignaran los procesadores 100 y dedicada a la aplicacin de la duracin del trabajo. Debido a las decisiones de planificacin caros, los datos en la estadificacin y a cabo, y, potencialmente, los tiempos de espera largos, muchos no lo hacen Grids soporte nativo de aplicaciones interactivas; aunque hay esfuerzos en la comunidad de cuadrcula para habilitar latencias inferiores a recursos a travs de la programacin de varios niveles, para permitir que las aplicaciones con muchas tareas a corto funcionamiento para ejecutar de manera eficiente en Grids [40].Modelo de computacin Cloud Computing probablemente ser muy diferente, con recursos en la nube se comparten por todos los usuarios al mismo tiempo (en contraste a los recursos dedicados regidas por un sistema de colas). Esto debera permitir que la latencia sensible aplicaciones que funcionan de forma nativa en las nubes, aunque garantizando un buen nivel suficiente de QoS se est entregando a los usuarios finales no ser trivial, y es probable que sea uno de los principales retos para la computacin en nube como las nubes crecen en escala, y el nmero de usuarios. Modelo de datos: Si bien algunas personas con audacia predican que el futuro Informtica Internet ser hacia el Cloud Computing centralizada, en la que el almacenamiento, computacin, y todo tipo de otros recursos sern principalmente provisionar por la Nube, que imaginar que la prxima generacin Informtica Internet tendr el modelo de tringulo que se muestra en la Figura 4: Internet Computing ser