You are on page 1of 5

Comparativa Ceph, SAN y NAS. Ceph ¿Almacenamiento a bajo coste?

Hace un tiempo oí hablar de Ceph, un sistema de almacenamiento muy potente,


con muy buen rendimiento, altamente escalable y según he leído en muchos sitios
a un coste muy reducido.

Ahora, con un poco de tiempo por delante, he estado mirando que ofrece Ceph y a
que precio, lo he comparado con otros sistema de almacenamiento más
tradicionales y mi sorpresa ha sido que no parece tener un precio tan reducido
como algunos dicen.

Para centrarnos un poco lo primero será ver que es exactamente y podemos hacer
con Ceph.

Ceph es un sistema de almacenamiento distribuido altamente escalable bajo


licencia GPL. Ceph pretende ser un sistema de archivos completamente
distribuido y sin ningún punto de fallo. La replicación usa sistemas tolerantes a
fallos para obtener datos libres de errores.

He llegado a leer que los sistemas RAID no garantizan la integridad de los datos y
cuando mayor es el almacenamiento que deben tratar más posibilidades hay de
que corrompan los datos. Supongo que las personas que hablan de esto se
basarán en controladoras RAID de ir por casa ya que cualquier controladora de
servidores con su cache, su batería para garantizar el guardado de los datos de
cache y sus controles de integridad no solo garantizan que los datos son escritos
correctamente y la integridad de sus checksum sino que mejoran muchísimo el
rendimiento de acceso a los mismos.

Ceph usa la replicación para obtener redundancia en los datos y mejorar el


rendimiento de acceso a los mismos, proporcionando sistemas que garantizan la
integridad de todos ellos.

Desde la versión 2.6.34.2, el kernel de Linux incluye soporte a Ceph.

Ceph nos permite almacenar objetos, dispositivos de bloques y ficheros.

Nos permite acceso directo a objetos usando lenguajes nativos como bindins o
radosgw.

También ofrece dispositivos de bloques a los clientes.


Y nos puede ofrecer recursos en red para acceder a los ficheros que queramos
compartir.

Resumiendo, nos ofrece acceso a objetos, a dispositivos de bloques tipo iSCSI y a


sistemas de ficheros tipo nfs o samba. Algo parecido a lo que viene siendo hoy en
día los sistemas de almacenamiento SAN o los NAS más avanzados.

Por lo tanto si nos ofrece casi lo mismo, ¿ porque nos podemos plantear usar
Ceph en lugar de cualquiera de estos otros sistemas ?

Vamos a comparar Ceph frente a una SAN estilo emc2 y un NAS del estilo QNAP.

¿ Rendimiento ?

No he hecho pruebas de rendimiento de Ceph ni he encontrado nada que me


pueda orientar, pero aplicando un poco de lógica, la teoría que todos conocemos y
datos de rendimiento propios de algunos QNAP y otros ofrecidos por compañeros
que han usado SAN, podemos darnos cuenta que el rendimiento no va a depender
tanto del sistema de almacenamiento que usemos como del hardware sobre el
que corran, como pueden ser el tipo de discos SATA, SAS, SSD o la conectividad
que ofrezcan 1Gb/s, 10Gb/s, …

Eso si, con Ceph vamos a tener la posibilidad de realizar balanceo de carga entre
todos los servidores que dispongamos, lo que nos permitirá aumentar
considerablemente el rendimiento, al menos en lectura y de manera distribuida. No
obstante, no quiere decir en ningún momento que esto no se pueda realizar con
ningún otro sistema de almacenamiento.

¿ Escalabilidad ?

Los tres sistemas son muy escalables pero en este punto Ceph puede destacar ya
que no va a depender de la conectividad entre el hardware que maneja el
almacenamiento si no de los servidores que queramos interconectar.

¿ Bajo coste ?

y aquí es donde yo quería llegar. Según la documentación oficial de Ceph los


requisitos mínimos son:

CPU.

 Demonio MDS (Metadatos). Uso de CPU intensivo, mínimo un quad core o


mejor
 Demonio OSD. Uso considerable de CPU, mínimo dual core
 Monitores. Uso normal
Se recomienda que los servicios de uso intensivo estén en hosts diferentes.

RAM.

 MDS y Monitores. 1GB por instancia


 OSDs. 500MB por instancia
Y como no, nos recomiendan cuanta más memoria mejor.

Almacenamiento.

En ciertas operaciones (rebalancing, backfilling y recovery) se necesitan


aproximádamente 1GB RAM por cada TB de espacio en los OSDs

El Sistema Operativo y los OSDs deben de estar en diferentes discos, así como
los diferentes servicios.

Ejecutar OSD, monitor y metadatos en el mismo disco NO es buena idea.

Para el journal en el OSD se recomienda el uso de discos SSD.

Red.

Un mínimo de 2 x 1G/s por servicio, recomendado 10Gb/s.

Hay que tener en cuenta que replicar 1TB en una red a 1Gb/s puede tardar unos 3
horas.

Por lo tanto, ellos mismos nos recomiendan una configuración mínimo como la
que sigue.

Servers: 2 x Quad Core Xeon


16GB RAM
8 x 2TB -> 1 S.O., 7 almacenamiento
2 x 1Gb/s para los clientes
2 x 1Gb/s para los OSDs
2 x 1Gb/s para la administración

2 servidores de este estilo para montar un sistema de almacenamiento en el cual


se ofrecen objetos y dispositivos de bloques.
3 servidores si queremos añadir sistema de ficheros tipo nfs o samba (para el
servidor de metadatos)
Un servidor así puede estar alrededor de los 5.000€ x 3 servidores 15.000€ para
obtener 14TB de almacenamiento distribuido

Si esto mismo lo quisiésemos obtener mediante una SAN podríamos optar por
alguna del estilo emc2 con doble fuente de alimentación, doble controladora 6
discos de 2TB (12TB a falta de configurar redundancia) (con capacidad para 12
discos) 2 x 1Gb/s para acceso de los clientes por unos 10.000€

Otra alternativa es optar por dispositivos NAS/SAN tipo QNAP, por ejemplo TS-
EC879U con capacidad para 8 discos, doble fuente de alimentación, 4 x 1Gb/s, 8
discos de 2TB (16TB a falta de configurar redundancia) y solamente una
controladora por aproximadamente unos 5.000€

No obstante, hablar de bajo coste o almacenamiento asequible cuando hablamos


de Ceph puede resultar algo paradójico.

Si partimos de una base en la que disponemos del hardware y queremos


aprovecharlo e ir aumentando nuestra infraestructura según lo vayamos
necesitando, Ceph es una buena opción si tenemos previsto llegar a hacer un uso
intensivo de almacenamiento.

Si tenemos que montar una infraestructura nueva y no disponemos del hardware o


nuestra empresa es mediana/pequeña y no vamos a necesitar más
almacenamiento que el básico/mínimo comentado aquí, puede ser que otras
alternativas terminen resultandonos más económicas y fáciles de implementar.

Desde mi punto de vista, esto no hace más que confirmar que Ceph NO es de
bajo coste cuando hablamos de infraestructuras pensadas para pequeñas o
medianas empresas. No obstante, cuando más escalemos este sistema, mejor
nos saldrá el precio por MB y más rendimiento nos ofrecerá, pero ya estamos
hablando de sistemas de almacenamiento pensados para grandes empresas.

Discos Duros
Dispositivo de almacenamiento de datos no volátil. Existen dos
tipos: magnéticos (HD) y de estado sólido (SSD). Las diferencias principales
entre ambos son la velocidad a la cual se accede a los datos, el tiempo de vida del
dispositivo y el precio, los discos SSD son mucho más rápidos que los
magnéticos, pero tienen un tiempo de vida menor y el precio por unidad de
almacenamiento es mucho mayor.
Discos duros magnéticos. Un disco duro o disco rígido (en inglés hard disk
drive) es un dispositivo de almacenamiento no volátil, que conserva la información
incluso una vez apagado, que emplea un sistema de grabación magnética digital;
es donde en la mayoría de los casos se encuentra almacenado el sistema
operativo de la computadora.

Los dispositivos magnéticos son aquellos dispositivos de almacenamiento de


datos en los que se utilizan las propiedades magnéticas de los materiales para
almacenar información digital.
Unidad de cinta magnética[editar]
Artículos principales: Unidad de cinta, Linear Tape-Open y Digital Linear Tape.

Véase también: Cinta magnética de almacenamiento de datos

El dispositivo de cintas magnéticas de gran capacidad, son unidades magnéticas


especiales que se utilizan para realizar respaldo o copias de seguridad de datos
en empresas y centros de investigación. Su capacidad de almacenamiento puede
ser de cientos de gigabytes.
También denominada tape, en inglés, o casetera, por el uso de casete o
cartuchos de cinta magnética de almacenamiento de datos.
Tecnologías:

You might also like