Professional Documents
Culture Documents
PROJECT VOLDEMORT
Voldemort es una base de datos NoSQL creada por LinkedIn para solucionar un
problema de escalabilidad que tenia con las base de datos relacionales y luego donado a
la comunidad.
Voldemort es una base de datos NoSQL orientada a guardar datos de forma clave-valor.
Permite configurar diferentes Nodos los cuales contienen los datos y a la vez los datos
se van replicando de forma que si se cae un nodo la base siga trabajando.
Algunas caractersticas de Voldemort:
--Los datos se replican automticamente a travs de servidores mltiples.
--Los datos son automticamente particionados por lo tanto cada servidor contiene slo
un subconjunto de los datos totales
--Las Fallas en el servidor son manejado de forma transparente
--Permite sereailizar con diferentes frameworks Protocol Buffers, Thrift, Avro y Java
Serialization; adems permite seriabilizar objetos complejos como listas, arregles, etc.
--Los elementos de datos estn versionados para maximizar la integridad de los datos
sin comprometer la disponibilidad del sistema
--Cada nodo es independiente de otros nodos
--Un buen rendimiento solo nodo: se puede esperar 10-20k de operaciones por
segundo en funcin de las mquinas, la red, el sistema de disco, y el factor de
replicacin de datos
--Utiliza una estrategia que permite tener nodos en distintos lugares geogrficos.
--Voldemort es libre y fue escrito en java. Tiene una buena documentacin y una
comunidad activa.
SENSEI DB
Sensei es un sistema distribuido de datos, que fue construida para apoyar muchas
iniciativas de producto de LinkedIn, incluyendo la bsqueda en tiempo rea,l facetas
de la seal y la alimentacin de las noticias y fichas de la pgina principal . Es la base
de la bsqueda de LinkedIn y la infraestructura de datos.
Sensei es a la vez un motor de bsqueda y una base de datos. Est diseado para
consultar y navegar a travs de documentos que consisten de texto no estructurado y
estructurado. y metadatos.
Sensei soporta un leguaje de consulta llamado BQL (Browsing Query Language), que es
muy similar a SQL, pero que se adapta a este tipo de base de datos no relaciones.
GLOSARIO
Escalabilidad: es la propiedad deseable de un sistema, de estar preparado para hacerse
ms grande sin perder calidad en los servicios ofrecidos.
En general, tambin se podra definir como la capacidad del sistema informtico de
cambiar su tamao o configuracin para adaptarse a las circunstancias cambiantes.
La escala horizontalmente o escala significa agregar ms nodos a un sistema.
Search Business Analytics, es el descubrimiento y la comunicacin de patrones
significativos en los datos.
Base de Dato tipo Clave - Valor: Este tipo de bases de datos organizan la informacin
como pares de llaves y valores. Cada llave (o clave) se corresponde con un nico valor
o estructura de datos que contiene valores. Esta idea surgi en Amazon y fue
implementada con el nombre de Dynamo. Algunos otros ejemplos de este tipo de base
de datos son: Apache Cassandra, Project Voldemort, entre otros.
Metadatos : dato sobre el dato, ya que su intencin
era proporcionar la informacin mnima necesaria para identificar un recurso; digamos
que es la informacin insertada en los archivos por el software de edicin o creacin de
los mismos, estos metadatos contienen informacin acerca de la creacin del archivo
como: nombre de autor, autores anteriores, nombre de compaa, cantidad de veces que
el documento fue modificado, fecha de creacin