TOOLinux

Le journal du Libre

Cassandra se refait une beauté pour le Google Summer of Code

lundi 19 avril 2010

Cassandra est un Système de Gestion de Base de Données (SGBD) NoSQL, un des principaux projet de la Fondation Apache. Cassandra est conçue pour gérer des quantités massives de données réparties sur plusieurs serveurs (cluster), en assurant tout particulièrement une disponibilité maximale des données et en éliminant les point individuel de défaillance.

Initialement développée par Facebook, l’application a été libéré dans l’espace open-source et rapidement adoptée par plusieurs grandes entreprises gérant d’importants volumes de données, telles que Twitter ou digg.com. Jeff Hammerbacher, directeur de la division Data chez Facebook, a décrit Cassandra comme "une application du type de BigTable servie par une infrastructure proche de Dynamo."

Cassandra est basée sur une structuration en paires clé-valeur de type eventually consistent3. L’architecture relationnelle est orientée colonne, avec des éléments plus traditionnels (stockage horizontal des paires).

La version 0.6.0 vient d’être livrée et les nouveautés devraient être publiées d’ici quelques heures sur le site web svn d’Apache..

Quoi de neuf ?
Outre la prise en charge du cache intégré par élément et un travail d’optimisation sur l’API thrift, la nouvelle version comprend une gestion expérimentale de l’authentification et le "map reduce" avec Hadoop et Pig.