Système de stockage orienté objet en anneaux

Logo Scality

Des solutions de stockage suivant les même idées directrices que celles que l’on peut trouver dans les grands Cloud publics sont apparues depuis déjà quelques temps maintenant, et je me suis intéressé particulièrement à une solution de stockage orienté objet basée sur un système en anneaux. Cette solution de Scality nommée Ring Organic Storage, propose un système de stockage peu coûteux avec des fonctionnalités similaires à celles que l’on peut trouver sur S3. Il permet d’associer à une URL un objet stocké sous forme de binaire. On note que ce principe d’anneau est le même que l’on trouve sur des bases comme Cassandra, sauf que dans notre cas il s’agit de stockage orienté objet. Je me suis donc intéressé au fonctionnement de cette solution déjà déployée dans des productions chez des hébergeurs et des fournisseurs de service.

Cible
Il est indispensable, dans un premier temps, de prendre conscience que cette solution permettant de mettre en place un des composants d’un Cloud privé est réservée à des sociétés ayant un volume de données suffisamment important (à partir de 100To) ou rencontrant des problématiques de performances (quelques dizaines de To avec d’importants IOs). Il faut dans tous les cas atteindre une masse critique dans son infrastructure pour utiliser ce genre de produit, comme n’importe quel composant de Cloud Computing que l’on souhaite déployer en privé.

[...]

DynamoDB : le décryptage de la nouvelle solution NoSQL de AWS

Logo DynamoDB
DynamoDB, beaucoup de bruit autour de ce nouvel outil AWS… Mais au delà de ce qui est annoncé en termes de performances, de scalabilité sans limite, quels sont les éléments auxquels il faut prendre garde, les non-dits, ceux qu’il faut prendre en compte pour savoir si cet outil correspond à votre besoin ? Je me base sur ce que j’ai lu : articles techniques sur le sujet, documentation du site AWS (FAQ, documentation référence de l’API, …) qui est complète mais qu’il faut prendre le temps de lire, … Je me base aussi sur des essais que j’ai effectués et qui permettent de relever d’autres éléments importants. Je présenterai donc rapidement le concept de l’outil avant de rentrer plus précisément dans les points à prendre en considération, en termes d’utilisation et de facturation. Je présenterai également les différences avec son prédécesseur : SimpleDB. Finalement, j’ai réalisé un mini bench de l’outil dont je vous ferai partager le code et les résultats.

[...]

Windows Azure en pratique…

La PaaS Microsoft Windows Azure est l’une des plateformes « as a service » les plus abouties. Cependant, pour éviter les déceptions, il est important de bien comprendre les caractéristiques clés afin d’en faire le meilleur usage possible. Voici les éléments que je vais aborder :

o Que peut-on faire ou ne pas faire avec une instance de calcul ?

o Comment gérer la persistance des données ?

o Peut-on installer d’autres SGBD / Systèmes clé/valeur ?

[...]

Finalement Cohérent – Revisité

J’ai écrit une première version de cet article au sujet des modèles de cohérence il y a environ un an, mais je n’en étais jamais très content, car il a été rédigé à la hâte, et le sujet est suffisamment important pour mériter un traitement plus approfondi. ACM Queue m’a demandé de réviser l’article afin de le publier dans leur revue, et j’ai profité de cette occasion pour l’améliorer. La nouvelle version suit :

Finalement Cohérent – Construire des systèmes distribués et fiables à l’échelle mondiale exige des compromis entre la cohérence et la disponibilité.

À la base du Cloud Computing de Amazon se trouvent des services d’infrastructure tels S3 (Simple Storage Service) de Amazon, SimpleDB, et EC2 (Elastic Compute Cloud), qui fournissent des ressources pour la construction de plateformes de calcul à l’échelle d’Internet et d’une large gamme d’applications. Les exigences imposées aux dits services en infrastructure sont très strictes : ils doivent afficher de bonnes notes dans les domaines de la sécurité, la scalabilité, la disponibilité, la performance et la rentabilité, et ils doivent satisfaire ces besoins tout en desservant des millions de clients dans le monde, de façon continue.

Sous les couvertures, ces services sont des systèmes distribués colossaux qui opèrent à l’échelle mondiale. Cette échelle crée des défis supplémentaires, car quand un système traite des trillions et des trillions de requêtes, des évènements qui ont habituellement une probabilité d’occurrence faible sont désormais certains de se produire, ce qu’il faut prendre en compte dès le début lors de la conception et dans l’architecture du système. Etant donné l’étendue mondiale de ces systèmes, nous utilisons des techniques de réplication partout afin de garantir une performance cohérente et une haute disponibilité. Bien que la réplication nous rapproche de nos objectifs, elle ne peut les atteindre de façon parfaitement transparente ; sous plusieurs conditions, les clients de ces services seront confrontés avec les conséquences d’avoir utilisé des techniques de réplication au sein des services.

[...]