SOLUTIONS

Solutions Big Data

Voici une liste des solutions à l’origine du Big Data, solutions qui constituent encore à ce jour le socle logiciel majoritairement en vigueur sur le marché. Mais le Big Data est un secteur très dynamique, qui avance vite : chaque jour, de nouvelles solutions sont proposées sur le marché. A vous de les découvrir dans nos pages, notamment dans l’annuaire des entreprises du Big Data.


Il n’est pas surprenant que ce soit les principaux acteurs du web qui aient développé les toutes premières solutions de gestion de données Big Data, Google, Yahoo!, Facebook et Twitter en tête. Les moteurs de recherche et les réseaux sociaux ont dû en effet se doter rapidement de solutions capables de traiter efficacement des volumes considérables et en perpétuelle croissance de données issues du web. Dans le tableau ci-dessous, on distingue les solutions propres aux bases de données et les plates-formes de développement et de traitement des données :

google

Technologie Description
Big Table SGBD propriétaire basé sur GFS (Google File System). Big Table, solution propriétaire, est à l’origine de Hbase, solution Open Source.
MapReduce Plate-forme de développement pour traitements distribués

yahoo!

Technologie Description
Hadoop Plate-forme de développement pour traitements distribués conçue pour la gestion de gros volumes de données. Basé à l’origine sur Big Table, MapReduce et GFS.
S4 Plate-forme de développement pour applications de traitement continu des flux de données

facebook

Technologie Description
Cassandra SBGD NoSQL pour données distribuées
Hive Logiciel d’analyse de données basé sur Hadoop

twitter

Technologie Description
Storm Plate-forme de traitement de données massives
DlockDB SGBD distribué de type graphe

linkedin

Technologie Description
Kafka Système distribué de gestion des messages
SenseiDB SGBD temps réel de données distribuées et semi-structurées
Voldemort SGBD de données massives et distribuées

Le tableau ci-dessus est tiré du livre « Enjeux et usages du Big Data » de C. Brasseur (Collection Management et informatique) 2013.


Ces solutions, développées initialement en interne, ont rapidement évolué en solutions open source. Les grands éditeurs de logiciel ont poursuivi cette démarche de l’open source avec leurs solutions Big Data : Oracle utilise Hadoop dans son offre Big Data Appliance, tout comme Microsoft avec son offre Windows Azure, IBM, Netapp, etc.

Voir aussi : Technologies Big DataArchitecture Big DataEntreprises Big Data

Les solutions de Big Data