Chargement...

 

Du SQL aux tableaux associatifs

Des langages différents pour des usages différents

Comme le démontre Alec Ross dans "The Industries of the Future", stocker des données sans pouvoir analyser celles-ci est inutile voir dangereux.

Depuis maintenant plus de 30 ans, le SQL (ou Structured Query Language) est l'interface standard permettant aux entreprises d'extraire de la valeur des données en leur possession.

Au début des années 2000, la démocratisation du Web auprès du grand public à conduit certaines sociétés Américaines à développer de nouvelles technologies, les bases NoSQL, pour leur permettre de stocker et d'indexer l'ensemble des pages du Web ainsi que les liens existant entre celles-ci.

Plus récemment, pour répondre à des challenges similaires à ceux rencontrés par les géants du Web, de nouveaux types de bases de données ont émergé : les bases NewSQL. Ces bases permettent à la fois de gérer de très gros volumes de données semi-structurées ou non-structurées mais intègrent aussi en leur sein des algorithmes sophistiqués d'analyse.

History : SQL, NoSQL & NewSQL

Les bases SQL, NoSQL et NewSQL répondent donc à des usages différents, possèdent des modèles de données différents, et sont basées sur des théories mathématiques différentes.

 SQLNoSQLNewSQL
Modèle de donnéesTables relationnellesPaires de (clef, valeur)Matrices creuses
MathématiquesThéorie des ensemblesThéorie des graphesAlgèbre linéaire
ApplicationTransactionsRechercheAnalyse
ExemplePostgreSQLAccumuloSciDB

Tableaux associatifs

Les tableaux associatifs permettent de représenter et de manipuler tous types de données : documents, graphes, transactions, etc. Ils fournissent donc une interface d'accès unifiée et un langage de requête transverse aux différents types de bases de données existant.

Tableaux Associatifs

Le succès des bases SQL, NoSQL et NewSQL est dû à leur efficacité pour résoudre des problèmes particuliers dans une grande variété de domaines d'applications. Les tableaux associatifs permettent aux data scientists d'accéder, de croiser et d'analyser les données collectées sans avoir à se préoccuper du type de base utilisé pour stocker celles-ci.

Références