MapD: base de données qui fonctionne sur les GPU

Aujourd'hui, nous nous trouvons confrontés au phénomène de Big Data, nous pouvons obtenir une immense quantité de données à partir d'un nombre infini de sources. Cette immense quantité de données apporte de nombreux avantages, mais aussi de nombreux défis. Le plus courant d'entre eux: temps de réponse dans l'ensemble de données en masse.

1

CarteD est né pour offrir des débits élevés dans le domaine des bases de données analytiques. Conçu pour traiter des milliards d'enregistrements en quelques millisecondes tirant parti de la puissance de calcul offerte par GPU. Conçu précisément pour tirer pleinement parti de toutes les capacités matérielles et logicielles disponibles dans les cartes graphiques, il offre aux analystes et aux data scientists des temps de réponse d'environ 3 ordres de grandeur (x1000) au-dessus des technologies précédemment utilisées à ces fins. Tirer parti du parallélisme des GPU (environ 80000 cœurs dans les GPU modernes) et des larges bandes passantes mémoire (environ 8 Gbit / s) pour effectuer des recherches d'algèbre linéaire et de base de données, en utilisant LLVM pour compiler en temps réel chacun requête, en plus de conserver les données les plus consultées dans le cache des GPU (mémoires DDR5 à haut débit).

Il faut se rappeler que dans le monde du Big Data, les bases de données traditionnelles ne sont pas utilisées, basées sur l'écriture et la conservation de fichiers, car cela entraînerait une quantité excessive de tâches d'E / S sur le disque dur. Dans le but d'analyser des milliards d'enregistrements, le bases de données en mémoire, comme Apache Spark. Cependant, pour obtenir la quantité de mémoire nécessaire et les performances souhaitées, un cluster de serveurs est nécessaire et nous savons que cela implique des coûts de matériel, de câblage réseau et un plus grand nombre de techniciens. Donc, CarteD offre la possibilité d'atteindre des performances élevées avec moins de coûts et de complexité, ce qui permet à plus de personnes d'avoir accès à des technologies haute performance pour l'analyse des données.

3

Grâce au support des GPU, MapD également offre un environnement de visualisation des données en tirant parti des capacités graphiques des GPU. Il facilite la création de graphiques interactifs avec un volume élevé de données, permettant une interaction avec les informations presque en temps réel (le rêve humide de chaque analyste de données). En plus d'inclure certains algorithmes d'apprentissage automatique (Machine Learning), pour effectuer des analyses avancées avec le même environnement à l'aide de GPU.

2

Nous vous invitons à vous promener dans le Page officielle de MapD pour examiner chacune de ses fonctionnalités plus en détail. Ils proposent également un article que vous pouvez télécharger gratuitement, détaillant les technologies et les approches qui ont rendu MapD possible. Vous pouvez même en profiter démos surprenant!
MapD est actuellement en version bêta et disponible pour Linux, vous pouvez leur écrire (avec une déclaration explicative) pour y participer.


Un commentaire, laissez le vôtre

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont marqués avec *

*

*

  1. Responsable des données: Miguel Ángel Gatón
  2. Finalité des données: Contrôle du SPAM, gestion des commentaires.
  3. Légitimation: votre consentement
  4. Communication des données: Les données ne seront pas communiquées à des tiers sauf obligation légale.
  5. Stockage des données: base de données hébergée par Occentus Networks (EU)
  6. Droits: à tout moment, vous pouvez limiter, récupérer et supprimer vos informations.

  1.   Jésus Perales dit

    N'imaginez jamais ce genre de chose, si au début cela me paraissait étrange rethinkdb, tout est pour l'avancée