MapD: database die werkt op GPU's

Tegenwoordig ervaren we het fenomeen van Big datakunnen we een enorme hoeveelheid gegevens verkrijgen uit een oneindig aantal bronnen. Deze enorme hoeveelheid gegevens brengt veel voordelen met zich mee, maar brengt ook veel uitdagingen met zich mee. De meest voorkomende: reactietijden in bulk dataset.

1

KaartD is geboren om hoge snelheden te bieden op het gebied van analytische databases. Ontworpen om te verwerken biljoenen records in een kwestie van milliseconden profiteren van de rekenkracht die wordt geboden door GPU's. Het is precies gebouwd om volledig te profiteren van alle hardware- en softwaremogelijkheden die beschikbaar zijn in grafische kaarten en biedt analisten en datawetenschappers responstijden van ongeveer 3 orden van grootte (x1000) boven technologieën die eerder voor deze doeleinden werden gebruikt. Profiteren van het parallellisme van GPU's (ongeveer 80000 cores in moderne GPU's) en grote geheugenbandbreedtes (ongeveer 8 Gbps) om lineaire algebra- en databasezoekopdrachten uit te voeren, met behulp van LLVM om elk in realtime te compileren query, naast het bewaren van de meest geraadpleegde gegevens in de cache van de GPU's (snelle DDR5-geheugens).

We moeten niet vergeten dat in de Big Data-wereld geen traditionele databases worden gebruikt, gebaseerd op het schrijven en bewaren van bestanden, aangezien deze een buitensporige hoeveelheid I / O-taken op de harde schijf zouden veroorzaken. Voor het analyseren van miljarden records is de in-memory databases, zoals Apache Spark. Om de benodigde hoeveelheid geheugen en de gewenste prestaties te verkrijgen, is echter een servercluster nodig en we weten dat dit kosten met zich meebrengt in hardware, netwerkbekabeling en een groter aantal technici. Dus, KaartD biedt de mogelijkheid om hoge prestaties te bereiken met minder kosten en complexiteit, waardoor meer mensen toegang hebben tot hoogwaardige technologieën voor gegevensanalyse.

3

Dankzij de ondersteuning van GPU's kan MapD ook biedt een omgeving voor datavisualisatie door gebruik te maken van de grafische mogelijkheden van GPU's. Het vergemakkelijkt het maken van interactieve grafieken met een grote hoeveelheid gegevens, waardoor interactie met de informatie bijna in realtime mogelijk is (de natte droom van elke gegevensanalist). Naast het opnemen van enkele algoritmen voor machine learning (Machine Learning), om geavanceerde analyses uit te voeren met dezelfde omgeving met behulp van GPU's.

2

We nodigen je uit om door de MapD officiële pagina om elk van de functies in meer detail te bekijken. Ze bieden ook een paper aan, die u gratis kunt downloaden, waarin de technologieën en benaderingen worden beschreven die MapD mogelijk hebben gemaakt. Je kunt er zelfs van genieten demos verrassend!
MapD is momenteel in bèta en beschikbaar voor Linux, kunt u hen schrijven (samen met een toelichting) om eraan deel te nemen.


Laat je reactie achter

Uw e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd met *

*

*

  1. Verantwoordelijk voor de gegevens: Miguel Ángel Gatón
  2. Doel van de gegevens: Controle SPAM, commentaarbeheer.
  3. Legitimatie: uw toestemming
  4. Mededeling van de gegevens: De gegevens worden niet aan derden meegedeeld, behalve op grond van wettelijke verplichting.
  5. Gegevensopslag: database gehost door Occentus Networks (EU)
  6. Rechten: u kunt uw gegevens op elk moment beperken, herstellen en verwijderen.

  1.   Jezus Perales zei

    Stel je dat soort dingen nooit voor, als het me eerst vreemd voorkwam, is alles voor de opmars