MapD: database che funziona su GPU

Oggi stiamo vivendo il fenomeno di Big Data, possiamo ottenere un'immensa quantità di dati da un numero infinito di fonti. Questa immensa quantità di dati porta molti vantaggi, ma comporta anche molte sfide. I più comuni: tempi di risposta nel set di dati in blocco.

1

MappaD nasce per offrire alte velocità nel campo dei database analitici. Progettato per elaborare trilioni di record in pochi millisecondi sfruttando la potenza di calcolo offerta da GPU. Costruito precisamente per sfruttare appieno tutte le capacità hardware e software disponibili nelle schede grafiche, offre ad analisti e data scientist tempi di risposta di circa 3 ordini di grandezza (x1000) rispetto alle tecnologie precedentemente impiegate per questi scopi. Sfruttando il parallelismo delle GPU (circa 80000 core nelle moderne GPU) e ampie larghezze di banda di memoria (circa 8 Gbps) per eseguire ricerche di algebra lineare e database, utilizzando LLVM per compilare in tempo reale ogni consultazione, oltre a conservare i dati più consultati in la cache delle GPU (memorie DDR5 ad alta velocità).

Dobbiamo ricordare che nel mondo dei Big Data non vengono utilizzati database tradizionali, basati sulla scrittura e conservazione dei file, poiché questi causerebbero una quantità eccessiva di attività di I / O sull'hard disk. Allo scopo di analizzare miliardi di record, il file database in memoria, come Apache Spark. Tuttavia, per ottenere la quantità di memoria necessaria e le prestazioni desiderate, è necessario un cluster di server e sappiamo che ciò implica costi in hardware, cablaggio di rete e un maggior numero di tecnici. Quindi, MappaD offre la possibilità di ottenere prestazioni elevate con meno costi e complessità, consentendo a più persone di avere accesso a tecnologie ad alte prestazioni per l'analisi dei dati.

3

Grazie al supporto delle GPU, anche MapD offre un ambiente per la visualizzazione dei dati sfruttando le capacità grafiche delle GPU. Facilita la creazione di grafici interattivi con un elevato volume di dati, permettendo di interagire con le informazioni quasi in tempo reale (il sogno bagnato di ogni analista di dati). Oltre a includere alcuni algoritmi di machine learning (Machine Learning), per eseguire analisi avanzate con lo stesso ambiente utilizzando GPU.

2

Ti invitiamo a passeggiare nel Pagina ufficiale di MapD per rivedere ciascuna delle sue caratteristiche in modo più dettagliato. Offrono anche un documento, che puoi scaricare gratuitamente, che descrive in dettaglio le tecnologie e gli approcci che hanno reso possibile MapD. Puoi anche godertene alcuni demos sorprendente!
MapD è attualmente in versione beta e disponibile per Linux, puoi scrivere loro (insieme a una dichiarazione esplicativa) per parteciparvi.


Lascia un tuo commento

L'indirizzo email non verrà pubblicato. I campi obbligatori sono contrassegnati con *

*

*

  1. Responsabile dei dati: Miguel Ángel Gatón
  2. Scopo dei dati: controllo SPAM, gestione commenti.
  3. Legittimazione: il tuo consenso
  4. Comunicazione dei dati: I dati non saranno oggetto di comunicazione a terzi se non per obbligo di legge.
  5. Archiviazione dati: database ospitato da Occentus Networks (UE)
  6. Diritti: in qualsiasi momento puoi limitare, recuperare ed eliminare le tue informazioni.

  1.   Jesus Perales suddetto

    Non immaginare mai quel genere di cose, se all'inizio mi è sembrato strano ripensare, tutto è per l'avanzata