MapD: base de dades que funciona a GPUs

Avui dia ens trobem vivint el fenomen de la Big Data, podem obtenir una immensa quantitat de dades duna infinitat de fonts. Aquesta immensa quantitat de dades porta molts beneficis, però també comporta molts desafiaments. El més comú: els temps de resposta en set de dades massives.

1

MapD neix per oferir altes velocitats al camp de les bases de dades analítiques. Dissenyada per processar bilions de registres en qüestió de mil·lisegons aprofitant el poder de còmput que ofereixen els GPUs. Construïda precisament per aprofitar al màxim totes les capacitats de maquinari i programari disponibles en targetes gràfiques, ofereix als analistes i científics de dades temps de resposta d'uns 3 ordres de magnitud (x1000) per sobre sobre les tecnologies emprades anteriorment per a aquests propòsits. Aprofitant el paral·lelisme dels GPUs (Aproximadament uns 80000 nuclis a les GPUs modernes) i els grans amples de banda de memòria (Al voltant de 8Gbps) per realitzar tasques d'àlgebra lineal i cerques en base de dades, emprant LLVM per compilar en temps real cada consulta, a més de mantenir la data més consultada a la memòria cau del GPUs (Memòries DDR5 d'alta velocitat).

Hem de recordar que al món de Big Data no solen emprar-se bases de dades les bases de dades tradicionals, fonamentades en l'escriptura i la preservació d'arxius, ja que aquestes causarien una excessiva quantitat de tasques d'I/O en disc dur. Per al propòsit d'analitzar bilions de registres, es fan servir les bases de dades in-memory, com Apache Spark. No obstant això, per obtenir la quantitat de memòria necessària i el rendiment desitjat, cal un clúster de servidors i sabem que això implica costos en maquinari, cablejat de xarxes i un nombre més gran de tècnics. Per tant, MapD ofereix la capacitat d'obtenir alt rendiment amb menys cost i complexitat, permetent que més persones tinguin accés a tecnologies d'alt rendiment per a anàlisi de dades.

3

Gràcies a estar sustentada per GPUs, MapD també ofereix un entorn per a visualització de dades aprofitant les capacitats gràfiques dels GPUs. Facilita la creació de gràfics interactius amb un alt volum de dades, permetent interactuar amb la informació gairebé en temps real (el somni humit de tot analista de dades). A més d'incloure alguns algorismes d'aprenentatge automàtic (Machine Learning), per fer anàlisis avançades amb el mateix entorn usant les GPU.

2

Et convidem a passejar-te per la pàgina oficial de MapD per revisar amb més detall cadascuna de les característiques. També ofereixen un paper, que pots descarregar de forma gratuïta, on detallen les tecnologies i els enfocaments que han fet possible a MapD. Fins i tot en pots gaudir d'algunes demostracions sorprenents!
Actualment, MapD es troba en fase beta i disponible per a Linux, pots escriure'ls (juntament amb una exposició de motius) per participar-hi.


Un comentari, deixa el teu

Deixa el teu comentari

La seva adreça de correu electrònic no es publicarà. Els camps obligatoris estan marcats amb *

*

*

  1. Responsable de les dades: Miguel Ángel Gatón
  2. Finalitat de les dades: Controlar l'SPAM, gestió de comentaris.
  3. Legitimació: El teu consentiment
  4. Comunicació de les dades: No es comunicaran les dades a tercers excepte per obligació legal.
  5. Emmagatzematge de les dades: Base de dades allotjada en Occentus Networks (UE)
  6. Drets: En qualsevol moment pots limitar, recuperar i esborrar la teva informació.

  1.   Jesús Perales va dir

    Jamas imagini aquest tipus de coses, si en principi em semblava rara rethinkdb, tot sigui per l'avenç