Avui dia ens trobem vivint el fenomen de la Big Data, podem obtenir una immensa quantitat de dades duna infinitat de fonts. Aquesta immensa quantitat de dades porta molts beneficis, però també comporta molts desafiaments. El més comú: els temps de resposta en set de dades massives.
MapD neix per oferir altes velocitats al camp de les bases de dades analÃtiques. Dissenyada per processar bilions de registres en qüestió de mil·lisegons aprofitant el poder de còmput que ofereixen els GPUs. Construïda precisament per aprofitar al mà xim totes les capacitats de maquinari i programari disponibles en targetes grà fiques, ofereix als analistes i cientÃfics de dades temps de resposta d'uns 3 ordres de magnitud (x1000) per sobre sobre les tecnologies emprades anteriorment per a aquests propòsits. Aprofitant el paral·lelisme dels GPUs (Aproximadament uns 80000 nuclis a les GPUs modernes) i els grans amples de banda de memòria (Al voltant de 8Gbps) per realitzar tasques d'à lgebra lineal i cerques en base de dades, emprant LLVM per compilar en temps real cada consulta, a més de mantenir la data més consultada a la memòria cau del GPUs (Memòries DDR5 d'alta velocitat).
Hem de recordar que al món de Big Data no solen emprar-se bases de dades les bases de dades tradicionals, fonamentades en l'escriptura i la preservació d'arxius, ja que aquestes causarien una excessiva quantitat de tasques d'I/O en disc dur. Per al propòsit d'analitzar bilions de registres, es fan servir les bases de dades in-memory, com Apache Spark. No obstant això, per obtenir la quantitat de memòria necessà ria i el rendiment desitjat, cal un clúster de servidors i sabem que això implica costos en maquinari, cablejat de xarxes i un nombre més gran de tècnics. Per tant, MapD ofereix la capacitat d'obtenir alt rendiment amb menys cost i complexitat, permetent que més persones tinguin accés a tecnologies d'alt rendiment per a anà lisi de dades.
Grà cies a estar sustentada per GPUs, MapD també ofereix un entorn per a visualització de dades aprofitant les capacitats grà fiques dels GPUs. Facilita la creació de grà fics interactius amb un alt volum de dades, permetent interactuar amb la informació gairebé en temps real (el somni humit de tot analista de dades). A més d'incloure alguns algorismes d'aprenentatge automà tic (Machine Learning), per fer anà lisis avançades amb el mateix entorn usant les GPU.
Et convidem a passejar-te per la pà gina oficial de MapD per revisar amb més detall cadascuna de les caracterÃstiques. També ofereixen un paper, que pots descarregar de forma gratuïta, on detallen les tecnologies i els enfocaments que han fet possible a MapD. Fins i tot en pots gaudir d'algunes demostracions sorprenents!
Actualment, MapD es troba en fase beta i disponible per a Linux, pots escriure'ls (juntament amb una exposició de motius) per participar-hi.