MapD: Zbirka podatkov, ki deluje na grafičnih procesorjih

Danes se srečujemo s pojavom Big Podatki, lahko dobimo ogromno podatkov iz neskončnega števila virov. Ta ogromna količina podatkov prinaša številne koristi, prinaša pa tudi veliko izzivov. Najpogostejši med njimi: odzivni časi v množičnem naboru podatkov.

1

Zemljevid D se je rodil, da ponuja visoke hitrosti na področju analitičnih baz podatkov. Zasnovan za obdelavo bilijone zapisov v nekaj milisekundah izkoriščanje računalniške moči, ki jo ponuja Grafične kartice. Zgrajen natančno tako, da v celoti izkoristi vse zmogljivosti strojne in programske opreme, ki so na voljo na grafičnih karticah, analitikom in podatkovnim znanstvenikom ponuja odzivne čase približno 3 velikosti (x1000) nad tehnologijami, ki so bile prej uporabljene za te namene. Izkoriščanje vzporednosti grafičnih procesorjev (približno 80000 jeder v sodobnih grafičnih procesorjih) in velike pasovne širine pomnilnika (približno 8 Gb / s) za izvajanje linearnih algebrov in baz podatkov, z uporabo LLVM za sestavljanje v realnem času posvetovanje, poleg tega pa v predpomnilnik grafičnih procesorjev (hitri pomnilniki DDR5) hranijo podatke, o katerih je največ podatkov.

Ne smemo pozabiti, da se v svetu velikih podatkov ne uporabljajo tradicionalne zbirke podatkov, ki temeljijo na pisanju in ohranjanju datotek, saj bi te povzročile preveliko količino V / I opravil na trdem disku. Za analizo milijard zapisov je podatkovne baze v pomnilniku, kot je Apache Spark. Da pa dobite potrebno količino pomnilnika in želeno zmogljivost, potrebujete strežniško gručo in vemo, da to pomeni stroške strojne opreme, omrežnih kablov in večje število tehnikov. Tako Zemljevid D ponuja sposobnost doseganja visoke učinkovitosti z manj stroški in zapletenosti, kar omogoča več ljudem dostop do visoko zmogljivih tehnologij za analizo podatkov.

3

Zahvaljujoč podpori GPU-jev, MapD tudi ponuja okolje za vizualizacijo podatkov z izkoriščanjem grafičnih zmogljivosti grafičnih procesorjev. Omogoča ustvarjanje interaktivnih grafov z veliko količino podatkov, kar omogoča interakcijo z informacijami skoraj v realnem času (mokre sanje vsakega analitika podatkov). Poleg vključitve nekaterih algoritmov strojnega učenja (Machine Learning), za izvajanje napredne analize z istim okoljem z uporabo grafičnih procesorjev.

2

Vabimo vas na sprehod po Uradna stran MapD podrobneje pregledati vsako od njegovih lastnosti. Ponujajo tudi članek, ki ga lahko brezplačno prenesete, v katerem so podrobno opisane tehnologije in pristopi, ki so omogočili MapD. V nekaterih lahko celo uživate demos presenetljivo!
MapD je trenutno v različici beta in na voljo za Linux, lahko jim pišete (skupaj z obrazložitvijo), da sodelujejo v njem.


Pustite svoj komentar

Vaš e-naslov ne bo objavljen. Obvezna polja so označena z *

*

*

  1. Za podatke odgovoren: Miguel Ángel Gatón
  2. Namen podatkov: Nadzor neželene pošte, upravljanje komentarjev.
  3. Legitimacija: Vaše soglasje
  4. Sporočanje podatkov: Podatki se ne bodo posredovali tretjim osebam, razen po zakonski obveznosti.
  5. Shranjevanje podatkov: Zbirka podatkov, ki jo gosti Occentus Networks (EU)
  6. Pravice: Kadar koli lahko omejite, obnovite in izbrišete svoje podatke.

  1.   Jezus Perales je dejal

    Nikoli si ne predstavljajte takšnih stvari, če se mi je sprva zdelo nenavadno, da premislimdb, je vse vnaprej