MapD: databasis wat op GPU's werk

Vandag ervaar ons die verskynsel van Big Data, kan ons 'n geweldige hoeveelheid data verkry uit 'n oneindige aantal bronne. Hierdie groot hoeveelheid data hou baie voordele in, maar dit bied ook baie uitdagings. Die mees algemene daarvan: reaksietye in grootmaat datastel.

1

Kaart D. is gebore om hoë snelhede op die gebied van analitiese databasisse aan te bied. Ontwerp om te verwerk triljoene rekords binne 'n kwessie van millisekondes gebruik te maak van die rekenaarkrag wat aangebied word deur GPU's. Dit is presies gebou om al die hardeware- en sagtewaremoontlikhede wat beskikbaar is in grafiese kaarte ten volle te benut, en bied ontleders en datawetenskaplikes 'n reaksietyd van ongeveer 3 orde (x1000) bo tegnologieë wat voorheen vir hierdie doeleindes gebruik is. Gebruik te maak van die paralleliteit van GPU's (ongeveer 80000 cores in moderne GPU's) en groot geheuebandwydtes (ongeveer 8 Gbps) om lineêre algebra- en databasis-soektogte uit te voer, met behulp van LLVM om elkeen in reële tyd saam te stel konsultasie, behalwe om die mees geraadpleegde data in die geheue van die GPU's (hoëspoed DDR5-geheue) te hou.

Ons moet onthou dat in die Big Data-wêreld tradisionele databasisse nie gebruik word nie, gebaseer op die skryf en bewaring van lêers, aangesien dit 'n buitensporige hoeveelheid I / O-take op die hardeskyf sou veroorsaak. Met die doel om miljarde rekords te ontleed, word die geheue databasisse, soos Apache Spark. Om die hoeveelheid geheue en die gewenste werkverrigting te bekom, benodig u 'n bedienergroep en ons weet dat dit koste verbonde is aan hardeware, netwerkkabels en 'n groter aantal tegnici. Dus, Kaart D. bied die vermoë om hoë werkverrigting met minder koste en ingewikkeldheid te behaal, sodat meer mense toegang tot hoëprestasietegnologieë kan kry vir data-analise.

3

Danksy die ondersteuning deur GPU's, is MapD ook bied 'n omgewing vir data-visualisering wat gebruik maak van die grafiese vermoëns van GPU's. Dit vergemaklik die skepping van interaktiewe grafieke met 'n groot hoeveelheid data, wat interaksie met die inligting bykans in reële tyd moontlik maak (die nat droom van elke data-ontleder). Benewens die insluiting van 'n paar masjienleeralgoritmes (Machine Learning), kan u ook gevorderde analises uitvoer met dieselfde omgewing met behulp van GPU's.

2

Ons nooi u uit om deur die MapD amptelike bladsy om elkeen van sy funksies in meer besonderhede te hersien. Hulle bied ook 'n artikel wat u gratis kan aflaai, waarin die tegnologieë en benaderings uiteengesit word wat MapD moontlik gemaak het. U kan selfs van sommige geniet demos verrassend!
MapD is tans in beta en beskikbaar vir Linux, kan u aan hulle skryf (saam met 'n verklaring) om daaraan deel te neem.


Die inhoud van die artikel voldoen aan ons beginsels van redaksionele etiek. Klik op om 'n fout te rapporteer hier.

'N Opmerking, los joune

Laat u kommentaar

Jou e-posadres sal nie gepubliseer word nie. Verpligte velde gemerk met *

*

*

  1. Verantwoordelik vir die data: Miguel Ángel Gatón
  2. Doel van die data: Beheer SPAM, bestuur van kommentaar.
  3. Wettiging: U toestemming
  4. Kommunikasie van die data: Die data sal nie aan derde partye oorgedra word nie, behalwe deur wettige verpligtinge.
  5. Datastoor: databasis aangebied deur Occentus Networks (EU)
  6. Regte: U kan u inligting te alle tye beperk, herstel en verwyder.

  1.   Jesus Perales dijo

    Moet u nooit daardie soort ding voorstel nie, as dit vir my eers vreemd gelyk het, dink alles weer aan