InfluxDB, datu kopuru handiak kudeatzeko iturburu irekiko DB bikaina

Datu base bat aukeratzeko orduan Proiektu berri bat edo lehendik dagoen bat lantzen ari zaren hori ordezkatzeko, Hemen dagoeneko aipatu dut blogean aukera aurkitzeko webgunerik onena dela DB-Motorrak, bertan datu base ugari aurki ditzakegu eta ziur nago haien existentziaren berri ere ez zenekiela.

Baina gai nagusira pasatuz, Gaur hitz egingo dugun artikulu hau InfluxDB-ri buruzkoa da, aukera bikaina baita datu kopuru handiak errendimendua sakrifikatu beharrik gabe kudeatzeko.

Jakin behar dugu InfluxDB denbora-serieko datuetarako optimizatutako datu-basea dela eta datu zentro lokalean edo Microsoft Azure, Amazon Web Services (AWS) eta Google Cloud Computing zerbitzuetako hodei irtenbide gisa erabil daiteke.

Denbora serieen datu basea (TSDB) zerbitzaririk gabe funtziona daiteke hodeian edo bere zerbitzariekin datu zentroan. Datu basea Influxdata enpresa estatubatuarra garatzen ari da.

InfluxDB arlo zientifikoan datu kopuru handiak biltegiratzean oinarritzen da eta sentsoreek bidalitako datuak. InfluxDB ohiko datu baseak baino askoz azkarragoa da denbora serieak gorde eta kudeatzeko orduan. Denbora errealeko prozesamendua ere posible da, baita datuak kontsultatzeko Javascript-en oinarritutako Flux barne kontsulta-hizkuntzarekin ere.

Hau programazio lengoaia bat baino gehiago da 8086 atakan SQL kontsulta lengoaia entzutea baino, eta baita InfluxDB ez du kanpoko mendekotasunik eta denbora egitean oinarritutako funtzio integratuak ditu datu egitura bat kontsultatzeko neurri, serie eta puntuez osatua. Puntu bakoitza eremu multzoa eta denbora zigilua izeneko hainbat gako-balio bikote osatzen dute. Etiketa multzo izeneko gako-balio bikoteen multzoan bilduta, serie bat definitzen dute. Azkenean, serieak kate identifikatzaile baten bidez biltzen dira neurri bat osatzeko.

Balioak 64 biteko zenbaki osoak, 64 biteko puntu mugikorrak, kateak eta balio boolearrak izan daitezke. Puntuak denbora eta etiketa multzoaren arabera indexatzen dira. Atxikitze politikak metrika batean definitzen dira eta datuak nola murrizten eta kentzen diren kontrolatzen dute. Etengabeko kontsultak aldizka egiten dira eta emaitzak helburu metrikan gordetzen dituzte.

Denbora-serieak datu-baseetan gorde behar badira, adibidez Gauzen Interneteko azpiegiturak erabiltzen direnean, InfluxDB erabil daiteke sentsorearen informazioa gordetzeko, denbora markak barne. Denborak InfluxDBn funtzio garrantzitsua betetzen duenez, barne denborazko zerbitzu batek InfluxDB klusterreko nodo guztiak sinkronikoki exekutatzen direla bermatzen du. Jakina, InfluxDB ere egokia da kontroleko datuak enpresako sareetan gordetzeko.

InfluxDB-ko datu-baseek ez dute zertan korapilatsua izan behar eta dozenaka zutabe eskaintzen dituzte. Zentzuzkoa da zutabe gutxirekin erabiltzea, adibidez, sentsore batetik neurtutako zenbait balio denboraren arabera gorde behar badira.

Iturri askotako datuak paraleloan jaso eta prozesatu behar badira, sentsoreen kasuan adibidez, beharrezkoa da lotutako datu-baseak kontsulta paralelo horiek azkar kudeatzea. Datuak denbora errealean jaso ohi direnez, datu-basearen idazketa-errendimendua horren arabera egokitu behar da. Gainera, erronka dago sentsoreen neurketa datuak ez direla beti zehatz idatzi eta zehazten. Denbora-serieen datu-baseek oraindik gorde ditzakete datu horiek eta eskuragarri jarri.

Gainera, denbora serieko datuak gorde ondoren, gutxitan beharrezkoa da gero eguneratzea. Hori dela eta, ez da beharrezkoa denbora serieen datu basea optimizatzea. Gainera, beharrezkoak ez diren zaharkitutako datuak ezabatzeko edo konprimitzeko beharrezkoak diren funtzioak daude. Zeregin horiek denbora-serieko datuen prozesamendu azkarraren zati dira.

InfluxDB Linux eta macOSentzat eskuragarri dauden osagai gutxi batzuek osatzen dute. Funtzio guztiak fitxategi bakarrean daude, instalatzea eta funtzionatzea errazteko.

Azkenean, horri buruz gehiago jakiteko interesa baduzu, egin dezakezu egiaztatu xehetasunak ondoko estekan.


Artikuluaren edukia gure printzipioekin bat dator etika editoriala. Akats baten berri emateko egin klik hemen.

Idatzi lehenengo iruzkina

Utzi zure iruzkina

Zure helbide elektronikoa ez da argitaratuko.

*

*

  1. Datuen arduraduna: Miguel Ángel Gatón
  2. Datuen xedea: SPAM kontrolatzea, iruzkinen kudeaketa.
  3. Legitimazioa: Zure baimena
  4. Datuen komunikazioa: datuak ez zaizkie hirugarrenei jakinaraziko legezko betebeharrez izan ezik.
  5. Datuak biltegiratzea: Occentus Networks-ek (EB) ostatatutako datu-basea
  6. Eskubideak: Edonoiz zure informazioa mugatu, berreskuratu eta ezabatu dezakezu.

bool (egia)