InfluxDB, en fremragende open source DB til at håndtere store mængder data

Når det kommer til at vælge en database til et nyt eller et eksisterende projekt til erstatning for det, du arbejder med, Jeg har allerede nævnt her på bloggen, at det bedste websted at finde en mulighed er DB-motorer, hvor vi kan finde et stort antal databaser, og som jeg er sikker på, at du ikke engang vidste om deres eksistens.

Men at gå videre til hovedemnet, Denne artikel, hvor vi vil tale i dag, handler om InfluxDB, som er en glimrende mulighed for at håndtere store mængder data uden at skulle ofre ydeevne.

Vi skal vide, at InfluxDB er en database optimeret til tidsseriedata og kan bruges i det lokale datacenter eller som en skyløsning på Microsoft Azure, Amazon Web Services (AWS) og Google Cloud Computing.

Dataserie-databasen (TSDB) kan betjenes uden en server i skyen eller med sine egne servere i datacentret. Databasen er under udvikling af det amerikanske firma Influxdata.

InfluxDB fokuserer på lagring af store mængder data inden for det videnskabelige område og data sendt af sensorer. TilstrømningDB det er meget hurtigere end konventionelle databaser når det kommer til lagring og styring af tidsserier. Realtidsbehandling er også mulig samt forespørgsel om dataene med det interne forespørgselssprog Flux, som er baseret på Javascript.

Dette ligner mere et programmeringssprog end et SQL-forespørgselssprog, der lytter på port 8086 plus InfluxDB har ingen eksterne afhængigheder og har tidsfokuserede indbyggede funktioner til forespørgsel til en datastruktur sammensat af mål, serier og punkter. Hvert punkt består af flere nøgleværdipar kaldet et feltsæt og et tidsstempel. Når de er grupperet efter et sæt nøgleværdipar kaldet et tag-sæt, definerer de en serie. Endelig er serien grupperet efter en strengidentifikator for at danne et mål.

Værdier kan være 64-bit heltal, 64-bit flydende punkter, strenge og boolske værdier. Point indekseres efter deres tid og mærkesæt. Opbevaringspolitikker er defineret i en metric og styrer, hvordan data reduceres og fjernes. Kontinuerlige forespørgsler kører med jævne mellemrum og gemmer resultaterne i en målmåling.

Hvis tidsserierne skal gemmes i databaser, f.eks. Når du bruger Internet of Things-infrastrukturer, InfluxDB kan bruges til at gemme sensoroplysninger, inklusive tidsstempler. Da timing spiller en vigtig rolle i InfluxDB, sikrer en intern timing-service, at alle noder i InfluxDB-klyngen kører synkront. Naturligvis er InfluxDB også velegnet til lagring af overvågningsdata på virksomhedsnetværk.

Databaserne i InfluxDB behøver ikke at være komplicerede og indeholder snesevis af kolonner. Det giver mening at bruge det med kun få kolonner, hvis f.eks. Bestemte måleværdier fra en sensor skal gemmes som en funktion af tiden.

Hvis data fra mange kilder skal modtages og behandles parallelt, for eksempel i tilfælde af sensorer, er det nødvendigt, at den tilknyttede database kan håndtere disse parallelle forespørgsler hurtigt. Da data ofte modtages i realtid, skal databaseydelsen skræddersyes i overensstemmelse hermed. Derudover er der udfordringen, at måledata fra sensorer ikke altid er nøjagtigt skrevet og defineret. Dataserier i tidsserier kan stadig gemme disse data og gøre dem tilgængelige.

Derudover når en tidsseriedata er gemt, er det sjældent nødvendigt at opdatere dem senere. Derfor er det ikke nødvendigt at optimere en tidsseriedatabase til dette. Derudover er der funktioner, der kræves for at slette eller komprimere forældede data, som ikke længere er nødvendige. Disse opgaver er også en del af hurtig behandling af tidsserier.

InfluxDB består kun af få komponenter, der er tilgængelige til Linux og macOS. Alle funktioner er indeholdt i en fil, hvilket gør det let at installere og betjene.

Endelig, hvis du er interesseret i at vide mere om det, kan du tjek detaljerne i følgende link.


Indholdet af artiklen overholder vores principper for redaktionel etik. Klik på for at rapportere en fejl her.

Vær den første til at kommentere

Efterlad din kommentar

Din e-mailadresse vil ikke blive offentliggjort. Obligatoriske felter er markeret med *

*

*

  1. Ansvarlig for dataene: Miguel Ángel Gatón
  2. Formålet med dataene: Control SPAM, management af kommentarer.
  3. Legitimering: Dit samtykke
  4. Kommunikation af dataene: Dataene vil ikke blive kommunikeret til tredjemand, undtagen ved juridisk forpligtelse.
  5. Datalagring: Database hostet af Occentus Networks (EU)
  6. Rettigheder: Du kan til enhver tid begrænse, gendanne og slette dine oplysninger.