InfluxDB, doskonała baza danych typu open source do obsługi dużych ilości danych

Jeśli chodzi o wybór bazy danych dla nowego projektu lub istniejącego w celu zastąpienia tego, nad którym pracujesz, Wspomniałem już tutaj na blogu, że najlepszą stroną internetową do znalezienia opcji jest Silniki DB, w którym możemy znaleźć dużą liczbę baz danych i jestem pewien, że nawet nie wiedziałeś o ich istnieniu.

Ale przechodząc do głównego tematu, Ten artykuł, w którym dzisiaj porozmawiamy, dotyczy InfluxDB, który jest doskonałą opcją do obsługi dużych ilości danych bez poświęcania wydajności.

Powinniśmy wiedzieć, że InfluxDB to baza danych zoptymalizowana pod kątem danych szeregów czasowych i może być używany w lokalnym centrum danych lub jako rozwiązanie w chmurze na platformie Microsoft Azure, Amazon Web Services (AWS) i Google Cloud Computing.

Baza danych szeregów czasowych (TSDB) może działać bez serwera w chmurze lub z własnymi serwerami w centrum danych. Baza jest rozwijana przez amerykańską firmę Influxdata.

InfluxDB koncentruje się na przechowywaniu dużych ilości danych w dziedzinie naukowej oraz dane wysyłane przez czujniki. InfluxDB jest znacznie szybszy niż konwencjonalne bazy danych jeśli chodzi o przechowywanie i zarządzanie szeregami czasowymi. Możliwe jest również przetwarzanie w czasie rzeczywistym, a także wysyłanie zapytań do danych za pomocą wewnętrznego języka zapytań Flux, który jest oparty na JavaScript.

Wygląda to bardziej jak język programowania niż język zapytań SQL nasłuchujący na porcie 8086 plus InfluxDB nie ma zewnętrznych zależności i ma wbudowane funkcje czasowe do odpytywania struktury danych składa się z miar, serii i punktów. Każdy punkt składa się z kilku par klucz-wartość zwanych zestawem pól i sygnaturą czasową. Pogrupowane według zestawu par klucz-wartość nazywanego zestawem tagów definiują serię. Na koniec serie są grupowane według identyfikatora ciągu, tworząc miarę.

Wartości mogą być 64-bitowymi liczbami całkowitymi, 64-bitowymi liczbami zmiennoprzecinkowymi, łańcuchami i wartościami boolowskimi. Punkty są indeksowane według czasu i zestawu znaczników. Zasady przechowywania są definiowane w metryce i kontrolują sposób zmniejszania i usuwania danych. Zapytania ciągłe są uruchamiane okresowo i przechowują wyniki w metryce docelowej.

Jeżeli szeregi czasowe mają być przechowywane w bazach danych, np. przy korzystaniu z infrastruktur Internetu Rzeczy, InfluxDB może być używany do zapisywania informacji z czujnika, w tym znaczników czasu. Ponieważ czas odgrywa ważną rolę w InfluxDB, wewnętrzna usługa pomiaru czasu zapewnia, że wszystkie węzły w klastrze InfluxDB działają synchronicznie. Oczywiście InfluxDB nadaje się również do przechowywania danych z monitoringu w sieciach firmowych.

Bazy danych w InfluxDB nie muszą być skomplikowane i zawierać dziesiątki kolumn. Ma sens używanie go tylko z kilkoma kolumnami, jeśli na przykład pewne wartości mierzone z czujnika muszą być zapisane w funkcji czasu.

Jeśli dane z wielu źródeł muszą być odbierane i przetwarzane równolegle, na przykład w przypadku czujników, powiązana baza danych musi być w stanie szybko obsłużyć te równoległe zapytania. Ponieważ dane są często odbierane w czasie rzeczywistym, wydajność zapisu bazy danych musi być odpowiednio dostosowana. Ponadto istnieje wyzwanie polegające na tym, że dane pomiarowe z czujników nie zawsze są dokładnie zapisywane i definiowane. Bazy danych szeregów czasowych mogą nadal przechowywać te dane i udostępniać je.

Ponadto, po zapisaniu danych szeregów czasowych rzadko trzeba je później aktualizować. Dlatego nie jest konieczna do tego optymalizacja bazy danych szeregów czasowych. Ponadto istnieją funkcje wymagane do usuwania lub kompresowania nieaktualnych danych, które nie są już potrzebne. Zadania te są również częścią szybkiego przetwarzania danych szeregów czasowych.

InfluxDB składa się tylko z kilku komponentów dostępnych dla systemów Linux i macOS. Wszystkie funkcje zawarte są w jednym pliku, co ułatwia instalację i obsługę.

Wreszcie, jeśli chcesz dowiedzieć się więcej na ten temat, możesz sprawdź szczegóły w poniższym linku.

DesdeLinux

InfluxDB, doskonała baza danych typu open source do obsługi dużych ilości danych

Zostaw swój komentarz Anuluj odpowiedź