InfluxDB, отлична БД с отворен код за обработка на големи количества данни

Що се отнася до избора на база данни за нов проект или съществуващ, който да замени този, с който работите, Вече споменах тук в блога, че най-добрият уебсайт за намиране на опция е DB-двигатели, в които можем да намерим голям брой бази данни и за които съм сигурен, че дори не сте знаели за тяхното съществуване.

Но преминавайки към основната тема, Тази статия, в която ще говорим днес, е за InfluxDB, която е отлична възможност за обработка на големи количества данни, без да се жертва производителността.

Трябва да знаем, че InfluxDB е база данни, оптимизирана за данни от времеви редове и може да се използва в локалния център за данни или като облачно решение на Microsoft Azure, Amazon Web Services (AWS) и Google Cloud Computing.

База данни за времевите редове (TSDB) може да работи без сървър в облака или със собствени сървъри в центъра за данни. Базата данни се разработва от американската компания Influxdata.

InfluxDB се фокусира върху съхраняването на големи количества данни в научната област и данни, изпратени от сензори. Приток DB това е много по-бързо от конвенционалните бази данни когато става въпрос за съхраняване и управление на времеви редове. Възможна е и обработка в реално време, както и заявки за данни с вътрешния език за заявки Flux, който е базиран на Javascript.

Това изглежда по-скоро като език за програмиране, отколкото език за SQL заявки, слушащ на порт 8086, плюс InfluxDB няма външни зависимости и има вградени функции, фокусирани върху времето за заявки за структура на данни съставен от мерки, серии и точки. Всяка точка се състои от няколко двойки ключ-стойност, наречени набор от полета и времеви клей. Когато са групирани от набор от двойки ключ-стойност, наречен набор от маркери, те определят серия. И накрая, поредиците са групирани от низ идентификатор, за да образуват мярка.

Стойностите могат да бъдат 64-битови цели числа, 64-битови плаващи точки, низове и булеви стойности. Точките се индексират според времето и набора от етикети. Политиките за задържане са дефинирани в метрика и контролират как данните се намаляват и премахват. Непрекъснатите заявки се изпълняват периодично и съхраняват резултатите в целеви показател.

Ако времевите редове трябва да се съхраняват в бази данни, например при използване на инфраструктурата на Internet of Things, InfluxDB може да се използва за запазване на информация за сензора, включително времеви клейма. Тъй като синхронизирането играе важна роля в InfluxDB, вътрешна услуга за синхронизиране гарантира, че всички възли в клъстера InfluxDB работят синхронно. Разбира се, InfluxDB е подходящ и за съхраняване на данни за наблюдение във фирмените мрежи.

Базите данни в InfluxDB не трябва да бъдат сложни и да предоставят десетки колони. Има смисъл да се използва само с няколко колони, ако например определени измерени стойности от датчик трябва да бъдат запазени като функция на времето.

Ако данните от много източници трябва да се получават и обработват паралелно, например в случай на сензори, свързаната база данни трябва да може да обработва тези паралелни заявки бързо. Тъй като данните често се получават в реално време, производителността на запис на базата данни трябва да бъде съобразена съответно. Освен това съществува предизвикателството, че измервателните данни от сензорите не винаги са точно записани и дефинирани. Базите данни с времеви редове все още могат да съхраняват тези данни и да ги предоставят.

Освен това, след като данните от времеви редове са запазени, рядко е необходимо да ги актуализирате по-късно. Следователно не е необходимо да се оптимизира базата данни от времеви редове за това. Освен това има функции, необходими за изтриване или компресиране на остарели данни, които вече не са необходими. Тези задачи също са част от бързата обработка на данни от времеви редове.

InfluxDB се състои само от няколко компонента, които са достъпни за Linux и macOS. Всички функции се съдържат в един файл, което улеснява инсталирането и работата.

И накрая, ако се интересувате да научите повече за това, можете проверете подробностите в следната връзка.


Оставете вашия коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *

*

*

  1. Отговорен за данните: Мигел Анхел Гатон
  2. Предназначение на данните: Контрол на СПАМ, управление на коментари.
  3. Легитимация: Вашето съгласие
  4. Съобщаване на данните: Данните няма да бъдат съобщени на трети страни, освен по законово задължение.
  5. Съхранение на данни: База данни, хоствана от Occentus Networks (ЕС)
  6. Права: По всяко време можете да ограничите, възстановите и изтриете информацията си.