InfluxDB, DB מעולה עם קוד פתוח לטיפול בכמויות גדולות של נתונים

בכל הנוגע לבחירת מסד נתונים עבור פרויקט חדש או פרויקט קיים שיחליף את זה שאיתו אתה עובד, כבר הזכרתי כאן בבלוג שהאתר הטוב ביותר למצוא אפשרות הוא מנועי DB, בהם אנו יכולים למצוא מספר רב של מאגרי מידע ושאני בטוח שלא ידעתם אפילו על קיומם.

אבל עוברים לנושא העיקרי, מאמר זה בו נדבר היום עוסק ב- InfluxDB שהיא אופציה מצוינת לטיפול בכמויות גדולות של נתונים מבלי שתצטרך להקריב ביצועים.

עלינו לדעת כי InfluxDB הוא בסיס נתונים המותאם לנתוני סדרות זמן וניתן להשתמש בהם במרכז הנתונים המקומי או כפתרון ענן ב- Microsoft Azure, Amazon Web Services (AWS), ו- Google Cloud Computing.

מאגר סדרות הזמן (TSDB) ניתן להפעיל ללא שרת בענן או עם שרתים משלו במרכז הנתונים. מאגר המידע מפותח על ידי חברת Influxdata האמריקאית.

InfluxDB מתמקד באחסון כמויות גדולות של נתונים בתחום המדעי ונתונים שנשלחים על ידי חיישנים. InfluxDB זה הרבה יותר מהיר ממסדי נתונים קונבנציונליים כשמדובר באחסון וניהול סדרות זמן. עיבוד בזמן אמת אפשרי גם כן, כמו גם שאילתת נתונים בשפת השאילתות הפנימית Flux, המבוססת על Javascript.

זה נראה יותר כמו שפת תכנות מאשר שפת שאילתת SQL בהאזנה ביציאה 8086, בתוספת InfluxDB אין לו תלות חיצונית ויש לו פונקציות מובנות ממוקדות בזמן לשאילתת מבנה נתונים מורכב מדדים, סדרות ונקודות. כל נקודה מורכבת מכמה זוגות עם ערך מפתח הנקראים ערכת שדה וחותמת זמן. כאשר מקובצים לפי קבוצה של זוגות עם ערך מפתח הנקראים ערכת תגיות, הם מגדירים סדרה. לבסוף, הסדרה מקובצת לפי מזהה מחרוזת כדי ליצור מדד.

ערכים יכולים להיות מספרים שלמים של 64 סיביות, נקודות צפות של 64 סיביות, מחרוזות וערכים בוליאניים. הנקודות מתווספות לפי הזמן והגדרת התג. מדיניות שמירה מוגדרת בערך ושולטת בהקטנת הנתונים והסרתם. שאילתות רציפות פועלות מעת לעת ומאחסנות את התוצאות במדד יעד.

אם יש לשמור את סדרות הזמן בבסיסי נתונים, למשל בעת שימוש בתשתיות האינטרנט של הדברים, ניתן להשתמש ב- InfluxDB לשמירת מידע חיישנים, כולל חותמות זמן. מכיוון שתזמון ממלא תפקיד חשוב ב- InfluxDB, שירות תזמון פנימי מבטיח שכל הצמתים באשכול InfluxDB יפעלו באופן סינכרוני. כמובן, InfluxDB מתאים גם לאחסון נתוני ניטור ברשתות החברה.

מאגרי המידע ב- InfluxDB אינם חייבים להיות מורכבים ומספקים עשרות עמודות. זה הגיוני להשתמש בו רק עם כמה עמודות אם, למשל, יש לשמור ערכים נמדדים מסוימים מחיישן כפונקציה של זמן.

אם חייבים להתקבל ולעבד נתונים ממקורות רבים במקביל, למשל במקרה של חיישנים, יש צורך שמאגר המידע המשויך יוכל לטפל בשאילתות מקבילות אלה במהירות. מאחר ונתונים מתקבלים לעיתים קרובות בזמן אמת, יש להתאים את ביצועי הכתיבה של מסד הנתונים בהתאם. בנוסף, קיים האתגר שנתוני מדידה מחיישנים לא תמיד נכתבים ומוגדרים בצורה מדויקת. מאגרי מידע על סדרות זמן עדיין יכולים לאחסן נתונים אלה ולהפוך אותם לזמינים.

בנוסף, לאחר שנשמרו נתוני סדרות זמן, לעיתים רחוקות יש צורך לעדכן אותם מאוחר יותר. לכן, אין צורך לבצע אופטימיזציה למאגר סדרות זמן לשם כך. בנוסף, ישנן פונקציות הנדרשות למחיקה או דחיסה של נתונים מיושנים שכבר אין צורך. משימות אלה הן גם חלק מעיבוד נתונים מהיר של סדרות זמן.

InfluxDB מורכב מכמה רכיבים בלבד שזמינים עבור לינוקס ו- macOS. כל הפונקציות כלולות בקובץ אחד, מה שמקל על ההתקנה והתפעול.

לבסוף אם אתה מעוניין לדעת יותר על כך, תוכל בדוק את הפרטים בקישור הבא.


השאירו את התגובה שלכם

כתובת הדוא"ל שלך לא תפורסם. שדות חובה מסומנים *

*

*

  1. אחראי לנתונים: מיגל אנחל גטון
  2. מטרת הנתונים: בקרת ספאם, ניהול תגובות.
  3. לגיטימציה: הסכמתך
  4. מסירת הנתונים: הנתונים לא יועברו לצדדים שלישיים אלא בהתחייבות חוקית.
  5. אחסון נתונים: מסד נתונים המתארח על ידי Occentus Networks (EU)
  6. זכויות: בכל עת תוכל להגביל, לשחזר ולמחוק את המידע שלך.