பிக் டேட்டா என்பது ஒரு தொழில்நுட்பக் கருத்தாகும், இது பெரிய அளவிலான தரவை நிர்வகிப்பது தொடர்பானது, கட்டமைக்கப்பட்ட மற்றும் கட்டமைக்கப்படாதவை, அவை தற்போது பெரிய வணிக, தொழில்நுட்ப, அறிவியல் மற்றும் அரசாங்கத் துறைகளால் கையாளப்படுகின்றன.
பற்றி பேசும் போது பெரிய தரவு, இது உண்மையில் முக்கியமான தரவுகளின் அளவு அல்ல, ஆனால் தரவுகளை என்ன நிறுவனங்கள் செய்கின்றன. பிக் டேட்டா, அதனுடன் தொடர்புடைய தொழில்நுட்பம், சிறந்த முடிவெடுக்கும், இயக்கங்கள் மற்றும் உத்திகளுக்கு வழிவகுக்கும் யோசனைகளைப் பெற அவற்றை பகுப்பாய்வு செய்யலாம். இந்த அம்சத்தில், இலவச மென்பொருள் (எஸ்.எல்) மற்றும் திறந்த மூல (சி.ஏ) ஆகியவை இந்த தொழில்நுட்பத்திற்கு நிறைய பங்களித்தன, பல வளர்ந்த பயன்பாடுகள் இந்த மேம்பாட்டு வடிவமைப்பில் செயல்படுத்தப்பட்டுள்ளதால்.
பெரிய தரவு மற்றும் இலவச மென்பொருள்
கலையில் திறமையானவர்களுக்கு, அது ஏற்கனவே நன்கு அறியப்பட்டதாகும் இலவச மென்பொருள், அதன் மேம்பாட்டு மாதிரி, அதன் தத்துவம், தொழில்நுட்பங்களை உருவாக்குவதை அடிப்படையாகக் கொண்டது, முக்கியமாக மென்பொருள் தயாரிப்புகள், அவை பயன்படுத்தப்படலாம், மாற்றியமைக்கப்படலாம் மற்றும் இலவசமாக விநியோகிக்கப்படலாம். இலவச மென்பொருளின் வளர்ச்சியில் அந்த திறந்த மூலமானது ஒரு முக்கிய அங்கமாகும், ஏனெனில் இது தயாரிப்பு சுதந்திரத்தின் நெறிமுறைகளை விட டைனமிக் இந்த வளர்ச்சியின் நடைமுறை நன்மைகள் மீது கவனம் செலுத்துகிறது மற்றும் குடிமக்கள்.
எனவே, போது பிக் டேட்டாவை முன்னெடுப்பதற்கான வழிமுறைகளுடன் SL / CA பங்களிக்கிறது, பிக் டேட்டா தொழில்நுட்ப வளர்ச்சியின் விரைவான விரிவாக்கத்தின் நன்மைக்காக மட்டுமல்லாமல், பிக் டேட்டா கொண்டு வரும் தகவல்களை அணுகும் சுதந்திரத்துக்காகவும் மறைமுகமாக அவற்றை நிறைவு செய்கிறது.
பெரிய தரவு என்ன?
கான்செப்டோ
மென்பொருள் மற்றும் தொழில்நுட்ப வளர்ச்சியின் ஒரு பெரியவருக்கு, ஐபிஎம், பெரிய தரவு ஒரு:
«... புரிந்துகொள்ளுதல் மற்றும் முடிவெடுப்பதற்கான ஒரு புதிய அணுகுமுறைக்கான கதவுகளைத் திறந்த தொழில்நுட்பம், இது அதிக அளவு தரவை விவரிக்கப் பயன்படுகிறது (கட்டமைக்கப்பட்ட, கட்டமைக்கப்படாத மற்றும் அரை கட்டமைக்கப்பட்ட) அதிக நேரம் எடுக்கும் மற்றும் ஏற்றுவதற்கு மிகவும் விலை உயர்ந்ததாக இருக்கும் பகுப்பாய்வுக்கான தொடர்புடைய தரவுத்தளம்.
புறநிலை
பிக் டேட்டா, அதன் தொழில்நுட்பம், தரவு பகுப்பாய்வின் முழு நிறமாலையையும் உள்ளடக்கும் நோக்கத்துடன் பிறந்ததுஅதாவது, தற்போதைய மற்றும் வேறுபட்ட தொழில்நுட்பங்களுடன் இருப்பதையும், தீர்க்கப்படுவதையும், அதேபோல் இருக்கும் தொழில்நுட்பங்களால் தீர்க்கப்படாதவற்றையும் உள்ளடக்குவது பெரிய அளவிலான தரவின் சேமிப்பு மற்றும் மேலாண்மை அவை மிகவும் குறிப்பிட்ட பண்புகளைக் கொண்டுள்ளன.
தரவு
வழக்கமாக பின்வரும் குணாதிசயங்களால் வரையறுக்கப்படும் தரவின் அளவுகளை ஏல தரவு கையாளுகிறது:
- தொகுதி: பல மூலங்களிலிருந்து தரவின் அளவு.
- வேகம்: பல மூலங்களிலிருந்து எந்த தரவு வந்து நிர்வகிக்கப்படுகிறது என்பதற்கான வேகம்.
- வகை: பல மூலங்களிலிருந்து பகுப்பாய்வு செய்யப்பட்ட தரவின் வடிவம்.
அதாவது, பொதுவாக கட்டமைக்கப்பட்ட, அரை கட்டமைக்கப்பட்ட மற்றும் கட்டமைக்கப்படாத தரவுகளால் ஆன தரவு தொகுதிகள், மற்றும் அதிக அளவு முன்னொட்டுகளுடன் பெரும்பாலும் விவரிக்கப்படும் பெரிய அளவுகளில் கையாளப்படும், அதாவது: தேரா, பெட்டா அல்லது எக்சா போன்றவை.
மேலும் இணையம் போன்ற அனைத்து வகையான மூலங்களிலிருந்தும் (சமூக வலைப்பின்னல்கள், டிஜிட்டல் மீடியா, வலைத்தளங்கள் மற்றும் தரவுத்தளங்கள்), வன்பொருள் (மொபைல் போன்கள், மல்டிமீடியா பிளேயர்கள், பொசிஷனிங் சிஸ்டம்ஸ், சிவில் மற்றும் இன்டஸ்ட்ரியல் டிஜிட்டல் சென்சார்கள் போன்றவை) மற்றும் அமைப்புக்கள் (தனியார் மற்றும் பொது, வணிக, அரசு மற்றும் சமூகம்).
முக்கியத்துவம்
பிக் டேட்டா நிறுவனங்களுக்கு இது போன்ற ஒரு பயனுள்ள தொழில்நுட்பமாக அமைகிறது (தனியார் மற்றும் பொது, வணிக, அரசு மற்றும் சமூகம்), இது மதிப்புமிக்க தகவல்களை வழங்குகிறது என்பதே உண்மை இது பெரும்பாலும் கேட்கப்படாத கேள்விகளுக்கு துல்லியமான மற்றும் நம்பகமான பதிலாக செயல்படுகிறது சில சூழ்நிலைகள் அல்லது சிக்கல்களுக்கு. அதாவது, சேகரிக்கப்பட்ட மற்றும் நிர்வகிக்கப்படும் அதே தகவல்களிலிருந்து பொதுவாக எழும் அம்சங்களில் அதன் பயன் பெரும்பாலும் காணப்படுகிறது.
பெரிய அளவிலான தகவல்களை செயலாக்குவது, பதப்படுத்தப்பட்ட தரவை மிகவும் பொருத்தமான முறையில் வடிவமைக்க அல்லது சோதிக்க எளிதாக்குகிறது. அல்லது குறிப்பிடுகிறது, அது அதன் நிர்வாகியால் பொருத்தமானதாகக் கருதப்படுகிறது. இது பிக் டேட்டாவைப் பயன்படுத்தும் நிறுவனங்களை சிக்கல்களைப் புரிந்துகொள்ளக்கூடிய வகையில் அடையாளம் காண அனுமதிக்கிறது.
பெரிய அளவிலான தரவுகளின் சேகரிப்பு மற்றும் அவற்றில் உள்ள போக்குகளைத் தேடுவதற்கான அதன் அடுத்தடுத்த பகுப்பாய்வு நிறுவனங்கள் மிகவும் பயனுள்ளதாகவும் திறமையாகவும் இருக்க அனுமதிக்கின்றன, மிக விரைவாகவும், சுமுகமாகவும், சரியான நேரத்தில் அவற்றை நகர்த்துவதன் மூலமும். கூடுதலாக, சிக்கல்களைத் தாண்டுவதற்கு முன்பு சிக்கலான பகுதிகளை அகற்ற இது அனுமதிக்கிறது, இதனால் அவை நன்மைகள், நற்பெயர் அல்லது ஆதரவை இழக்க நேரிடும்.
நன்மை
நிறுவனங்களின் தரவை மிகச் சிறப்பாக நிர்வகிக்க பெரிய தரவு உதவுகிறது, இது அவர்களின் உறுப்பினர்களுக்கு (வாடிக்கையாளர்கள் அல்லது குடிமக்கள்) புதிய நேர்மறை அல்லது உற்பத்தி வாய்ப்புகளை அடையாளம் காணும். இதையொட்டி, சிறந்த மற்றும் திறமையான செயல்களுக்கு வழிவகுக்கிறது, மணிநேரம் / உழைப்பு மற்றும் பணத்தில் சேமிப்பு, இது பெரும்பாலும் சம்பந்தப்பட்ட அனைவருக்கும் மகிழ்ச்சியாக மொழிபெயர்க்கிறது. பெரிய தரவு பயன்படுத்தப்படும்போது, பின்வரும் வழிகளில் மேற்கொள்ளப்படும் நடவடிக்கைகளுக்கு மதிப்பு பொதுவாக சேர்க்கப்படும்:
- செலவு குறைப்பு: பெரிய அளவிலான தரவின் சேமிப்பு மற்றும் நிர்வாகத்தில்.
- நேரக் குறைப்பு: முடிவெடுப்பதில் அதிக செயல்திறன் மற்றும் செயல்திறன்.
- புதிய தயாரிப்புகள் மற்றும் சேவைகள்: பயனர்களின் (வாடிக்கையாளர்கள் மற்றும் / அல்லது குடிமக்கள்) தேவைகளையும் சிக்கல்களையும் அளவிடும் மற்றும் எதிர்பார்க்கும் திறனுடன், அவர்களின் திருப்தி அதிகரிக்கிறது.
நன்மைகள்
நன்கு பயன்படுத்தப்பட்ட பெரிய தரவு பெரும்பாலும் தோல்விகள், சிக்கல்கள் மற்றும் குறைபாடுகளின் மூல காரணங்களை கிட்டத்தட்ட உண்மையான நேரத்தில் தீர்மானிக்கும் திறன் கொண்டது. இருப்பினும், அதை கணக்கில் எடுத்துக்கொள்ள வேண்டும் பிக் டேட்டா தொழில்நுட்பம் ஒரு பீதி அல்ல. எனவே போன்ற மற்றொரு சிறந்த தொழில்நுட்பத்தை மேற்கோள் காட்டி ஆரக்கிள், அதைச் சேர்க்கலாம்:
Data பெரிய தரவுகளின் மதிப்பை அடையாளம் காண்பது அதை பகுப்பாய்வு செய்வதை மட்டும் குறிக்காது (இது ஏற்கனவே ஒரு நன்மை). இது ஒரு முழு கண்டுபிடிப்பு செயல்முறையாகும், இது ஆய்வாளர்கள், வணிக பயனர்கள் மற்றும் நிர்வாகிகள் சரியான கேள்விகளைக் கேட்கவும், வடிவங்களை அடையாளம் காணவும், தகவலறிந்த முடிவுகளை எடுக்கவும் மற்றும் நடத்தைகளை கணிக்கவும் வேண்டும்.
பெரிய தரவுகளுக்கான SL / CA பயன்பாடுகள்
ஆராய்ச்சி, சோதனை மற்றும் செயல்படுத்தலுக்குக் குறிப்பிட வேண்டிய இலவச மென்பொருள் மற்றும் திறந்த மூல பயன்பாடுகளில்:
தொடர்புடையது
- அப்பாச்சி ஹடூப்: ஹடூப் விநியோகிக்கப்பட்ட கோப்பு முறைமை (எச்டிஎஃப்எஸ்), ஹடூப் வரைபடம் மற்றும் ஹடூப் காமன் ஆகியவற்றால் ஆன திறந்த மூல தளம்.
- அவ்ரோ: வரிசைப்படுத்தல் சேவைகளை வழங்கும் அப்பாச்சி திட்டம்.
- கசாண்ட்ரா: இன் சேமிப்பக மாதிரியின் அடிப்படையில் தொடர்புடைய அல்லாத தரவுத்தளம் விநியோகிக்கப்பட்டது , ஜாவாவில் உருவாக்கப்பட்டது.
- சுக்வா: நிகழ்வு பதிவுகள் பெரிய அளவிலான சேகரிப்பு மற்றும் பகுப்பாய்வுக்காக வடிவமைக்கப்பட்ட மென்பொருள்.
- ஃப்ளூம்: ஒரு மூலத்திலிருந்து வேறு இடத்திற்கு இருப்பிடத்தை இயக்குவதே மென்பொருளின் முக்கிய பணி.
- HBase: HDFS இல் இயங்கும் நெடுவரிசை தரவுத்தளம் (நெடுவரிசை சார்ந்த தரவுத்தளம்).
- ஹைவ்: விநியோகிக்கப்பட்ட சூழலில் சேமிக்கப்படும் பெரிய அளவிலான தரவை நிர்வகிக்க உதவும் "தரவுக் கிடங்கு" உள்கட்டமைப்பு.
- ஜாக்ல்: பெரிய அளவிலான தகவல்களை செயலாக்க வடிவமைக்கப்பட்ட JSON வடிவத்தில் தரவை சுரண்டுவதை அனுமதிக்கும் செயல்பாட்டு மற்றும் அறிவிப்பு மொழி.
- லூசீன்: உரையை அட்டவணைப்படுத்துவதற்கும் தேடுவதற்கும் நூலகங்களை வழங்கும் மென்பொருள்.
- ஓஸி: ஒவ்வொரு செயல்முறைகளுக்கும் இடையில் பணிப்பாய்வு மற்றும் ஒருங்கிணைப்பை எளிதாக்கும் திறந்த மூல திட்டம்.
- பன்றி: ஹடூப் பயனர்கள் அனைத்து தரவுத் தொகுப்புகளையும் பகுப்பாய்வு செய்வதில் அதிக கவனம் செலுத்தவும், மேப்ரூட் திட்டங்களை உருவாக்க குறைந்த நேரத்தை செலவிடவும் அனுமதிக்கும் மென்பொருள்.
- உயிரியல் பூங்கா: ஒரு கிளஸ்டர் முழுவதும் செயல்முறைகள் வரிசைப்படுத்தப்பட்டவை அல்லது ஒத்திசைக்கப்படுகின்றன என்பதை உறுதிப்படுத்த பயன்பாடுகளால் பயன்படுத்தக்கூடிய மையப்படுத்தப்பட்ட உள்கட்டமைப்பு மற்றும் சேவைகள்.
சுயாதீன
மற்றவர்கள் சமமாக நன்கு அறியப்பட்டவர்கள், ஆனால் ஹடூப் என்ற திறந்த மூல தளத்துடன் தொடர்புடையவர்கள் அல்ல:
- மீள் தேடல்: முழு உரை அடிப்படையிலான தேடல் மற்றும் பகுப்பாய்வு இயந்திரம்.
- மோங்கோடிபி: ஆவண தரவு மாதிரியை அடிப்படையாகக் கொண்ட NoSQL தரவுத்தளம்.
- கசாண்ட்ரா: NoSQL தரவுத்தள நிர்வாகத்திற்காக வடிவமைக்கப்பட்ட அப்பாச்சி திறந்த மூல திட்டம்.
- CouchDB: எளிதான அணுகல் மற்றும் பல்வேறு வகையான வலை இணக்கத்தன்மைக்கான பொதுவான தரங்களின் அடிப்படையில் திறந்த மூல NoSQL தரவுத்தளம்.
- சொல்ர்: லூசீன் திட்ட ஜாவா நூலகத்தின் அடிப்படையில் திறந்த மூல தேடுபொறி.
பிற RDBMS கருவிகள்: MySQL Cluster மற்றும் VoltDB.
முடிவுக்கு
எங்கள் தற்போதைய (உடனடி அடுத்த) நேரம் தனித்தனியாகக் காட்டிலும், ஒட்டுமொத்தமாகவும் சொல்லக்கூடிய அளவிலும் அதிக மற்றும் வளர்ந்து வரும் தரவுகளில் மூழ்கியுள்ளது அல்லது மூழ்கியுள்ளது. ஆகையால், தற்போதைய மற்றும் உடனடி எதிர்காலத்தில் பிக் டேட்டா தொழில்நுட்பத்தைப் பயன்படுத்துவது சமுதாயத்திற்கும், முழு மனிதகுலத்திற்கும், எண்ணற்ற விஷயங்களை (நிகழ்வுகள் அல்லது கண்டுபிடிப்புகள்) கண்டறிய உதவும், இது தங்களைக் கண்டறிய பல ஆண்டுகள் ஆகக்கூடும். , இதைப் பயன்படுத்தாமல்.
போன்ற பெரிய தரவு மற்றும் அதன் கருவிகள் போதுமான பகுப்பாய்வு வேகத்தை வழங்குகின்றன விரைவாக பெறப்பட்ட முடிவை பகுப்பாய்வு செய்து, நீங்கள் அடைய முயற்சிக்கும் உண்மையான அல்லது நெருங்கிய மதிப்பைக் கண்டுபிடிக்க, குறுகிய காலத்தில், தேவையான பல மடங்கு மறுவேலை செய்யுங்கள். பிக் டேட்டாவின் தலைப்பை நீங்கள் சுவாரஸ்யமாகக் கண்டால், இந்த அறிக்கையைப் படிப்பதன் மூலம் தலைப்பை இன்னும் கொஞ்சம் விரிவாக்கலாம் பி.பி.வி.ஏ.