Suurandmed, vaba tarkvara ja avatud lähtekoodiga: saadaolevad rakendused

Big Data, tasuta tarkvara ja avatud lähtekood: saadaval olevad rakendused

Big Data on tehnoloogiline kontseptsioon, mis on seotud suurte andmemahtude haldamisega, struktureeritud ja struktureerimata, mida praegu haldab suurettevõtete, tehnoloogia, teaduse ja isegi valitsussektor.

Kuigi rääkides Big Data, tegelikult pole oluline mitte andmemaht, vaid see, mida organisatsioonid andmetega teevad. Kuna sellega seotud tehnoloogia Big Data saab neid analüüsida, et saada ideid, mis viivad paremate otsuste tegemise, liikumise ja strateegiateni. Ja selles aspektis Vaba tarkvara (SL) ja avatud lähtekoodiga (CA) on sellele tehnoloogiale palju kaasa aidanud, kuna selles arendusvormingus on rakendatud palju väljatöötatud rakendusi.

Big Data ja vaba tarkvara

Selle ala asjatundjatele on see juba hästi teada Vaba tarkvara, selle arendusmudel, filosoofia põhineb tehnoloogiate, peamiselt tarkvaratoodete loomisel, mida omakorda saab vabalt kasutada, muuta ja levitada. Ja see, et avatud lähtekood on vaba tarkvara arendamise oluline element, kuna see keskendub rohkem selle dünaamika praktilistele eelistele kui tootevabaduse eetikale ja kodanikele.

Seetõttu kuigi SL / CA aitab kaasa Big Data teostamiseks, Big Data täiendab neid kaudselt mitte ainult tehnoloogia arengu kiirendatud laienemise, vaid ka Big Data kaasaskantava teabe juurdepääsuvabaduse huvides.

Mis on suured andmed?

Concepto

Tarkvara ja tehnoloogiaarenduse ühe suurima jaoks IBM, Big Data on:

«... tehnoloogia, mis on avanud uksed uuele mõistmisele ja otsuste tegemisele, mida kasutatakse tohutute andmemahtude (struktureeritud, struktureerimata ja poolstruktureeritud) kirjeldamiseks, mis võtaks liiga palju aega ja oleks väga kallis relatsiooniline andmebaas analüüsimiseks.

Eesmärk

Big Data, selle tehnoloogia, sündis eesmärgiga katta kogu võimaliku andmeanalüüsi spektersee tähendab, et hõlmata nii olemasolevat ja lahendatud praeguste kui ka erinevate tehnoloogiatega, samuti seda, mida olemasolevad tehnoloogiad, näiteks suurte andmemahtude säilitamine ja haldamine millel on väga spetsiifilised omadused.

Andmed

Pakkumisandmed töötlevad andmemahte, mis on tavaliselt määratletud järgmiste tunnustega:

Maht: Mitmest allikast pärinevate andmete suurus.
Kiirus: Mitmest allikast pärinevate andmete saabumise ja haldamise kiirus.
Sort: Analüüsitud andmete vorming mitmest allikast.

See tähendab, et andmemahud, mis koosnevad tavaliselt struktureeritud, poolstruktureeritud ja struktureerimata andmetestja käsitseda tohututes kogustes, mida sageli kirjeldatakse suure hulga eesliidetega, näiteks: Tera, Peta või Exa.

Ja kõikvõimalikest allikatest, näiteks Internetist (Sotsiaalsed võrgustikud, digitaalne meedia, veebisaidid ja andmebaasid), Seadmed (Muu hulgas mobiiltelefonid, multimeediumipleierid, positsioneerimissüsteemid, tsiviil - ja tööstuslikud digitaalsed andurid) ja Organisatsioonid (Era- ja avalik, kaubandus, valitsus ja kogukond).

Tähtsus

Mis muudab Big Data organisatsioonide jaoks nii kasulikuks tehnoloogiaks (Era- ja avalik, kaubandus, valitsus ja kogukond), on asjaolu, et see annab väärtuslikku teavet see on mitu korda täpse ja usaldusväärse vastusena küsimustele, mida pole isegi küsitud teatud olukordade või probleemide korral. See tähendab, et selle kasulikkust nähakse sageli aspektides, mis tavaliselt tulenevad samast kogutud ja hallatavast teabest.

Suure hulga teabe töötlemine hõlbustab töödeldud andmete vormistamist või testimist kõige sobivamal viisil. või täpsustab, mida haldur peab asjakohaseks. See võimaldab Big Data-d kasutavatel organisatsioonidel probleeme arusaadavamalt tuvastada.

Suure andmemahu kogumine ja selle hilisem analüüs nende suundumuste otsimiseks võimaldavad organisatsioonidel olla tõhusamad ja tulemuslikumad, liikudes nende kohal palju kiiremini, sujuvamalt ja õigeaegsemalt. Lisaks võimaldab see neil probleemsed valdkonnad kõrvaldada enne, kui probleemid neist mööduvad, mistõttu nad kaotavad eelised, maine või toetuse.

Eelis

Suurandmed aitavad organisatsioonidel oma andmeid palju paremini hallata, selle tulemusel leitakse oma liikmetele (klientidele või kodanikele) uued positiivsed või produktiivsed võimalused. Ja see omakorda viib targemate ja tõhusamate toiminguteni, säästab tunde / tööjõudu ja raha, mis tähendab sageli kõigi asjaosaliste jaoks õnne. Big Data kasutamisel lisatakse tegevustele tavaliselt väärtust järgmistel viisidel:

Kulude vähendamine: Suure andmemahu säilitamisel ja haldamisel.
Aja lühendamine: Suurem tõhusus ja tõhusus otsuste tegemisel.
Uued tooted ja teenused: Kasutajate (klientide ja / või kodanike) vajaduste ja probleemide mõõtmise ja ennetamise võimega suureneb nende rahulolu.

kasu

Hästi kasutatud Big Data suudab sageli peaaegu reaalajas tuvastada rikete, probleemide ja defektide algpõhjused. Seda tuleb siiski arvestada Big Data tehnoloogia pole iseenesest imerohi. Nii tsiteerides veel ühte suurt tehnoloogiat nagu Oracle võib lisada, et:

„Suurandmete väärtuse tuvastamine ei tähenda ainult nende analüüsimist (mis on juba omaette eelis). See on terve avastamisprotsess, mis nõuab analüütikutelt, ärikasutajatelt ja juhtidelt õigete küsimuste esitamist, mustrite tuvastamist, teadlike otsuste langetamist ja käitumise ennustamist.

SL / CA rakendused suurandmetele

Vaba tarkvara ja avatud lähtekoodiga rakenduste hulgas, mida tasub uurimisel, testimisel ja juurutamisel mainida, on:

Seotud

Apache Hadoop: Avatud lähtekoodiga platvorm koosneb Hadoopi hajutatud failisüsteemist (HDFS), Hadoop MapReduce'ist ja Hadoop Commonist.
Avro: Apache-projekt, mis pakub serialiseerimisteenuseid.
Cassandra: Jaotatud mitte-relatsiooniline andmebaas, mis põhineb , mis on välja töötatud Java-s.
Chukwa: Tarkvara, mis on loodud sündmuste päevikute suuremahuliseks kogumiseks ja analüüsimiseks.
Voog: Tarkvara, mille peamine ülesanne on suunata andmed ühest allikast mõnda muusse asukohta.
HBase: HDFS-is töötav veeruline andmebaas (veergudele orienteeritud andmebaas).
Taru: „Andmelao“ infrastruktuur, mis hõlbustab hajamas keskkonnas salvestatud suurte andmemahtude haldamist.
Jaql: Funktsionaalne ja deklaratiivne keel, mis võimaldab andmete kasutamist JSON-vormingus, mis on ette nähtud suure hulga teabe töötlemiseks.
Lucene: Tarkvara, mis pakub raamatukogusid teksti indekseerimiseks ja otsimiseks.
oozie: Avatud lähtekoodiga projekt, mis lihtsustab tööprotsesse ja protsessi kooskõlastamist.
Siga: Tarkvara, mis võimaldab Hadoopi kasutajatel rohkem keskenduda kõigi andmekogumite analüüsimisele ja kulutada vähem aega MapReduce programmide ülesehitamisele.
Loomaaiatalitaja: Tsentraliseeritud infrastruktuur ja teenused, mida rakendused saavad kasutada, et tagada kogu klastri protsesside jada või sünkroniseerimine.

Iseseisvad

Teised sama tuntud, kuid avatud lähtekoodiga platvormiga Hadoop seotud pole:

Elastne kaar: Täistekstipõhine otsingu- ja analüüsimootor.
MongoDB: NoSQL andmebaas, mis põhineb dokumendi andmemudelil.
Cassandra: Apache avatud lähtekoodiga projekt, mis on mõeldud NoSQL-i andmebaaside haldamiseks.
CouchDB: Avatud lähtekoodiga NoSQL-i andmebaas, mis põhineb ühistel standarditel, hõlbustamaks juurdepääsu ja veebi ühilduvust mitmesugustega.
Päike: Avatud lähtekoodiga otsingumootor, mis põhineb projekti Lucene Java-teegil.
Muud RDBMS-i tööriistad: MySQL klaster ja VoltDB.

Järeldus

Meie praegune (ja kohe järgmine) aeg on uppunud või uppunud suurde ja kasvavasse andmemassi, millel on palju öelda tervikuna, kui eraldi. Seetõttu aitab Big Data tehnoloogia kasutamine praeguses ja lähitulevikus ühiskonnas, kogu inimkonnas, leida asju (sündmusi või leiutisi) lõpmatuseni, mille avastamiseks oleks võinud kuluda aastaid. , seda kasutamata.

Alates sellest ajast Big Data ja selle tööriistad tagavad piisava analüüsi kiiruse analüüsige saadud tulemust kiiresti ja töötlege see läbi nii mitu korda kui vaja, lühikese aja jooksul, et leida tõeline või lähim väärtus, millele püüate jõuda. Kui olete leidnud, et suurandmete teema on huvitav, saate seda aruannet lugedes teemat veidi laiendada BBVA.

DesdeLinux