Groot data, gratis sagteware en oop bron: beskikbare toepassings

Groot data, gratis sagteware en oop bron: beskikbare toepassings

Groot data, gratis sagteware en oop bron: beskikbare toepassings

Big Data is 'n tegnologiese konsep wat verband hou met die bestuur van groot hoeveelhede data, gestruktureerd en ongestruktureerd, wat tans deur groot sakesektor, tegnologiese, wetenskaplike en selfs regeringsektor hanteer word.

Alhoewel wanneer daar oor gepraat word Big Data, dit is nie regtig die hoeveelheid data wat belangrik is nie, maar wat organisasies met die data doen. Aangesien Big Data, die gepaardgaande tegnologie, dit kan ontleed om idees te bekom wat lei tot beter besluitneming, bewegings en strategieë. En in hierdie aspek, Vrye sagteware (SL) en Open Source (CA) het baie tot hierdie tegnologie bygedra, aangesien baie ontwikkelde toepassings in hierdie ontwikkelingsformaat geïmplementeer is.

Groot data en gratis sagteware: Inleiding

Big Data en gratis sagteware

Vir die kundiges is dit reeds bekend dat Vrye sagteware, sy ontwikkelingsmodel, sy filosofie, is gebaseer op die skep van tegnologieë, hoofsaaklik sagtewareprodukte, wat weer vrylik gebruik, aangepas en versprei kan word. En dat Open Source 'n belangrike element is in die ontwikkeling van gratis sagteware, aangesien dit meer fokus op die praktiese voordele van hierdie ontwikkelingsdinamiek as op die etiek van produkvryheid en burgers.

Daarom, terwyl Die SL / CA dra by tot die uitvoering van Big Data, Big Data vul dit indirek aan, nie net ten bate van die vinnige uitbreiding van tegnologiese ontwikkeling nie, maar ook vir die vryheid van toegang tot inligting wat Big Data meebring.

Big Data en gratis sagteware: wat is Big Data?

Wat is die groot data?

konsep

Vir een van die belangrikste programmatuur- en tegnologiese ontwikkeling, IBM, Big Data is 'n:

«... tegnologie wat die deure oopgemaak het vir 'n nuwe benadering tot begrip en besluitneming, wat gebruik word om groot hoeveelhede data (gestruktureerd, ongestruktureerd en semi-gestruktureerd) te beskryf wat te veel tyd sou neem en baie duur sou wees om in 'n relasionele databasis vir ontleding.

doel

Big Data, sy tegnologie, is gebore met die doel om die hele spektrum van data-analise moontlik te dek, dit wil sê om te dek wat bestaan ​​en wat opgelos word met huidige en verskillende tegnologieë, sowel as wat nie opgelos word deur bestaande tegnologieë nie, soos berging en bestuur van groot hoeveelhede data wat baie spesifieke eienskappe het.

Data

Boddata hanteer volumes data wat gewoonlik deur die volgende kenmerke gedefinieer word:

  • volume: Grootte van data uit verskeie bronne.
  • spoed: Spoed waarmee data uit verskeie bronne arriveer en bestuur word.
  • Verskeidenheid: Formaat van geanaliseerde data uit verskeie bronne.

Ek bedoel, datavolumes wat gewoonlik saamgestel is uit gestruktureerde, semi-gestruktureerde en ongestruktureerde data, en word in groot hoeveelhede hanteer wat gewoonlik met hoë hoeveelheid voorvoegsels beskryf word, soos: Tera, Peta of Exa, onder andere.

En uit alle soorte bronne, soos die internet (Sosiale netwerke, digitale media, webwerwe en databasisse), Toerusting (Onder andere selfone, multimediaspelers, posisioneringstelsels, burgerlike en industriële digitale sensors) en Organisasies (Privaat en Openbaar, Kommersieel, Regering en Gemeenskap).

Groot data en gratis sagteware: konsep, doelstelling, data, belang, voordele en voordele

belangrikheid

Wat maak Big Data so 'n nuttige tegnologie vir organisasies (Privaat en publiek, kommersieel, regering en gemeenskap), is die feit dat dit waardevolle inligting verskaf wat dikwels dien as 'n akkurate en betroubare antwoord op vrae wat nie eens gevra is nie vir sekere situasies of probleme. Dit wil sê dat die bruikbaarheid daarvan dikwels gesien word op aspekte wat gewoonlik voortspruit uit dieselfde inligting wat versamel en bestuur word.

Die verwerking van groot hoeveelhede inligting maak dit makliker om die verwerkte data op die mees geskikte manier te vorm of te toets. of spesifiseer, wat deur sy administrateur as toepaslik beskou word. Hierdeur kan organisasies wat Big Data gebruik, probleme op 'n meer verstaanbare manier kan identifiseer.

Deur die versameling van groot hoeveelhede data en die daaropvolgende ontleding daarvan om na tendense daarin te soek, kan organisasies meer effektief en doeltreffend wees, deur baie vinniger, gladder en tydiger daaroor te beweeg. Daarbenewens stel dit hulle in staat om probleemareas uit te skakel voordat probleme hulle oorkom, wat veroorsaak dat hulle voordele, reputasie of ondersteuning verloor.

Advantage

Big Data help organisasies om hul data baie beter te bestuur, wat lei tot die identifisering van nuwe positiewe of produktiewe geleenthede vir hul lede (kliënte of burgers). En dit op sy beurt lei tot slimmer en doeltreffender aksies, besparing in ure / arbeid en geld, wat dikwels vertaal word in geluk vir almal wat betrokke is. Wanneer Big Data gebruik word, word waarde gewoonlik toegevoeg tot die aktiwiteite wat op die volgende maniere uitgevoer word:

  • Koste vermindering: In die stoor en bestuur van groot hoeveelhede data.
  • Tydskorting: Meer doeltreffendheid en effektiwiteit in besluitneming.
  • Nuwe produkte en dienste: Met die vermoë om die behoeftes en probleme van gebruikers (klante en / of burgers) te meet en te voorsien, word hul tevredenheid verhoog.

voordele

Goed gebruikte Big Data kan die kernoorsake van mislukkings, probleme en gebreke feitlik in reële tyd bepaal. Dit is egter om dit in ag te neem Big Data-tegnologie is nie 'n wondermiddel op sigself nie. So met verwysing na 'n ander groot tegnologie soos Oracle, daar kan bygevoeg word dat:

«Die identifisering van die waarde van groot data beteken nie net die ontleding daarvan nie (wat op sigself al 'n voordeel is). Dit is 'n hele ontdekkingsproses wat vereis dat ontleders, sakegebruikers en bestuurders die regte vrae vra, patrone identifiseer, ingeligte besluite neem en gedrag voorspel.

Groot data en gratis sagteware: SL / CA-toepassings

SL / CA Aansoeke vir groot data

Onder die gratis sagteware en oopbron-toepassings wat die moeite werd is om te ondersoek, te toets en te implementeer, is:

Verwante

  • Apache Hadoop: Open source platform wat bestaan ​​uit Hadoop Distributed File System (HDFS), Hadoop MapReduce en Hadoop Common.
  • Avro: Apache-projek wat serialisasiedienste lewer.
  • Cassandra: Nie-verhoudingsdatabasis gebaseer op 'n bergingsmodel van , ontwikkel in Java.
  • Chukwa: Sagteware wat ontwerp is vir die versameling en ontleding van gebeurtenislogboeke op groot skaal.
  • Vloei: Sagteware waarvan die hooftaak is om data van een bron na 'n ander plek te lei.
  • HBase: Kolomdatabasis (kolomgerigte databasis) wat op HDFS loop.
  • Korf: "Data Warehouse" -infrastruktuur wat die administrasie van groot hoeveelhede data wat in 'n verspreide omgewing gestoor word, vergemaklik.
  • Jaql: Funksionele en verklarende taal wat die ontginning van data in JSON-formaat moontlik maak om groot hoeveelhede inligting te verwerk.
  • Lucene: Sagteware wat biblioteke bied vir indeksering en soek na teks.
  • oozie: Oopbronprojek wat werkstrome en koördinering tussen elk van die prosesse vereenvoudig.
  • Vark: Sagteware waarmee Hadoop-gebruikers meer kan fokus op die ontleding van alle datastelle en minder tyd spandeer aan die opbou van MapReduce-programme.
  • Dieretuinopsigter: Gesentraliseerde infrastruktuur en dienste wat deur toepassings gebruik kan word om te verseker dat prosesse in 'n groep geserialiseer of gesinkroniseer word.

onafhanklike

Ander net so bekend, maar nie verwant aan die open source platform Hadoop nie, is:

  • Elastiese ondersoek: Volledige teks-gebaseerde soek- en analise-enjin.
  • MongoDB: NoSQL-databasis gebaseer op die dokumentdatamodel.
  • Cassandra: Apache-oopbronprojek wat ontwerp is vir NoSQL-databasisadministrasie.
  • BankDB: Open source NoSQL databasis gebaseer op algemene standaarde vir maklike toeganklikheid en webversoenbaarheid met 'n verskeidenheid.
  • Son: Open source soekenjin gebaseer op die Lucene-projek Java-biblioteek.
    Ander RDBMS-gereedskap: MySQL Cluster en VoltDB.

Groot data en gratis sagteware: gevolgtrekking

Gevolgtrekking

Ons huidige (en onmiddellike volgende) tyd is ondergedompel of verdrink in 'n groot en groeiende hoeveelheid data, wat in sy geheel veel te sê het as individueel. Daarom sal die gebruik van Big Data-tegnologie in die huidige en onmiddellike toekoms die samelewing, die hele mensdom, help om 'n oneindige aantal dinge (gebeure of uitvindings) te ontdek, wat baie jare kon neem om hulself te ontdek. , sonder die gebruik hiervan.

as Big Data en hul gereedskap bied voldoende analisesnelheid analiseer 'n resultaat wat vinnig verkry is en herwerk dit soveel keer as wat nodig is, binne 'n kort tydjie, om die ware of die naaste waarde waarna u probeer bereik te vind. As u die onderwerp van Big Data interessant vind, kan u die onderwerp 'n bietjie meer uitbrei deur hierdie verslag te lees BBVA.


Die inhoud van die artikel voldoen aan ons beginsels van redaksionele etiek. Klik op om 'n fout te rapporteer hier.

Wees die eerste om te kommentaar lewer

Laat u kommentaar

Jou e-posadres sal nie gepubliseer word nie. Verpligte velde gemerk met *

*

*

  1. Verantwoordelik vir die data: Miguel Ángel Gatón
  2. Doel van die data: Beheer SPAM, bestuur van kommentaar.
  3. Wettiging: U toestemming
  4. Kommunikasie van die data: Die data sal nie aan derde partye oorgedra word nie, behalwe deur wettige verpligtinge.
  5. Datastoor: databasis aangebied deur Occentus Networks (EU)
  6. Regte: U kan u inligting te alle tye beperk, herstel en verwyder.