Grouss Daten, Gratis Software an Open Source: Verfügbar Uwendungen

Grouss Daten, Gratis Software an Open Source: Verfügbar Uwendungen

Grouss Daten, Gratis Software an Open Source: Verfügbar Uwendungen

Big Data ass en technologescht Konzept dat am Zesummenhang mat der Gestioun vu grousse Volumen vun Daten ass, strukturéiert an onstrukturéiert, déi aktuell vu grousse Geschäfts-, technologeschen, wëssenschaftlechen an och Regierungsberäicher gehandhabt ginn.

Och wann wann iwwer geschwat gëtt Big Data, et ass net wierklech d'Quantitéit vun Daten déi wichteg sinn, awer wat Organisatioune mat den Date maachen. Zënter Big Data, seng assoziéiert Technologie, kënnen se analyséieren fir Iddien ze kréien déi zu besseren Entscheedungsprozesser, Bewegungen a Strategien féieren. An an dësem Aspekt, Gratis Software (SL) an Open Source (CA) hu vill zu dëser Technologie bäigedroen, well vill entwéckelt Uwendungen an dësem Entwécklungsformat implementéiert goufen.

Big Data a Gratis Software: Aféierung

Big Data a Gratis Software

Fir déi kompetent an der Konscht ass et scho bekannt datt Free Software, säin Entwécklungsmodell, seng Philosophie, baséiert op Schafe vun Technologien, haaptsächlech Software Produkter, déi hirersäits kënne benotzt, geännert a fräi verdeelt ginn. An datt Open Source e wichtegt Element an der Entwécklung vu gratis Software ass, well et sech op déi praktesch Virdeeler vun dëser Entwécklungsdynamik fokusséiert méi wéi op d'Ethik vun der Produktfräiheet an Bierger.

Dofir, wärend Den SL / CA bedeelegt sech mat de Mëttele fir Big Data duerchzeféieren, Big Data ergänzen dës indirekt, net nëmme fir de Virdeel vun der beschleuniger Expansioun vun der technologescher Entwécklung, awer och fir d'Fräiheet vum Zougang zu Informatioun déi Big Data mat sech bréngt.

Big Data a Gratis Software: Wat sinn Big Data?

Wat sinn déi grouss Daten?

concepto

Fir ee vun de Grousse vu Software an technologescher Entwécklung, IBM, Big Data sinn eng:

«... Technologie déi d'Dieren opgemaach huet fir eng nei Approche fir Verständnis an Entscheedungsprozess, déi benotzt gëtt fir enorm Quantitéiten un Daten (strukturéiert, onstrukturéiert a semi-strukturéiert) ze beschreiwen, déi ze laang daueren a ganz deier sinn fir op eng relational Datebank fir Analyse.

Objective

Big Data, seng Technologie, gouf gebuer mam Zil de ganze Spektrum vun Datenanalyse méiglech ze decken, dat ass, fir ze bedecken wat existéiert a mat aktuellen a verschiddenen Technologien geléist gëtt, wéi och wat net vun existente Technologien geléist gëtt, wéi z. Stockage a Gestioun vu grousse Volumen vun Daten déi ganz spezifesch Charakteristiken hunn.

Daten

Biedendate verschafft Volumen vun Daten déi normalerweis duerch folgend Charakteristike definéiert sinn:

  • Volume: Gréisst vun Daten aus méi Quellen.
  • Geschwindegkeet: Geschwindegkeet mat deenen Daten aus méi Quellen ukommen a geréiert ginn.
  • Varietéit: Format vun den analyséierten Daten aus méi Quellen.

Ech mengen, Datenvolumen déi typesch aus strukturéiert, semi-strukturéiert an onstrukturéiert Daten zesummesetzen, a gi grouss Quantitéite behandelt, déi dacks mat héije Quantitéitspréfixe beschriwwe ginn, wéi: Tera, Peta oder Exa, ënner anerem.

A vun all méiglech Quelle wéi zum Beispill Internet (Sozial Netzwierker, Digital Medien, Websäiten an Datenbanken), Home (Handyen, Multimedia Player, Positionéierungssystemer, Zivil an industriell Digital Sensoren, ënner anerem) an Organisatiounen (Privat an Ëffentlech, Kommerziell, Regierung a Gemeinschaft).

Grouss Daten a Fräi Software: Konzept, Zil, Daten, Wichtegkeet, Virdeeler a Virdeeler

Wichtegkeet

Wat mécht Big Data sou eng nëtzlech Technologie fir Organisatiounen (Privat an Ëffentlech, Kommerziell, Regierung a Gemeinschaft), ass de Fakt datt et wäertvoll Informatioun gëtt dat déngt dacks als korrekt an zouverléisseg Äntwert op Froen déi net emol gestallt goufen fir gewësse Situatiounen oder Probleemer. Dat ass, seng Nëtzlechkeet gëtt dacks op Aspekter gesinn, déi normalerweis aus der selwechter gesammelt a verwalteter Informatioun entstinn.

D'Veraarbechtung vu grousse Informatiounsvolume mécht et méi einfach fir déi veraarbechten Daten ze formen oder ze testen op déi passendst Manéier. oder spezifizéiert, dat gëtt ugesi vu sengem Administrator ugesinn. Dëst erlaabt Organisatiounen déi Big Data benotze fir Problemer op eng méi verständlech Manéier z'identifizéieren.

D'Sammlung vu grousse Volumen vun Daten an hir uschléissend Analyse fir no Trends an hinnen ze sichen erlaben Organisatiounen méi effektiv an effizient ze sinn, andeems Dir vill méi séier, glat an zäitgeméiss driwwer beweegt. Zousätzlech erlaabt et hinnen d'Problemgebidder ze eliminéieren ier d'Problemer se iwwerhuelen, wouduerch se Virdeeler, Ruff oder Ënnerstëtzung verléieren.

Virdeeler

Big Data hëlleft Organisatiounen hir Daten vill besser ze managen, dëst resultéiert an der Identifikatioun vun neie positiven oder produktive Méiglechkeete fir hir Memberen (Clienten oder Bierger). An dëst am Tour féiert zu méi schlau a méi effizient Aktiounen, Stonnen / Aarbecht a Suen ze spueren, wat normalerweis a Gléck fir jiddereen involvéiert iwwersetzt. Wann Big Data benotzt ginn, gëtt normalerweis Wäert op d'Aktivitéiten op déi folgend Weeër hinzugefügt:

  • Käschte Reduktioun: Am Lagerung a Gestioun vu grousse Volumen vun Daten.
  • Zäitreduktioun: Méi Effizienz an Effizienz beim Entscheedungsprozess.
  • Nei Produkter a Servicer: Mat der Fäegkeet d'Besoinen an d'Problemer vun de Benotzer (Clienten an / oder Bierger) ze moossen an ze antizipéieren, gëtt hir Zefriddenheet erhéicht.

Virdeeler

Gutt benotzt Big Data ass dacks fäeg d'Haaptursaache vu Feeler, Probleemer a Mängel bal an Echtzäit ze bestëmmen. Allerdéngs ass et ze berécksiichtegen Big Data Technologie ass net e Panacea vu sech selwer. Also zitéiert eng aner grouss Technologie wéi Oracle, et kann derbäigesat ginn datt:

«De Wäert vu groussen Daten z'identifizéieren heescht net nëmmen et ze analyséieren (wat scho Virdeel u sech ass). Et ass e ganzen Entdeckungsprozess deen Analysten, Geschäftsbenotzer an Direktere verlaangt déi richteg Froen ze stellen, Musteren z'identifizéieren, informéiert Entscheedungen ze treffen a Verhalen ze viraussoen.

Big Data a Gratis Software: SL / CA Uwendungen

SL / CA Uwendungen fir Big Data

Ënnert de Free Software an Open Source Uwendungen déi et wäert si fir Fuerschung, Testen an Ëmsetzung ze ernimmen sinn:

Zesummenhang

  • Apache Hadoop: Open Source Plattform aus Hadoop Distributed File System (HDFS), Hadoop MapReduce, an Hadoop Common.
  • Avro: Apache Projet dee Serialiséierungsservicer ubitt.
  • Cassandra: Verdeelt net-relational Datebank baséiert op engem Späichermodell vun , op Java entwéckelt.
  • Chukwa: Software entwéckelt fir grouss Sammlung an Analyse vun Eventprotokoller.
  • Floumaart: Software deenen hir Haaptaufgab d'Date vun enger Quell op eng aner Plaz ass.
  • HBase: Kolonnebasis (Spalteorientéiert Datebank) déi op HDFS leeft.
  • Hief: "Data Warehouse" Infrastruktur déi d'Verwaltung vu grousse Volumen vun Daten erliichtert déi an engem verdeelte Ëmfeld gespäichert sinn.
  • Jaql: Funktionell an deklarativ Sprooch déi d'Ausbeutung vun Daten am JSON Format erlaabt fir grouss Bänn un Informatioun ze verschaffen.
  • Lucene: Software déi Bibliothéike bitt fir ze indexéieren an no Text ze sichen.
  • Oozie: Open Source Projet deen Workflows a Koordinatioun tëscht jiddereng vun de Prozesser vereinfacht.
  • Schwäin: Software déi den Hadoop Benotzer erlaabt sech méi op d'Analyse vun allen Datensätz ze konzentréieren a manner Zäit ze verbréngen MapReduce Programmer ze bauen.
  • ZooKeeper: Zentraliséiert Infrastruktur a Servicer déi vun Uwendunge kënne benotzt ginn fir sécher ze sinn datt Prozesser an engem Stärekoup serialiséiert oder synchroniséiert sinn.

Onofhängegkeet

Anerer grad sou bekannt, awer net bezunn op d'Open Source Plattform Hadoop sinn:

  • Elastiksearch: Volltextbaséiert Sich- an Analysemotor.
  • MongoDB: NoSQL Datebank baséiert op dem Dokument Datemodell.
  • Cassandra: Apache Open Source Projet fir NoSQL Datebankverwaltung entwéckelt.
  • CouchDB: Open Source NoSQL Datebank baséiert op gemeinsame Standarden fir einfach Accessibilitéit a Web Kompatibilitéit mat enger Varietéit.
  • Solr: Open Source Sichmaschinn baséiert op der Lucene Projet Java Bibliothéik.
    Aner RDBMS Tools: MySQL Cluster a VoltDB.

Big Data a Gratis Software: Conclusioun

Konklusioun

Eis haiteg (an direkt nächste) Zäit ass an eng héich a wuessend Mass vun Daten agedunkelt oder erdronk, déi am grousse Ganze vill ze soen huet, wéi individuell. Dofir hëlleft d'Benotzung vu Big Data Technologie an der aktueller an der direkter Zukunft d'Gesellschaft, d'ganz Mënschheet, fir eng Onendlechkeet vu Saachen (Eventer oder Erfindungen) z'entdecken, déi vill Joeren hätt kënnen daueren fir sech selwer z'entdecken. , ouni de Gebrauch vun dësem.

Zënter Big Data a seng Tools bidden genuch Analysegeschwindegkeet analyséiert e Resultat dat séier kritt ass a veraarbecht et esou oft wéi néideg, a kuerzer Zäit, fir de richtegen oder nooste Wäert ze fannen op deen Dir probéiert ze erreechen. Wann Dir d'Thema Big Data interessant fonnt hutt, kënnt Dir d'Thema e bësse méi erweideren andeems Dir dëse Bericht liest BBVA.


Den Inhalt vum Artikel hält sech un eis Prinzipie vun redaktionnell Ethik. Fir e Feeler ze mellen klickt hei.

Gitt d'éischt fir ze kommentéieren

Gitt Äre Kommentar

Är Email Adress gëtt net publizéiert ginn. Néideg Felder sinn markéiert mat *

*

*

  1. Responsabel fir d'Daten: Miguel Ángel Gatón
  2. Zweck vun den Donnéeën: Kontroll SPAM, Kommentarmanagement.
  3. Legitimatioun: Är Zoustëmmung
  4. Kommunikatioun vun den Donnéeën: D'Donnéeë ginn net un Drëttubidder matgedeelt ausser duerch legal Verpflichtung.
  5. Datenspeicher: Datebank gehost vun Occentus Networks (EU)
  6. Rechter: Zu all Moment kënnt Dir Är Informatioun limitéieren, recuperéieren an läschen.