Big Data, Software Libre y Código Abierto: Aplicaciones disponibles

Big Data, wolne oprogramowanie i otwarte źródło: dostępne aplikacje

Big Data to koncepcja technologiczna związana z zarządzaniem dużymi ilościami danych, ustrukturyzowane i nieustrukturyzowane, którymi obecnie zarządzają duże sektory biznesowe, technologiczne, naukowe, a nawet rządowe.

Chociaż mówiąc o Big Data, tak naprawdę nie ilość danych jest ważna, ale to, co organizacje robią z danymi. Odkąd Big Data, powiązana z nim technologia, może je analizować w celu uzyskania pomysłów, które prowadzą do lepszego podejmowania decyzji, ruchów i strategii. W tym aspekcie Wolne oprogramowanie (SL) i Open Source (CA) wniosły duży wkład w tę technologię, ponieważ wiele opracowanych aplikacji zostało zaimplementowanych w tym formacie programistycznym.

Big Data i wolne oprogramowanie

Dla fachowców jest to już dobrze znane Wolne oprogramowanie, jego model rozwoju, jego filozofia opiera się na tworzeniu technologii, głównie oprogramowania, które z kolei może być swobodnie używane, modyfikowane i rozpowszechniane. I że Open Source jest ważnym elementem w rozwoju wolnego oprogramowania, ponieważ skupia się bardziej na praktycznych zaletach tej dynamiki rozwoju niż na etyce wolności produktu i obywateli.

Dlatego while SL / CA wnosi środki do realizacji Big DataBig Data pośrednio je uzupełnia, nie tylko z korzyścią dla przyśpieszonego rozwoju technologicznego, ale także dla swobody dostępu do informacji, jakie niesie ze sobą Big Data.

Co to są duże zbiory danych?

concepto

Dla jednego z największych twórców oprogramowania i rozwoju technologicznego, IBM, Big Data to:

«... technologia, która otworzyła drzwi do nowego rozumienia i podejmowania decyzji, która jest używana do opisywania ogromnych ilości danych (ustrukturyzowanych, nieustrukturyzowanych i częściowo ustrukturyzowanych), których załadowanie do relacyjna baza danych do analizy.

Cel

Big Data, jego technologia, narodziła się w celu pokrycia całego możliwego zakresu analizy danychto znaczy, aby objąć zarówno to, co istnieje i jest rozwiązane za pomocą obecnych i różnych technologii, jak i to, co nie jest rozwiązane przez istniejące technologie, takie jak przechowywanie i zarządzanie dużymi ilościami danych które mają bardzo specyficzne cechy.

Dane

Dane ofertowe obsługują ilości danych, które są zwykle definiowane przez następujące cechy:

Tom: Rozmiar danych z wielu źródeł.
Prędkość: Szybkość, z jaką dane z wielu źródeł docierają i są zarządzane.
Różnorodność: Format analizowanych danych z wielu źródeł.

Oznacza to, że wolumeny danych, które zazwyczaj składają się z danych ustrukturyzowanych, częściowo ustrukturyzowanych i nieustrukturyzowanychi być obsługiwane w ogromnych ilościach, które często są opisywane za pomocą przedrostków o dużej ilości, takich jak między innymi: Tera, Peta lub Exa.

Oraz z różnych źródeł, takich jak Internet (Sieci społecznościowe, media cyfrowe, strony internetowe i bazy danych), sprzęt komputerowy (M.in. telefony komórkowe, odtwarzacze multimedialne, systemy pozycjonowania, cywilne i przemysłowe czujniki cyfrowe) i Organizacje (Prywatne i publiczne, komercyjne, rządowe i wspólnotowe).

Znaczenie

Co sprawia, że Big Data jest tak przydatną technologią dla Organizacji (Prywatne i publiczne, komercyjne, rządowe i wspólnotowe), to fakt, że dostarcza cennych informacji to często służy jako dokładna i rzetelna odpowiedź na pytania, które nawet nie zostały zadane w określonych sytuacjach lub problemach. Oznacza to, że jego użyteczność jest często widoczna w aspektach, które zwykle wynikają z tych samych informacji, które są gromadzone i zarządzane.

Przetwarzanie dużych ilości informacji ułatwia kształtowanie lub testowanie przetwarzanych danych w najbardziej odpowiedni sposób. lub określa, że administrator uzna to za stosowne. Dzięki temu organizacje korzystające z Big Data mogą identyfikować problemy w bardziej zrozumiały sposób.

Gromadzenie dużych ilości danych i ich późniejsza analiza w celu wyszukania w nich trendów pozwala Organizacjom być bardziej efektywnymi i wydajnymi, poruszając się po nich znacznie szybciej, płynniej i na czas. Ponadto pozwala im eliminować obszary problemowe, zanim problemy ich wyprzedzą, powodując utratę korzyści, reputacji lub wsparcia.

Zaleta

Big Data pomaga organizacjom znacznie lepiej zarządzać swoimi danymi, co skutkuje identyfikacją nowych pozytywnych lub produktywnych możliwości dla ich członków (klientów lub obywateli). A to z kolei prowadzi do mądrzejszych i skuteczniejszych działań, oszczędności godzin / pracy i pieniędzy, co często przekłada się na szczęście wszystkich zaangażowanych. W przypadku korzystania z Big Data wartość dodawana jest zazwyczaj w następujący sposób:

Redukcja kosztów: W przechowywaniu i zarządzaniu dużymi ilościami danych.
Redukcja czasu: Większa efektywność i skuteczność w podejmowaniu decyzji.
Nowe produkty i usługi: Dzięki możliwości pomiaru i przewidywania potrzeb i problemów użytkowników (klientów i / lub obywateli) wzrasta ich satysfakcja.

korzyści

Dobrze wykorzystany Big Data jest często w stanie określić podstawowe przyczyny awarii, problemów i defektów niemal w czasie rzeczywistym. Jednak należy to wziąć pod uwagę Technologia Big Data nie jest sama w sobie panaceum. Cytując więc inną wielką technologię, taką jak Oracle, można dodać, że:

„Określenie wartości dużych zbiorów danych to nie tylko ich analiza (co już jest zaletą samą w sobie). Jest to cały proces odkrywania, który wymaga od analityków, użytkowników biznesowych i kadry kierowniczej zadawania właściwych pytań, identyfikowania wzorców, podejmowania świadomych decyzji i przewidywania zachowań.

Aplikacje SL / CA dla Big Data

Wśród aplikacji Wolnego Oprogramowania i Otwartego Oprogramowania, o których warto wspomnieć w celach badawczych, testowych i wdrożeniowych, należą:

Związane z

Apache Hadoopa: Platforma open source składająca się z rozproszonego systemu plików Hadoop (HDFS), Hadoop MapReduce i Hadoop Common.
Awro: Projekt Apache, który zapewnia usługi serializacji.
Kasandra: Rozproszona nierelacyjna baza danych oparta na modelu magazynu , opracowany w Javie.
Czukwa: Oprogramowanie przeznaczone do gromadzenia i analizy dzienników zdarzeń na dużą skalę.
Korytko: Oprogramowanie, którego głównym zadaniem jest kierowanie danych z jednego źródła do innej lokalizacji.
HBase: Kolumnowa baza danych (baza danych zorientowana na kolumny) działająca na HDFS.
Ul: Infrastruktura „hurtowni danych” ułatwiająca administrowanie dużą ilością danych przechowywanych w środowisku rozproszonym.
Jaql: Funkcjonalny i deklaratywny język, który umożliwia wykorzystanie danych w formacie JSON przeznaczonym do przetwarzania dużych ilości informacji.
Lucen: Oprogramowanie, które udostępnia biblioteki do indeksowania i wyszukiwania tekstu.
oozie: Projekt open source, który upraszcza przepływy pracy i koordynację między każdym z procesów.
Świnia: Oprogramowanie, które pozwala użytkownikom Hadoop skupić się bardziej na analizie wszystkich zestawów danych i spędzać mniej czasu na tworzeniu programów MapReduce.
Opiekun ogrodu zoologicznego: Scentralizowana infrastruktura i usługi, z których mogą korzystać aplikacje, aby zapewnić serializację lub synchronizację procesów w klastrze.

Niezależne

Inne równie dobrze znane, ale niezwiązane z platformą open source Hadoop to:

Wyszukiwanie elastyczne: Pełnotekstowy mechanizm wyszukiwania i analizy.
MongoDB: Baza danych NoSQL oparta na modelu danych dokumentu.
Kasandra: Projekt open source Apache przeznaczony do administrowania bazami danych NoSQL.
KanapaDB: Baza danych NoSQL typu open source oparta na wspólnych standardach zapewniających łatwą dostępność i kompatybilność sieciową z różnorodnością.
Słońce: Wyszukiwarka open source oparta na bibliotece Java projektu Lucene.
Inne narzędzia RDBMS: MySQL Cluster i VoltDB.

Wnioski

Nasz obecny (i najbliższy) czas jest pogrążony lub zatopiony w dużej i rosnącej masie danych, które mają wiele do powiedzenia jako całość, a nie indywidualnie. Dlatego wykorzystanie technologii Big Data w teraźniejszości i najbliższej przyszłości pomoże społeczeństwu, całej ludzkości, odkryć nieskończoność rzeczy (wydarzeń lub wynalazków), których odkrycie mogło zająć wiele lat. bez użycia tego.

Od Big Data i jego narzędzia zapewniają wystarczającą szybkość analizy szybko przeanalizuj uzyskany wynik i przerób go tyle razy, ile potrzeba, w krótkim czasie, aby znaleźć prawdziwą lub najbliższą wartość, do której próbujesz dotrzeć. Jeśli zainteresował Cię temat Big Data, możesz nieco rozszerzyć ten temat, czytając ten raport BBVA.

DesdeLinux