Malaking Data, Libreng Software at Bukas na Pinagmulan: Mga Magagamit na Aplikasyon

Malaking Data, Libreng Software at Bukas na Pinagmulan: Mga Magagamit na Aplikasyon

Malaking Data, Libreng Software at Bukas na Pinagmulan: Mga Magagamit na Aplikasyon

Ang Big Data ay isang konseptong teknolohikal na nauugnay sa pamamahala ng malalaking dami ng data, nakabalangkas at hindi nakaayos, na kasalukuyang pinamamahalaan ng malaking sektor ng negosyo, panteknolohiya, pang-agham at maging ng mga sektor ng gobyerno.

Kahit na kapag pinag-uusapan Malaking Data, hindi talaga ito ang halaga ng data na mahalaga, ngunit kung ano ang ginagawa ng mga samahan sa data. Dahil ang Big Data, ang kaugnay na teknolohiya, ay maaaring pag-aralan ang mga ito upang makakuha ng mga ideya na hahantong sa mas mahusay na paggawa ng desisyon, paggalaw at diskarte. At sa aspetong ito, Ang Libreng Software (SL) at Open Source (CA) ay malaki ang naiambag sa teknolohiyang ito, dahil maraming mga nabuong aplikasyon ang naipatupad sa format ng pag-unlad na ito.

Malaking Data at Libreng Software: Panimula

Malaking Data at Libreng Software

Para sa mga may kasanayan sa sining, alam na alam na Ang Libreng Software, ang modelo ng pag-unlad nito, ang kanyang pilosopiya, ay batay sa paglikha ng mga teknolohiya, higit sa lahat mga produktong software, na kung saan ay maaaring magamit, mabago at malaya na maipamahagi. At ang Open Source na iyon ay isang mahalagang elemento sa pag-unlad ng libreng software, dahil nakatuon ito sa mga praktikal na kalamangan ng pag-unlad na ito na dinamika higit pa sa etika ng kalayaan sa produkto at mga mamamayan.

Samakatuwid, habang Ang SL / CA ay nag-aambag sa mga paraan upang maisakatuparan ang Big Data, Pinupunan ng Big Data ang mga ito nang hindi direkta, hindi lamang para sa pakinabang ng pinabilis na paglawak ng teknolohikal na pag-unlad, ngunit din para sa kalayaan sa pag-access sa impormasyon na dinala ng Big Data.

Malaking Data at Libreng Software: Ano ang Big Data?

Ano ang malaking data?

Konsepto

Para sa isa sa mga dakila ng pagpapaunlad ng Software at teknolohikal, IBM, Ang Big Data ay isang:

«... teknolohiyang nagbukas ng mga pintuan sa isang bagong diskarte sa pag-unawa at paggawa ng desisyon, na ginagamit upang ilarawan ang napakaraming data (nakabalangkas, hindi istraktura at semi-nakabalangkas) na magtatagal ng masyadong maraming oras at napakamahal upang mai-load sa isang pamanggit database para sa pagtatasa.

layunin

Ang Big Data, ang teknolohiya nito, ay isinilang na may layuning masakop ang buong spectrum ng pagtatasa ng data na posible, iyon ay, upang masakop ang kapwa kung ano ang mayroon at nalulutas sa kasalukuyan at iba't ibang mga teknolohiya, pati na rin kung ano ang hindi nalulutas ng mga mayroon nang mga teknolohiya, tulad ng imbakan at pamamahala ng malalaking dami ng data na may tiyak na mga katangian.

Data

Hinahawak ng Data ng Bid ang dami ng data na karaniwang tinukoy ng mga sumusunod na katangian:

  • Dami: Laki ng data mula sa maraming mapagkukunan.
  • Bilis: Bilis kung saan dumarating ang data mula sa maraming mapagkukunan at pinamamahalaan.
  • Pagkakaiba-iba: Format ng pinag-aralan na data mula sa maraming mapagkukunan.

Ibig kong sabihin, dami ng data na karaniwang binubuo ng data na Istraktura, Semi-istruktura, at Hindi istrakturang data, at mapangasiwaan sa napakaraming dami na madalas na inilalarawan na may mataas na dami ng mga unlapi, tulad ng: Tera, Peta o Exa, bukod sa iba pa.

At mula sa lahat ng uri ng mapagkukunan, tulad ng Internet (Mga social network, Digital Media, Mga Website at database), Hardwer (Mga mobile phone, manlalaro ng Multimedia, Sistema ng pagpoposisyon, Sibil at pang-industriya na mga digital sensor, bukod sa iba pa) at organisasyon (Pribado at Publiko, Komersyal, Pamahalaan at Komunidad).

Malaking Data at Libreng Software: Konsepto, Layunin, Data, Kahalagahan, Mga kalamangan at Pakinabang

Kahalagahan

Ano ang ginagawang kapaki-pakinabang na teknolohiya ng Big Data para sa Mga Organisasyon (Pribado at Publiko, Komersyal, Pamahalaan at Komunidad), ay ang katotohanan na nagbibigay ito ng mahalagang impormasyon na maraming beses na nagsisilbing isang tumpak at maaasahang sagot sa mga katanungan na hindi pa tinanong para sa ilang mga sitwasyon o problema. Iyon ay, ang pagiging kapaki-pakinabang nito ay madalas na nakikita sa mga aspeto na karaniwang lumitaw mula sa parehong impormasyon na nakolekta at pinamamahalaan.

Ang pagproseso ng malalaking dami ng impormasyon ay ginagawang mas madali para sa naprosesong data na hugis o nasubukan sa pinakaangkop na paraan. o tumutukoy, na itinuturing na naaangkop ng administrator nito. Pinapayagan nito ang mga samahang gumamit ng Big Data upang makilala ang mga problema sa isang mas nauunawaan na paraan.

Ang koleksyon ng malalaking dami ng data at ang kasunod na pagsusuri nito upang maghanap para sa mga uso sa loob ng mga ito ay nagbibigay-daan sa Mga Organisasyon na maging mas epektibo at mahusay, sa pamamagitan ng paglipat ng mas mabilis, maayos at sa isang napapanahong paraan sa paglipas ng mga ito. Bilang karagdagan, pinapayagan silang alisin ang mga lugar na may problema bago pa sakupin ng mga problema, na magdulot sa kanila ng pagkawala ng mga benepisyo, reputasyon o suporta.

Kalamangan

Ang Big Data ay tumutulong sa Mga Organisasyon na pamahalaan ang kanilang data nang mas mahusay, nagreresulta ito sa pagkilala ng mga bagong positibo o produktibong pagkakataon para sa kanilang mga miyembro (kliyente o mamamayan). At ito naman, humahantong sa mas matalino at mas mahusay na mga pagkilos, pagtipid sa oras / paggawa at pera, na karaniwang isinasalin sa kaligayahan para sa lahat na kasangkot. Kapag ginamit ang Big Data, kadalasang idinadagdag ang halaga sa mga aktibidad na isinasagawa sa mga sumusunod na paraan:

  • Pagbawas ng gastos: Sa pag-iimbak at pamamahala ng malalaking dami ng data.
  • Pagbawas ng oras: Mas kahusayan at pagiging epektibo sa paggawa ng desisyon.
  • Mga bagong produkto at serbisyo: Gamit ang kakayahang sukatin at asahan ang mga pangangailangan at problema ng mga gumagamit (mga customer at / o mamamayan), nadagdagan ang kanilang kasiyahan.

Mga Benepisyo

Ang mahusay na ginamit na Big Data ay madalas na may kakayahang matukoy ang mga ugat na sanhi ng pagkabigo, mga problema at depekto sa halos real time. Gayunpaman, ito ay upang isaalang-alang iyon Ang teknolohiya ng Big Data ay hindi isang panlunas sa sarili. Kaya't binabanggit ang isa pang mahusay ng teknolohiya tulad ng Oracle, maaari itong idagdag na:

"Ang pagkilala sa halaga ng malaking data ay hindi nangangahulugang pag-aralan ito (na isang kalamangan na mismo). Ito ay isang buong proseso ng pagtuklas na nangangailangan ng mga analista, gumagamit ng negosyo at executive na magtanong ng mga tamang katanungan, kilalanin ang mga pattern, gumawa ng matalinong mga desisyon at hulaan ang mga pag-uugali.

Malaking Data at Libreng Software: Mga Aplikasyon ng SL / CA

Mga Aplikasyon ng SL / CA para sa Malaking Data

Kabilang sa mga aplikasyon ng Libreng Software at Open Source na nagkakahalaga ng pagbanggit para sa pagsasaliksik, pagsubok, at pagpapatupad ay:

Kaugnay

  • Apache Hadoop: Open source platform na binubuo ng Hadoop Distribution File System (HDFS), Hadoop MapReduce, at Hadoop Common.
  • Avro: Apache na proyekto na nagbibigay ng mga serbisyong serialization.
  • Cassandra: Ipinamahagi ang hindi nauugnay na database batay sa isang modelo ng imbakan ng , binuo sa Java.
  • Chukwa: Dinisenyo ang software para sa malakihang koleksyon at pagtatasa ng mga tala ng kaganapan.
  • Daloy: Ang software na ang pangunahing gawain ay upang idirekta ang data mula sa isang mapagkukunan sa ilang iba pang lokasyon.
  • HBase: Ang Columnar database (database na nakatuon sa haligi) na tumatakbo sa HDFS.
  • Pugad: Imprastraktura ng "Data Warehouse" na nagpapabilis sa pangangasiwa ng malalaking dami ng data na nakaimbak sa isang ipinamahaging kapaligiran.
  • Jaql: Functional at nagpapahayag na wika na nagpapahintulot sa pagsasamantala ng data sa format na JSON na idinisenyo upang maproseso ang malalaking dami ng impormasyon.
  • Lucene: Ang software na nagbibigay ng mga aklatan para sa pag-index at paghahanap sa teksto.
  • oozie: Buksan ang proyekto ng mapagkukunan na pinapasimple ang mga daloy ng trabaho at koordinasyon sa pagitan ng bawat proseso.
  • Baboy: Ang software na nagpapahintulot sa mga gumagamit ng Hadoop na higit na magtuon sa pag-aaral ng lahat ng mga hanay ng data at gumastos ng mas kaunting oras sa pagbuo ng mga programa ng MapReduce.
  • Zookeeper: Ang sentralisadong imprastraktura at mga serbisyo na maaaring magamit ng mga aplikasyon upang matiyak na ang mga proseso sa isang kumpol ay na-serialize o na-synchronize.

Independent

Ang iba ay kilala rin, ngunit hindi nauugnay sa open source platform na Hadoop ay:

  • Elastic na paghahanap: Engine ng paghahanap at pagsusuri sa buong teksto.
  • MongoDB: Ang database ng NoSQL batay sa modelo ng data ng dokumento.
  • Cassandra: Ang proyekto ng open source ng Apache na idinisenyo para sa pangangasiwa ng database ng NoSQL.
  • CouchDB: Buksan ang mapagkukunan na database ng NoSQL batay sa karaniwang mga pamantayan para sa madaling pag-access at pagiging tugma sa web na may pagkakaiba-iba.
  • Araw: Buksan ang search engine na pinagmulan batay sa Lucene project Java library.
    Iba pang mga tool sa RDBMS: MySQL Cluster at VoltDB.

Malaking Data at Libreng Software: Konklusyon

Konklusyon

Ang aming kasalukuyan (at kaagad na susunod) na oras ay nahuhulog o nalunod sa isang mataas at lumalaking masa ng data, na maraming sasabihin sa kabuuan, kaysa sa isa-isa. Samakatuwid, ang paggamit ng teknolohiya ng Big Data sa kasalukuyan at sa agarang hinaharap, ay makakatulong sa lipunan, ang buong sangkatauhan, upang matuklasan ang isang kawalang-hanggan ng mga bagay (mga kaganapan o imbensyon), na maaaring tumagal ng maraming taon upang matuklasan ang kanilang mga sarili., Nang walang paggamit nito

Mula noon Ang Big Data at ang mga tool nito ay nagbibigay ng sapat na bilis ng pagtatasa pag-aralan ang isang resulta na nakuha nang mabilis at muling pagbuo nito ng maraming beses kung kinakailangan, sa maikling panahon, upang makita ang totoo o malapit na halaga na sinusubukan mong maabot. Kung nahanap mo ang paksa ng Big Data na kawili-wili maaari mong palawakin ang paksa nang kaunti pa sa pamamagitan ng pagbabasa ng Ulat na ito sa BBVA.


Iwanan ang iyong puna

Ang iyong email address ay hindi nai-publish. Mga kinakailangang patlang ay minarkahan ng *

*

*

  1. Responsable para sa data: Miguel Ángel Gatón
  2. Layunin ng data: Kontrolin ang SPAM, pamamahala ng komento.
  3. Legitimation: Ang iyong pahintulot
  4. Komunikasyon ng data: Ang data ay hindi maiparating sa mga third party maliban sa ligal na obligasyon.
  5. Imbakan ng data: Ang database na naka-host ng Occentus Networks (EU)
  6. Mga Karapatan: Sa anumang oras maaari mong limitahan, mabawi at tanggalin ang iyong impormasyon.