Чоң маалыматтар, акысыз программа жана ачык булак: жеткиликтүү тиркемелер

Чоң маалыматтар, акысыз программа жана ачык булак: жеткиликтүү тиркемелер

Чоң маалыматтар, акысыз программа жана ачык булак: жеткиликтүү тиркемелер

Big Data - бул чоң көлөмдөгү маалыматтарды башкарууга байланыштуу технологиялык түшүнүк, структуралаштырылган жана структуралаштырылбаган, учурда ири бизнес, технологиялык, илимий жана ал тургай мамлекеттик секторлор тарабынан иштелип чыгат.

Сүйлөшүп жатканда Big Data, бул чындыгында маалыматтын көлөмү эмес, уюмдар маалымат менен эмне кылышы маанилүү. Big Data, аны менен байланышкан технология, аларды чечимдерди кабыл алууга, кыймылдарды жана стратегияларды жакшыртууга алып келген идеяларды алуу үчүн талдай алат. Жана ушул жагынан, Акысыз Программа (SL) жана Ачык Булак (CA) бул технологияга чоң салым кошту, көптөгөн иштелип чыккан тиркемелер ушул иштеп чыгуу форматында ишке ашырылгандыктан.

Чоң маалыматтар жана акысыз программа: киришүү

Чоң маалыматтар жана акысыз программа

Искусство чеберлери үчүн бул белгилүү Акысыз программалык камсыздоо, анын өнүгүү модели, философиясы технологияларды түзүүгө негизделген, негизинен программалык продуктулар, алар өз кезегинде колдонууга, өзгөртүүгө жана эркин таратууга болот. Ачык булак - бул акысыз программалык камсыздоону иштеп чыгуунун маанилүү элементи, анткени ал өнүмдүн эркиндигинин этикасына эмес, ушул өнүгүүнүн практикалык артыкчылыктарына көңүл бурат. жарандар.

Ошондуктан, ал эми SL / CA Big Data жүргүзүү каражаттары менен салым кошот, Big Data буларды кыйыр түрдө толуктап турат, бул технологиялык өнүгүүнүн тездетилген кеңейишине гана эмес, Big Data өзү менен кошо алган маалыматка жетүү эркиндигине дагы.

Чоң маалыматтар жана акысыз программа: Big Data деген эмне?

Чоң маалымат деген эмне?

CONCEPTO

Программалык камсыздоонун жана технологиянын өнүгүүсүнүн эң мыктысы үчүн, IBM, Big Data бул:

«... жаңы түшүнүктүн жана чечим кабыл алуунун эшигин ачкан технология, бул өтө көп убакытты талап кылган жана өтө кымбатка турган маалыматтарды (структуралаштырылбаган, структуралаштырылбаган жана жарым структуралуу) сүрөттөө үчүн колдонулат. талдоо үчүн реляциялык маалыматтар базасы.

объективдүү

Big Data, анын технологиясы, мүмкүн болгон анализдин бүт спектрин камтуу максатында төрөлгөн, башкача айтканда, бар жана чечилген нерселерди учурдагы жана ар кандай технологиялар менен жабуу, ошондой эле иштеп жаткан технологиялар менен чечилбеген нерселерди, мисалы. маалыматтардын ири көлөмүн сактоо жана башкаруу өзгөчө мүнөздөмөлөргө ээ.

маалымат

Тендердик маалыматтар, адатта, төмөнкү мүнөздөмөлөр менен аныкталган маалыматтардын көлөмүн иштетет:

  • көлөмү: Бир нече булактардан алынган маалыматтардын көлөмү.
  • ылдамдык: Бир нече булактардан алынган маалыматтардын ылдамдыгы жана башкарылышы.
  • Сорт: Бир нече булактардан алынган талданган маалыматтардын форматы.

Башкача айтканда, адатта Структураланган, Жарым структураланган жана Түзүлбөгөн маалыматтардан турган маалыматтардын көлөмү, ошондой эле көп санда префикстер менен сүрөттөлгөн эбегейсиз көп көлөмдө иштөө керек, мисалы: Тера, Пета же Экса жана башкалар.

Жана Интернет сыяктуу ар кандай булактардан (Социалдык тармактар, Санарип Медиа, Вебсайттар жана Маалыматтар базасы), аппараттык (Уюлдук телефондор, Мультимедиа ойноткучтары, Жайгаштыруу тутумдары, Жарандык жана өнөр жай санариптик сенсорлор жана башкалар) уюмдар (Жеке жана коомдук, коммерциялык, мамлекеттик жана жамааттык).

Чоң маалыматтар жана эркин программалар: түшүнүк, максат, маалыматтар, маанилүүлүк, артыкчылыктар жана артыкчылыктар

мааниге ээ

Big Data уюмдары үчүн ушундай пайдалуу технологияга айланган нерсе (Жеке жана коомдук, коммерциялык, мамлекеттик жана жамааттык), баалуу маалыматтарды бергендиги болуп саналат көп учурда али сурала элек суроолорго так жана ишенимдүү жооп катары кызмат кылат айрым кырдаалдар же көйгөйлөр үчүн. Башкача айтканда, анын пайдалуулугу көбүнчө бир эле маалымат топтолгон жана башкарылгандыктан келип чыккан аспектилерде байкалат.

Маалыматтын ири көлөмүн иштеп чыгуу, иштетилген маалыматтарды калыпка салууну же эң ылайыктуу жол менен текшерүүнү жеңилдетет. же анын администратору ылайыктуу деп эсептеген көрсөтөт. Бул Big Data колдонгон уюмдарга көйгөйлөрдү түшүнүктүү жол менен аныктай алат.

Көп көлөмдөгү маалыматтарды чогултуу жана алардын ичиндеги тенденцияларды издөө үчүн кийинки талдоо уюмдарга натыйжалуу жана натыйжалуу болууга мүмкүндүк берет, алардын үстүнөн бир кыйла тез, жылмакай жана өз убагында жылып. Мындан тышкары, бул көйгөйлүү маселелерди чечүүдөн мурун, көйгөйлөрдү чечип, артыкчылыктардан, беделден же колдоодон айрылууга мүмкүндүк берет.

пайда

Big Data уюмдарга өз маалыматтарын кыйла жакшыраак башкарууга жардам берет, натыйжада алардын мүчөлөрү (кардарлары же жарандары) үчүн жаңы позитивдүү же жемиштүү мүмкүнчүлүктөр аныкталат. Ал эми бул өз кезегинде акылдуу жана натыйжалуу иш-аракеттерге, сааттарды / эмгекти жана акчаны үнөмдөөгө алып келет, бул көп учурда бардык катышуучулардын бактысына айланат. Big Data колдонулганда, адатта төмөнкүдөй жолдор менен жүргүзүлүүчү иш-чараларга кошумча нарк кошулат:

  • Чыгымдарды төмөндөтүү: Көп көлөмдөгү маалыматтарды сактоо жана башкарууда.
  • Убакытты кыскартуу: Чечимдерди кабыл алууда көбүрөөк натыйжалуулук жана натыйжалуулук.
  • Жаңы өнүмдөр жана кызматтар: Колдонуучулардын (кардарлардын жана / же жарандардын) муктаждыктарын жана көйгөйлөрүн өлчөө жана болжолдоо мүмкүнчүлүгү менен, алардын канааттануусу жогорулайт.

пайдасы

Жакшы колдонулган Big Data көбүнчө реалдуу убакытта мүчүлүштүктөрдүн, көйгөйлөрдүн жана кемчиликтердин негизги себептерин аныктай алат. Бирок, муну эске алуу керек Big Data технологиясы өзүнөн-өзү панацея эмес. Сыяктуу дагы бир улуу технологияны мисал келтирип Oracle, деп кошумчаласа болот:

«Чоң маалыматтардын баасын аныктоо аны талдоо дегенди гана билдирбейт (бул өзү эле артыкчылык болуп саналат). Бул талдоочулардан, бизнес колдонуучулардан жана жетекчилерден туура суроолорду берүүнү, мыйзам ченемдүүлүктөрдү аныктоону, негиздүү чечимдерди кабыл алууну жана жүрүм-турумду алдын ала айтууну талап кылган бүтүндөй ачылыш процесси.

Чоң маалыматтар жана акысыз программа: SL / CA тиркемелери

Big Data үчүн SL / CA тиркемелери

Изилдөө, сыноо жана жүзөгө ашыруу үчүн айта кетүүчү акысыз Программа жана Ачык Булактуу тиркемелердин катарына төмөнкүлөр кирет:

Тектеш

  • Apache Hadoop: Hadoop Distributed File System (HDFS), Hadoop MapReduce жана Hadoop Commonдан турган ачык булактуу платформа.
  • Авро: Сериалдаштыруу кызматын көрсөткөн Apache долбоору.
  • Кассандра: Сактоо моделинин негизинде таркатылган реляциялык эмес маалыматтар базасы , Javaда иштелип чыккан.
  • Чуква: Кеңири масштабдагы иш-чаралар журналдарын чогултуу жана талдоо үчүн иштелип чыккан программа.
  • Түтүн: Негизги милдети - маалыматты бир булактан башка жерге багыттоо болгон программа.
  • HBase: HDFS менен иштеген мамыча базасы (мамычага багытталган маалымат базасы).
  • Уюк: Таркатылган чөйрөдө сакталып турган маалыматтардын ири көлөмүн башкарууну жеңилдеткен "Маалымат кампасы" инфраструктурасы.
  • Жакл: JSON форматындагы маалыматтарды эксплуатациялоого мүмкүндүк берген функционалдык жана декларативдүү тил, маалыматтын ири көлөмүн иштетүүгө арналган.
  • Lucene: Текстти индекстөө жана издөө үчүн китепканаларды камсыз кылган программа.
  • Оози: Жумуш агымдарын жана процесстердин ар бири менен макулдашууну жөнөкөйлөтүүчү ачык булактуу долбоор.
  • Чочко: Hadoop колдонуучуларына бардык маалымат топтомдорун талдоого көбүрөөк көңүл бурууга жана MapReduce программаларын түзүүгө аз убакыт сарптоого мүмкүндүк берген программа.
  • ZooKeeper: Кластердеги процесстердин сериялаштырылышын же синхрондоштурулушун камсыз кылуу үчүн тиркемелер колдоно турган борборлоштурулган инфраструктура жана кызматтар.

көз каранды эмес

Башкалар бирдей белгилүү, бирок Hadoop ачык булактуу платформасына тиешеси жоктор:

  • Эластикалык издөө: Толук тексттин негизинде издөө жана талдоо тутуму.
  • MongoDB: Документтин үлгүсүнө негизделген NoSQL маалымат базасы.
  • Кассандра: Apache ачык булагы, NoSQL маалымат базасын башкаруу үчүн иштелип чыккан.
  • CouchDB: Ачык булактуу NoSQL маалымат базасы жалпыга жеткиликтүүлүктүн жана ар түрдүүлүк менен веб-шайкештиктин жалпы стандарттарына негизделген.
  • Solr: Lucene долбоорунун Java китепканасынын негизиндеги ачык булактуу издөө тутуму.
    Башка RDBMS куралдары: MySQL кластери жана VoltDB.

Чоң маалыматтар жана акысыз программалык камсыздоо: Жыйынтык

жыйынтыктоо

Биздин учурдагы (жана жакынкы кийинки) учурлар жогорку деңгээлде өсүп жаткан маалыматтарга сууга чөгүп же чөгүп баратат, алар жеке-жеке эмес, жалпысынан көп нерсени айта алышат. Демек, Big Data технологиясын азыркы жана жакынкы келечекте колдонуу коомго, бүтүндөй адамзатка нерселердин (окуялардын же ойлоп табуулардын) чексиздигин табууга жардам берет, бул өзүн-өзү табуу үчүн көп жылдар талап кылынышы мүмкүн эле. , муну колдонбостон.

катары Big Data жана анын куралдары анализдин жетиштүү ылдамдыгын камсыз кылат алынган натыйжаны тез анализдеп, жетишүүгө аракет кылып жаткан чыныгы же жакын баалуулукту табуу үчүн кыска убакыттын ичинде аны канча жолу талап кылынса, ошону иштеп чыгыңыз. Эгер сиз Big Data темасын кызыктуу деп тапсаңыз, анда ушул Отчетту окуп, теманы дагы кеңейте аласыз BBVA.


Макаланын мазмуну биздин принциптерге карманат редакциялык этика. Ката жөнүндө кабарлоо үчүн чыкылдатыңыз бул жерде.

Комментарий биринчи болуп

Комментарий калтырыңыз

Сиздин электрондук почта дареги жарыяланбайт. Милдеттүү талаалар менен белгиленет *

*

*

  1. Маалыматтар үчүн жооптуу: Мигель Анхель Гатан
  2. Маалыматтын максаты: СПАМды көзөмөлдөө, комментарийлерди башкаруу.
  3. Мыйзамдуулук: Сиздин макулдугуңуз
  4. Маалыматтарды берүү: Маалыматтар үчүнчү жактарга юридикалык милдеттенмелерден тышкары билдирилбейт.
  5. Маалыматтарды сактоо: Occentus Networks (ЕС) тарабынан уюштурулган маалыматтар базасы
  6. Укуктар: Каалаган убакта маалыматыңызды чектеп, калыбына келтирип жана жок кыла аласыз.