BlazingSQL သည်ဒေတာအပြောင်းအလဲမြန်စေရန် GPUS ကိုအသုံးပြုရန်၎င်း၏အရင်းအမြစ်ကုဒ်ကိုထုတ်ပြန်ခဲ့သည်

ပွင့်လင်းသောအရင်းအမြစ်စီမံကိန်းအသစ်သည်ခွဲခြမ်းစိတ်ဖြာမှုများကိုနောက်အဆင့်သို့ရောက်စေလိုပြီးနောက်ကွယ်ရှိလူများဖြစ်သည် BlazingSQL သည်၎င်းသည်၎င်း၏ SQL engine အတွက်အရင်းအမြစ်ကုဒ်ကိုထုတ်ပြန်ခဲ့သည်ဟုမကြာသေးမီကကြေငြာခဲ့သည် အရာဒေတာအပြောင်းအလဲနဲ့အရှိန်မြှင့်ရန် GPU ကိုများတွင်အသုံးပြုသည်။ BlazingSQL သည်ပြည့်စုံသော DBMS မဟုတ်သော်လည်းကြီးမားသောဒေတာအစုများကိုခွဲခြမ်းစိတ်ဖြာရန်နှင့်လုပ်ဆောင်ရန်အင်ဂျင်တစ်ခုအဖြစ်နေရာချသည်။ ၎င်းသည်၎င်း၏အလုပ်များနှင့် Apache Spark နှင့်နှိုင်းယှဉ်နိုင်သည်။

BlazingSQL နှင့်ကျွမ်းတဝင်မရှိသောသူများအတွက်၎င်းသည်သိသင့်သည် ဤသည်သည် RAPIDS ဂေဟစနစ်တွင်တည်ဆောက်ထားသော GPU အရှိန်မြှင့်သော SQL အင်ဂျင်ဖြစ်သည် GPUs မှ end-to-end analytics နှင့် data science pipelines များကို run ရန်အတွက် open source software စာကြည့်တိုက်များအစုတစ်ခုဖြစ်သည်။

အဖွဲ့၏အဆိုအရ ကြီးမားသောအသင်းတော်များတွင်အလုပ်လုပ်စဉ်သုံးစွဲသူများရင်ဆိုင်ရသောကုန်ကျစရိတ်၊ ရှုပ်ထွေးမှုနှင့်နှေးကွေးသောနှုန်းထားများကိုဖြေရှင်းရန် BlazingSQL ကိုဖန်တီးထားသည် အချက်အလက်များ၏။ BlazingSQL သည်ဇယားကွက်များ (ဥပမာ - မှတ်တမ်းများ၊ NetFlow စာရင်းအင်းများစသည်တို့) တွင်သိမ်းဆည်းထားသည့်ကြီးမားသောဒေတာအစု (သောင်းဂဏန်းဂစ်ဂါဘိုက်) ပေါ်တွင်တစ် ဦး ချင်းစီ၏ခွဲခြမ်းစိတ်ဖြာမေးမြန်းချက်များကိုလုပ်ဆောင်ရန်သင့်တော်သည်။

GPU နှင့်အလုပ်လုပ်ရန် RAPIDS စာကြည့်တိုက်များ ab ကိုအသုံးပြုသည်အချို့သောသူများသည် NVIDIA ၏ပါဝင်မှုဖြင့်ဖွံ့ဖြိုးပြီး၊ GPU ဘက်တွင်လုံးလုံးလျားလျားလည်ပတ်နေသော data processing နှင့် analysis applications များတည်ဆောက်ရန်ခွင့်ပြုသည် (Python interface သည်အဆင့်နိမ့် CUDA primitives နှင့် parallel တွက်ချက်မှုများကိုအသုံးပြုသည်) ။

BlazingSQL သည် API အစား SQL ကိုသုံးရန်စွမ်းရည်ကိုပေးသည် RAPIDS မှအသုံးပြုသည့် cuUDF data processing (Apache Arrow ကို အခြေခံ၍) ။ BlazingSQL သည် ထပ်မံ၍ ထပ်မံအလွှာတစ်ခုဖြစ်သည်။ ၎င်းသည် cuDF ၏ထိပ်တွင်အလုပ်လုပ်ပြီး disk မှဒေတာများကိုဖတ်ရန် cuIO စာကြည့်တိုက်ကိုအသုံးပြုသည်။

SQL queries များဖြစ်ကြသည် ဒေတာများကို GPU ပေါ်သို့တင်ရန်ခွင့်ပြုသည့် cuUDF function call များသို့ဘာသာပြန်ဆိုပါ ပေါင်းစည်းခြင်းနှင့်စစ်ထုတ်ခြင်းများကိုလုပ်ဆောင်ပါ။ ထောင်နှင့်ချီသော GPU များကိုဖြန့်ကျက်ထားသည့်ဖြန့်ဝေထားသောဖွဲ့စည်းမှုများကိုဖန်တီးနိုင်သည်။

များအသုံးပြုမှု SQL သည် RAPIDS ကိုစာရေးခြင်းပရိုဆက်ဆာများမပါဘဲရှိပြီးသားခွဲခြမ်းစိတ်ဖြာမှုစနစ်များနှင့်ပေါင်းစည်းရန်ခွင့်ပြုသည် ဒေတာများကိုအလယ်အလတ် DBMS သို့ထပ်မံတင်ပို့ခြင်းမပြုဘဲ၊ RAPIDS ၏အစိတ်အပိုင်းအားလုံးနှင့်အပြည့်အဝလိုက်ဖက်ညီအောင်ထိန်းသိမ်းခြင်း၊ ရှိပြီးသားလုပ်ဆောင်ချက်များကို SQL သို့ဘာသာပြန်ခြင်းနှင့် cuDF အဆင့်တွင်စွမ်းဆောင်ရည်သေချာစေခြင်းမရှိဘဲ။ ခွဲခြမ်းစိတ်ဖြာခြင်းနှင့်စက်သင်ကြားခြင်းလုပ်ငန်းများကိုဖြေရှင်းရန် XGBoost နှင့် cuML စာကြည့်တိုက်များနှင့်ပေါင်းစည်းရန်အထောက်အပံ့ပါဝင်သည်။

BlazingSQL ပြားချပ်ချပ်ဖိုင်များမှမေးမြန်းချက်များကို CSV နှင့် Apache Parquet ပုံစံများဖြင့်ပြုလုပ်နိုင်သည် ကွန်ယက်နှင့် HDSF နှင့် AWS S3 ကဲ့သို့သော cloud စနစ်များပေါ်တွင်တည်ရှိပြီးရလဒ်ကို GPU memory သို့တိုက်ရိုက်လွှဲပြောင်းသည်။

ပိုမိုမြန်ဆန်သော video memory ကိုအသုံးပြုခြင်းနှင့် GPU အပေါ်အပြိုင်လုပ်ဆောင်ခြင်းကြောင့် BlazingSQL ရှိစုံစမ်းမှုသည် Apache Spark ထက်အဆ ၂၀ ပိုမြန်သည်။

BlazingSQL သည်ဒေတာနှင့်အလုပ်လုပ်ရန်အလွန်ရိုးရှင်းသည် - ရာနှင့်ချီသော cuDF လုပ်ဆောင်ချက်ခေါ်ဆိုမှုများအစား၊ သင်သည် SQL query တစ်ခုတည်းဖြင့်ပြုလုပ်နိုင်သည်။

BlazingSQL ၏အမှုဆောင်အရာရှိချုပ် Rodrigo Aramburu က“ BlazingSQL သည်သုံးစွဲသူများ၏စိုးရိမ်မှုများကိုမယုံနိုင်လောက်အောင်မြန်။ ဖြန့်ဝေသော SQL GPU အင်ဂျင်နှင့်သာမကရိုးရှင်းမှုကိုစိတ်အားထက်သန်စွာအာရုံစိုက်စေသည်” ကိုနောက်ဘလော့တစ်ခုတွင်ရေးသားခဲ့သည်။ "BlazingSQL ကုဒ်လိုင်းအနည်းငယ်မျှဖြင့်သင်၏ကုန်ကြမ်းဒေတာကိုမည်သည့်နေရာတွင်ရှိနေပါစေ၊ ရှိပြီးသား RAPIDS နှင့်ခွဲခြမ်းစိတ်ဖြာမှုဆိုင်ရာအစုအဖွဲ့နှင့်အပြန်အလှန်ဆက်သွယ်နိုင်သည်။ "

BlazingSQL သည်အသုံးပြုသူများအနေဖြင့် GPU DataFrame (GDF) အနေဖြင့် GPU မှတ်ဉာဏ်တွင်ရှိသောစီးပွားရေးအချက်အလက်များအိုင်အိုင်အချက်အလက်များကိုတိုက်ရိုက်မေးမြန်းနိုင်သည်။ GDF သည် GPU application များအကြားအပြန်အလှန်အသုံးပြုနိုင်စွမ်းကိုထောက်ပံ့ပေးသောစီမံကိန်းဖြစ်သည်။ ၎င်းသည်ယေဘူယျ GPU memory data layer ကိုလည်းသတ်မှတ်သည်။

Apache Arrow ကို GPU များပေါ် မူတည်၍ Dask နှင့်ပေါင်းခြင်းအားဖြင့် BlazingSQL သည် open source လုပ်ဆောင်ချက်ကိုတိုးချဲ့ပြီးလျင်မြန်စွာရွေ့လျားနေသော data သိပ္ပံဂေဟစနစ်တွင်အပြန်အလှန်အကျိုးပြုနိုင်သည့်လှိုင်းကိုထုတ်ပေးလိမ့်မည်။

စိတ်ဝင်စားသူများအဘို့ထိုသိသင့်ပါတယ် ကုဒ်ကိုအသုံးပြုသူများအတွက် Python Interface ဖြင့် C ++ ဖြင့်ရေးသားသည် Open source သည် Apache 2.0 လိုင်စင်အောက်တွင်ရှိသည်။

ဒီဟာ link ပါ


ဆောင်းပါး၏ပါ ၀ င်မှုသည်ကျွန်ုပ်တို့၏အခြေခံမူများကိုလိုက်နာသည် အယ်ဒီတာအဖွဲ့ကျင့်ဝတ်။ အမှားတစ်ခုကိုသတင်းပို့ရန်ကလစ်နှိပ်ပါ ဒီမှာ.

မှတ်ချက်ပေးရန်ပထမဦးဆုံးဖြစ်

သင်၏ထင်မြင်ချက်ကိုချန်ထားပါ

သင့်အီးမေးလ်လိပ်စာပုံနှိပ်ထုတ်ဝေမည်မဟုတ်ပါ။

*

*

  1. အချက်အလက်အတွက်တာဝန်ရှိသည် - Miguel ÁngelGatón
  2. အချက်အလက်များ၏ရည်ရွယ်ချက်: ထိန်းချုပ်ခြင်း SPAM, မှတ်ချက်စီမံခန့်ခွဲမှု။
  3. တရားဝင်: သင်၏ခွင့်ပြုချက်
  4. အချက်အလက်များ၏ဆက်သွယ်မှု - ဒေတာများကိုဥပဒေအရတာ ၀ န်ယူမှုမှ လွဲ၍ တတိယပါတီများသို့ဆက်သွယ်မည်မဟုတ်ပါ။
  5. ဒေတာသိမ်းဆည်းခြင်း: Occentus ကွန်ယက်များ (အီးယူ) မှလက်ခံသည့်ဒေတာဘေ့စ
  6. အခွင့်အရေး - မည်သည့်အချိန်တွင်မဆိုသင်၏အချက်အလက်များကိုကန့်သတ်၊