Databricks විසින් Delta Lake සහ MLflow සඳහා කේතය නිකුත් කරන ලදී

දත්ත + AI සමුළුව අතරතුර Databricks එළිදක්වන ලදී දැන්වීමක් හරහා, සමස්ත ඩෙල්ටා ලේක් ගබඩා රාමුව නිදහස් කරනු ඇත ලිනක්ස් පදනමේ අධීක්ෂණය යටතේ විවෘත මූලාශ්‍රය.

එය සඳහන් කිරීම වටී ඩෙල්ටා ලේක් 2019 ඔක්තෝබර් මාසයේ සිට ලිනක්ස් පදනමේ ව්‍යාපෘතියකි සහ එය එකම වහලක් යටින් ඇති හොඳම දත්ත ගබඩා සහ දත්ත විල් වන "ලේක් ආර්කිටෙක්චර්ස්" හරහා දත්ත විල් වෙත විශ්වසනීයත්වය සහ කාර්ය සාධනය ගෙන එන විවෘත ගබඩා ස්ථරයයි.

පසුගිය වසර තුන තුළ ලේක්හවුස්, දත්තවල සිට ඉගෙනුම් යන්ත්‍ර සංවර්ධනය දක්වා විශ්ලේෂණවල සිට අවම සංකීර්ණතාවයකින් සහ අනුපිටපත් නොමැතිව එකම දත්ත මත විවිධ වැඩ බර ක්‍රියාත්මක කිරීමට නම්‍යශීලී වීමට අවශ්‍ය දත්ත ඉංජිනේරුවන්, විශ්ලේෂකයින් සහ දත්ත විද්‍යාඥයින් සඳහා ආකර්ශනීය විසඳුමක් බවට පත්ව ඇත. . ඩෙල්ටා ලේක් යනු ලොව වැඩිපුරම භාවිතා වන ලේක් හවුස් ආකෘතිය වන අතර දැනට මසකට බාගත කිරීම් මිලියන 7කට වඩා වැඩි ප්‍රමාණයක් (සහ වර්ධනය වේ) දකියි.

“ආරම්භයේ සිටම, Databricks විවෘත ප්‍රමිතීන් සහ විවෘත මූලාශ්‍ර ප්‍රජාව සඳහා කැපවී සිටී. අපි නවීන විවෘත මූලාශ්‍ර තාක්‍ෂණයේ වඩාත්ම බලගතු නවෝත්පාදනයන් නිර්මාණය කර, දායක වී, වර්ධනය පෝෂණය කර ඇත, ”අලි ගෝඩ්ස් පැවසීය.

ඒ කියන්නේ ඩෙල්ටා ලේක් සන්නාමය වන Databricks සහ විවෘත මූලාශ්‍ර අනුවාදය අතර තවදුරටත් ක්‍රියාකාරී වෙනස්කම් ඇති නොවේ. සමාගම පැවසුවේ MLflow යන්ත්‍ර ඉගෙනුම් මෙහෙයුම් වේදිකාවට සහ විවෘත මූලාශ්‍ර Apache Spark විශ්ලේෂණ රාමුව වෙත එහි මෑත කාලීන වැඩිදියුණු කිරීම් නිකුත් කරන බවයි. Databricks විසින් එහි ප්‍රධාන ලේක්හවුස් දත්ත විලට නව විශේෂාංග කිහිපයක් ද ඉදිරිපත් කර ඇත.

“ඩෙල්ටා විලට පෙර, ස්පාර්ක් වැනි තාක්ෂණයන් විශාල දත්ත ප්‍රමාණයක් සකසන ලදී; ඩෙල්ටා ලේක් ඔබට ඉතිහාසයේ ගබඩා කර ඇති සියලුම වෙනස්කම් සමඟින් කුඩා ඩෙල්ටා සැකසීමට ඉඩ සලසයි, එවිට ඔබට එහාට මෙහාට යා හැකිය. "මෙය විගණන මංපෙත් සහ අනුකූලතාවය සඳහා වැදගත් වේ, එබැවින් ඔබට ආපසු ගොස් වසරකට පෙර ඔබ ගත් තීරණ සොයා ගත හැක."

ඊට අමතරව, එය සටහන් කළ යුතුය ඩෙල්ටා ලේක් හි නව අනුවාදය 2.0 වඩා හොඳ විමසුම් කාර්ය සාධනයක් දක්වයි සහ විවෘත ප්රමිතීන් මත පදනම් වූ පදනමක්. මුදා හැරීමේ අපේක්ෂකයා දැන් ලබා ගත හැකි අතර මෙම වසර අගදී සාමාන්‍ය නිකුතුවකට යාමට අපේක්ෂා කෙරේ.

ඩේටාබ්‍රික්ස් කිව්වා යාවත්කාලීන කිරීම සංවර්ධකයින් 6400 කට අධික සංඛ්‍යාවකගේ දායකත්වය පිළිබිඹු කරයි සහ පසුගිය වසරට වඩා 95% ක කැපවීමකට සාමාන්‍ය කේත රේඛා සංඛ්‍යාව වැඩිවීමත් සමඟ මුළු කැපවීම් 900% කින් වර්ධනය වී ඇති බව සඳහන් කළේය.

සමාගම MLflow හි 2.0 අනුවාදය ද නිවේදනය කරයි, යන්ත්‍ර ඉගෙනුම් ව්‍යාපෘති කළමනාකරණය කිරීමට වේදිකාවක්. දියත් කිරීම යන්ත්‍ර ඉගෙනුම් ආකෘති යෙදවීම් වේගවත් කිරීමට සහ සරල කිරීමට නව විශේෂාංගයක් වන නල මාර්ග ඇතුළත් වේ. නිෂ්පාදන ඉංජිනේරුවන්ගේ මැදිහත් වීමක් අවශ්‍ය නොවී වේගවත් හා විශ්වාසදායක ආකෘති සංවර්ධනයක් සක්‍රීය කිරීම සඳහා නල මාර්ග දත්ත විද්‍යාඥයින්ට ඔවුන් ගොඩනඟන මාදිලියේ වර්ගය මත පදනම්ව පූර්ව නිශ්චිත, නිෂ්පාදනයට සූදානම් සැකිලි සපයයි.

පරිශීලකයින්ට වින්‍යාස ගොනුවක නල මූලද්‍රව්‍ය නිර්වචනය කළ හැකි අතර MLflow Pipelines ක්‍රියාත්මක කිරීම ස්වයංක්‍රීයව කළමනාකරණය කරන බව සමාගම පවසයි. Databricks විසින් නිෂ්පාදන ආකෘති සත්කාරකත්වය සඳහා සෘජුවම සහාය වීම සඳහා සේවාදායක රහිත ආකෘති පර්යන්ත ද, කණ්ඩායම්වලට සැබෑ ලෝකයේ ආකෘති කාර්ය සාධනය විශ්ලේෂණය කිරීමට උපකාර කිරීම සඳහා ගොඩනඟන ලද ආකෘති නිරීක්ෂණ උපකරණ පුවරු ද එක් කර ඇත.

“ඩෙල්ටා ලේක් ව්‍යාපෘතිය සංවර්ධක ප්‍රජාවට ව්‍යාපෘතියේ කොටසක් වීමට අවශ්‍ය බව පෙන්නුම් කරන අතිවිශිෂ්ට ක්‍රියාකාරකම් සහ වර්ධන ප්‍රවණතා අත්විඳිමින් සිටී. දායකයින්ගේ ශක්තිය පසුගිය වසරට වඩා 60% කින් වැඩි වී ඇති අතර සම්පූර්ණ කැපවීම්වල වර්ධනය 95% කින් වැඩි වී ඇති අතර එක් කැපවීමකට සාමාන්‍ය කේත රේඛාව 900% කින් වැඩි වී ඇත. Uber Technologies, Walmart, සහ CloudBees, Inc., වැනි දායක ආයතනවලින් මෙම ඉහළ ප්‍රවේගය අපි දකිමු. - ලිනක්ස් පදනමේ විධායක අධ්‍යක්ෂ, ජිම් සෙම්ලින්.

ඔබ නම් වැඩි විස්තර දැන ගැනීමට උනන්දු වෙයි ඒ ගැන, ඔබට විස්තර පරීක්ෂා කළ හැකිය පහත සබැඳියේ.


ලිපියේ අන්තර්ගතය අපගේ මූලධර්මවලට අනුකූල වේ කතුවැකි ආචාර ධර්ම. දෝෂයක් වාර්තා කිරීමට ක්ලික් කරන්න මෙන්න.

අදහස් පළ කිරීමට ප්රථම වන්න

ඔබේ අදහස තබන්න

ඔබේ ඊ-මේල් ලිපිනය පළ කරනු නොලැබේ. අවශ්ය ක්ෂේත්ර දක්වා ඇති ලකුණ *

*

*

  1. දත්ත සඳහා වගකිව යුතු: මිගෙල් ඇන්ජල් ගැටන්
  2. දත්තවල අරමුණ: SPAM පාලනය කිරීම, අදහස් කළමනාකරණය.
  3. නීත්‍යානුකූලභාවය: ඔබේ කැමැත්ත
  4. දත්ත සන්නිවේදනය: නෛතික බැඳීමකින් හැර දත්ත තෙවන පාර්ශවයකට සන්නිවේදනය නොකෙරේ.
  5. දත්ත ගබඩා කිරීම: ඔක්සෙන්ටස් නෙට්වර්ක්ස් (EU) විසින් සත්කාරකත්වය දක්වන දත්ත සමුදාය
  6. අයිතිවාසිකම්: ඕනෑම වේලාවක ඔබට ඔබේ තොරතුරු සීමා කිරීමට, නැවත ලබා ගැනීමට සහ මකා දැමීමට හැකිය.