কয়েকদিন আগে, গবেষকদের একটি দল এই প্রযুক্তির উন্নয়ন সম্পর্কে তথ্য প্রকাশ করেছে প্রথম রোহ্যামার আক্রমণ Que সফলভাবে নির্দেশিত হয়েছে la GDDR6 ভিডিও মেমরি একটি GPU, বিশেষ করে একটি NVIDIA A6000।
কৌশল, GPUHammer নামে পরিচিত, GPU-এর DRAM-এর পৃথক বিটগুলিকে ম্যানিপুলেট করার অনুমতি দেয়, মেশিন লার্নিং মডেলগুলির প্যারামিটারগুলির একটি মাত্র বিট পরিবর্তন করে তাদের নির্ভুলতাকে মারাত্মকভাবে হ্রাস করে। এই বিট ফ্লিপগুলি একজন ক্ষতিকারক GPU ব্যবহারকারীকে ভাগ করা, সময়-স্লাইসড পরিবেশে অন্য ব্যবহারকারীর GPU ডেটা ম্যানিপুলেট করার অনুমতি দেয়।
এখন পর্যন্ত, ভিডিও স্মৃতিতে রোহ্যামার প্রয়োগ করা অবাস্তব বলে বিবেচিত হত বেশ কিছু প্রযুক্তিগত সীমাবদ্ধতার কারণে। GDDR চিপগুলিতে মেমরি কোষের ভৌত বিন্যাস ম্যাপ করা কঠিন, অ্যাক্সেস ল্যাটেন্সিগুলি প্রচলিত DRAM-এর তুলনায় চারগুণ পর্যন্ত ধীর এবং রিফ্রেশ রেট উল্লেখযোগ্যভাবে বেশি। এর সাথে যুক্ত হয়েছে অকাল চার্জ ক্ষতির বিরুদ্ধে মালিকানাধীন সুরক্ষা ব্যবস্থা, যার বিপরীত প্রকৌশলের জন্য বিশেষ সরঞ্জামের প্রয়োজন।
এই বাধাগুলি অতিক্রম করতে, গবেষকরা GDDR DRAM-কে লক্ষ্য করে একটি নতুন রিভার্স ইঞ্জিনিয়ারিং কৌশল তৈরি করেছেননিম্ন-স্তরের CUDA কোড ব্যবহার করে, তারা নির্দিষ্ট অপ্টিমাইজেশনের মাধ্যমে আক্রমণটি কার্যকর করেছিল যা নির্দিষ্ট মেমরি কোষগুলিতে অ্যাক্সেসকে তীব্র করে তোলে, বিট ম্যানিপুলেশনের জন্য অনুকূল পরিস্থিতি তৈরি করে। সাফল্যের চাবিকাঠি অত্যন্ত সুসংগঠিত সমান্তরাল কম্পিউটিং অর্জনের মধ্যে নিহিত, যা সংলগ্ন কোষগুলিতে চাপের পরিবর্ধক হিসাবে কাজ করে।
আক্রমণ কিভাবে কাজ করে?
আক্রমণ DRAM-এর শারীরিক দুর্বলতা কাজে লাগায়, যেখানে মেমোরি সারিতে নিবিড় অ্যাক্সেস (যা "হাতুড়ি মারা" নামে পরিচিত) সংলগ্ন সারিতে পরিবর্তন আনতে পারেযদিও এই দুর্বলতাটি ২০১৪ সালে চিহ্নিত করা হয়েছিল এবং CPU DDR মেমোরিতে ব্যাপকভাবে অধ্যয়ন করা হয়েছিল, তবুও এটিকে GPU-তে পোর্ট করা এখন পর্যন্ত একটি চ্যালেঞ্জ হয়ে দাঁড়িয়েছে কারণ:
- GDDR6 এর উচ্চ অ্যাক্সেস ল্যাটেন্সি (DDR4 এর চেয়ে 4 গুণ বেশি)।
- মেমরির ভৌত বরাদ্দের জটিলতা।
- TRR-এর মতো মালিকানাধীন এবং দুর্বলভাবে নথিভুক্ত প্রশমনের উপস্থিতি।
রোহ্যামার হলো একটি হার্ডওয়্যার দুর্বলতা যেখানে মেমোরির একটি সারি দ্রুত সক্রিয় করার ফলে পাশের সারিগুলিতে বিট ফ্লিপ দেখা দেয়। ২০১৪ সাল থেকে, এই দুর্বলতাটি CPU এবং CPU-ভিত্তিক মেমোরি যেমন DDR2014, DDR3, এবং LPDDR4-তে ব্যাপকভাবে অধ্যয়ন করা হয়েছে। যাইহোক, যেহেতু গুরুত্বপূর্ণ AI এবং মেশিন লার্নিং ওয়ার্কলোড এখন ক্লাউডে বিচ্ছিন্ন GPU-তে চলে, তাই রোহ্যামার আক্রমণের জন্য GPU মেমোরির দুর্বলতা মূল্যায়ন করা অত্যন্ত গুরুত্বপূর্ণ।
এই বাধা সত্ত্বেও, গবেষকরা বিপরীত প্রকৌশল প্রয়োগ করতে সক্ষম হয়েছেন CUDA-তে ভার্চুয়াল/ফিজিক্যাল মেমরি বরাদ্দের উপর, তারা নির্দিষ্ট DRAM মেমোরি ব্যাংক সনাক্ত করার জন্য একটি পদ্ধতি তৈরি করেছে এবং একাধিক থ্রেড এবং ওয়ার্প ব্যবহার করে সমান্তরাল অ্যাক্সেস অপ্টিমাইজ করা হয়েছে, অতিরিক্ত বিলম্ব ছাড়াই হ্যামারিং রেট সর্বাধিক করা হয়েছে।
ধারণার প্রমাণ দেখিয়েছে যে কীভাবে একটি একক-বিট ফ্লিপ ইন ডিপ নিউরাল নেটওয়ার্ক (DNN) মডেলের ওজন, বিশেষ করে FP16 এক্সপোনেন্টে, ইমেজনেটে চিত্র শ্রেণিবদ্ধকরণ মডেলের শীর্ষ-1 নির্ভুলতা 80% থেকে 0,1% এ হ্রাস করতে পারে। এই আবিষ্কারটি GPU-এর সাথে ভাগ করা পরিবেশে AI ওয়ার্কলোড পরিচালনাকারী ডেটা সেন্টার এবং ক্লাউড পরিষেবাগুলির জন্য উদ্বেগজনক।
প্রশমন এবং সীমাবদ্ধতা
NVIDIA দুর্বলতা নিশ্চিত করেছে এবং ECC সমর্থন সক্ষম করার সুপারিশ করেছে। (ত্রুটি-সংশোধন কোড) nvidia-smi -e 1 কমান্ড ব্যবহার করে। যদিও এই পরিমাপ ত্রুটি সংশোধন করতে পারে একক-বিট, এর অর্থ হল ১০% পর্যন্ত কর্মক্ষমতা হ্রাস। এবং উপলব্ধ মেমোরিতে 6,25% হ্রাস। এটি ভবিষ্যতে একাধিক বিট ফ্লিপের আক্রমণ থেকেও সুরক্ষা দেয় না।
আমরা GDDR6000 মেমোরি সহ NVIDIA A6 GPU-তে Rowhammer বিট ওঠানামা নিশ্চিত করেছি। RTX 6-এর মতো অন্যান্য GDDR3080 GPU-তে আমাদের পরীক্ষায় কোনও বিট ওঠানামা দেখা যায়নি, সম্ভবত DRAM বিক্রেতার তারতম্য, চিপের বৈশিষ্ট্য বা তাপমাত্রার মতো অপারেটিং অবস্থার কারণে। HBM মেমোরি সহ A100 GPU-তেও আমরা কোনও ওঠানামা লক্ষ্য করিনি।
দলটি তুলে ধরেছে যে GPUHammer বর্তমানে শুধুমাত্র GDDR6000 সহ A6 GPU-তে যাচাই করা হয়েছে।, এবং A100 (HBM) বা RTX 3080 এর মতো মডেলগুলিতে নয়। তবে, যেহেতু এটি একটি এক্সটেনসিবল আক্রমণ, তাই অন্যান্য গবেষকদের বিভিন্ন GPU আর্কিটেকচার এবং মডেলগুলিতে বিশ্লেষণটি প্রতিলিপি এবং প্রসারিত করার জন্য উৎসাহিত করা হচ্ছে।
পরিশেষে, আপনি যদি এটি সম্পর্কে আরও জানতে আগ্রহী হন, আপনি বিশদ বিবরণের সাথে পরামর্শ করতে পারেন নিম্নলিখিত লিঙ্ক.