PoCL 5.0 yeni bir arka uç, iyileştirmeler ve daha fazlasıyla geliyor

PoCL

PoCL, OpenCL standardının etkili bir uygulamasıdır

Birkaç gün önce açıklandı PoCL 5.0'ın yeni sürümünün piyasaya sürülmesi ve yeni sürümün sunduğu başlıca yeni özellikler arasında yeni bir arka uç öne çıkıyor izin OpenCL komutlarını ağ üzerinden indirme bir veya daha fazla sunucuya yönelik bilgiler, ayrıca CUDA iyileştirmeleri, destek iyileştirmeleri ve daha fazlası vurgulanıyor.

PoCL'ye aşina olmayanlar için ne olduğunu bilmelisiniz taşınabilir bir açık kaynak uygulaması (MIT tarafından lisanslanmıştır) OpenC standardının,Çok cihazlı açık kaynaklı bir OpenCL uygulaması olmasının yanı sıra kolayca taşınabilir. Bu projenin temel amacı, OpenCL uyumlu cihazların çeşitliliğinin birlikte çalışabilirliğini, bunları merkezi olarak yönetilen tek bir platforma entegre ederek geliştirmektir.

Ek olarak, uzun vadeli temel hedeflerden biri, çalışma zamanı ve derleme tekniklerini kullanan cihaz türleri üzerindeki OpenCL programlarının performans taşınabilirliğini geliştirmektir.

PoCL 5.0'nın başlıca yeni özellikleri

PoCL 5.0'ın sunulan bu yeni versiyonunda, başta da belirttiğimiz gibi en önemli yenilik var: yeni arka uç “PoCL-Remote” Hangisi tasarlandı OpenCL komutlarını ağ üzerinden indirmek için bir veya daha fazla sunucuya 'pocld' arka plan programını çalıştıran, PoCL'ye dahildir. PoCL-Remote, diğer ağ bağlantılı sistemlerde OpenCL desteğini etkinleştirerek bu uzak ana bilgisayarlarda OpenCL'i sorunsuz bir şekilde kullanmanıza olanak tanır.

Bundan bahsediliyor çözümlerden farklı olarak OpenCL, PoCL-Remote için mevcut ağ indirme çözümleri bellek yönetimi altyapısını kullanır PoCL tarafından izlemek için bellek nesnelerini seçin ve bunları kopyalayın gerçekten gerekli olduğunda. Bellek nesnelerinin taşınması gerektiğinde aktarım için en etkili yol otomatik olarak seçilir.

Başka bir yenilik PoCL 5.0'ın yeni versiyonunu sunan NVIDIA CUDA sürücüsünün yeni özellikleri eklendi OpenCL 3.0 için kısmi destek sağlamak için Sürücü CUDA yeni işlevlerle genişletildi OpenCL 3.0'ın isteğe bağlı özelliklerini desteklemek için, chipStar'da yürütmeyi optimize etmek için çeşitli temel uzantıların yanı sıra OpenCL 2.x/3.x atomik işlemlerinin eklenmesi.

Destek iyileştirmeleri arasında CUDA cihazı uyumlu olduğunda SVM Kaba taneli ince taneli desteği ve ayrıca alt gruplar için ilk desteğin başlatılması: intel_sub_group_shuffle, intel_sub_group_shuffle_xor, get_sub_group_local_id, sub_group_barrier, sub_group_ballot.

Buna ek olarak, bu sürümde, RISC-V CPU'ları için geliştirilmiş destek. PoCL şuydu: Starfive VisionFive 2'de test edildi önceden yüklenmiş bir Ubuntu 23.10 görüntüsünü kullanarak. LLVM 17 ve GCC 13.2 ile testlerin %98'i geçildi (4 testten yalnızca 253'ü başarısız oldu).

Diğer değişikliklerden bu yeni sürümden öne çıkan:

  • CPU kontrolörüne öncelikle chipStar'ın ihtiyaçları doğrultusunda çok sayıda ek iyileştirme uygulandı.
  • FP32 ve FP64 desteğiyle cl_ext_float_atomics'in uygulanması.
  • cl_khr_command_buffer uygulaması 0.9.4 sürümüne güncellendi.
    Deneysel FPGA arka ucu çekirdek kitaplığına entegre edilmiştir.
  • FPGA'ler için deneysel bir AlmaIF arka ucu önerilmiştir; bu, bir bit akışı veritabanı kullanılarak farklı satıcılardan gelen FPGA'lerin şeffaf bir şekilde yeniden yapılandırılmasına olanak tanır. Bu çalışma devam eden araştırmanın bir parçasıdır ve önemli bir ilerleme olarak kabul edilebilir. Bit akışlarını içeren veritabanı AFOCL projesi tarafından oluşturulur.
  • SPIR 1.x/2.0 gölgelendiricilerden ara işleme için eksik destek kaldırıldı. SPIR-V, önerilen ara gölgelendirme dili olarak bildirildi.
  • SPIR-V girişini kullanarak FP16 ve genel adres alanı desteğini etkinleştirin.
  • Clang/LLVM 17.0 desteği eklendi.
  • LLVM 32 kullanılırken cl_ext_float_atomics'in (FP64 + FP17'te) uygulanması.
  • Clang/LLVM 10-13 desteği kullanımdan kaldırıldı.

Son olarak belirtilmelidir ki PoCL-Remote'un laboratuvar dışında teste hazır olduğu kabul edilir, çünkü resmi olarak bu yeni sürüm 5.0'a entegre edilmiştir. Bu konuda daha fazla bilgi edinmek istiyorsanız, başvurabilirsiniz. ayrıntılar aşağıdaki bağlantıda.

Için projeyle ilgilenen, Proje kodunun MIT lisansı altında dağıtıldığını ve çalışmanın X86_64, MIPS32, ARM v7, AMD HSA APU platformları ve VLIW mimarisine sahip çeşitli özel TTA işlemciler üzerinde desteklendiğini bilmelisiniz.


Yorumunuzu bırakın

E-posta hesabınız yayınlanmayacak. Gerekli alanlar ile işaretlenmiştir *

*

*

  1. Verilerden sorumlu: Miguel Ángel Gatón
  2. Verilerin amacı: Kontrol SPAM, yorum yönetimi.
  3. Meşruiyet: Onayınız
  4. Verilerin iletilmesi: Veriler, yasal zorunluluk dışında üçüncü kişilere iletilmeyecektir.
  5. Veri depolama: Occentus Networks (AB) tarafından barındırılan veritabanı
  6. Haklar: Bilgilerinizi istediğiniz zaman sınırlayabilir, kurtarabilir ve silebilirsiniz.