PoCL 5.0 hadir dengan backend baru, peningkatan, dan banyak lagi

PoCL

PoCL adalah implementasi standar OpenCL yang efisien

Hal itu diumumkan beberapa hari yang lalu rilis versi baru PoCL 5.0 dan di antara fitur-fitur baru utama yang dihadirkan versi baru backend baru menonjol memungkinkan unduh perintah OpenCL melalui jaringan ke satu atau lebih server, juga menyoroti peningkatan untuk CUDA, peningkatan dukungan, dan banyak lagi.

Bagi mereka yang tidak terbiasa dengan PoCL, Anda harus tahu apa itu PoCL implementasi open source portabel (dilisensikan oleh MIT) dari standar OpenC,Selain menjadi implementasi OpenCL open source multi-perangkat mudah dibawa-bawa. Tujuan utama dari proyek ini adalah untuk meningkatkan interoperabilitas keragaman perangkat yang kompatibel dengan OpenCL dengan mengintegrasikannya ke dalam satu platform tunggal yang diatur secara terpusat.

Selain itu, salah satu tujuan utama jangka panjang adalah meningkatkan portabilitas kinerja program OpenCL pada jenis perangkat yang menggunakan teknik runtime dan kompilasi.

Fitur baru utama PoCL 5.0

Dalam versi baru PoCL 5.0 yang dihadirkan, seperti disebutkan di awal, hal baru yang paling penting adalah backend baru “PoCL-Remote” yang dirancang untuk mengunduh perintah OpenCL melalui jaringan ke satu atau lebih server yang menjalankan daemon 'pocld', disertakan dengan PoCL. Dengan mengaktifkan dukungan untuk OpenCL pada sistem jaringan lain, PoCL-Remote memungkinkan Anda menggunakan OpenCL dengan lancar pada host jarak jauh tersebut.

Disebutkan itu tidak seperti solusinya Solusi pengunduhan jaringan yang ada untuk OpenCL, PoCL-Remote menggunakan infrastruktur manajemen memori oleh PoCL untuk melacak objek memori dan salin saja ketika itu benar-benar diperlukan. Ketika migrasi objek memori diperlukan, jalur transfer yang paling efisien akan dipilih secara otomatis.

Hal baru lainnya yang menghadirkan versi baru PoCL 5.0, adalah menambahkan fitur baru driver NVIDIA CUDA untuk memberikan dukungan parsial untuk OpenCL 3.0 Pengemudi CUDA telah diperluas dengan fungsi-fungsi baru untuk mendukung fitur opsional OpenCL 3.0, beberapa ekstensi penting untuk mengoptimalkan eksekusi pada chipStar, serta penambahan operasi atom OpenCL 2.x/3.x.

Peningkatan dukungan mencakup dukungan untuk butiran halus SVM, ketika perangkat CUDA kompatibel, serta pengenalan dukungan awal untuk subkelompok: intel_sub_group_shuffle, intel_sub_group_shuffle_xor, get_sub_group_local_id, sub_group_barrier, sub_group_ballot.

Selain itu, dalam versi ini, Peningkatan dukungan untuk CPU RISC-V. PoCL dulu diuji pada Starfive VisionFive 2 menggunakan image Ubuntu 23.10 yang sudah diinstal sebelumnya. Dengan LLVM 17 dan GCC 13.2, 98% pengujian berhasil dilewati (hanya 4 pengujian dari 253 pengujian yang gagal).

Dari perubahan lainnya yang menonjol dari versi baru ini:

  • Banyak perbaikan tambahan diterapkan pada pengontrol CPU, terutama didorong oleh kebutuhan chipStar.
  • Implementasi cl_ext_float_atomics dengan dukungan untuk FP32 dan FP64.
  • Implementasi cl_khr_command_buffer diperbarui ke versi 0.9.4.
    Backend FPGA eksperimental terintegrasi ke dalam perpustakaan kernel.
  • Backend AlmaIF eksperimental untuk FPGA telah diusulkan yang memungkinkan konfigurasi ulang FPGA secara transparan dari vendor berbeda menggunakan database bitstream. Pekerjaan ini adalah bagian dari penelitian yang sedang berlangsung dan dapat dianggap sebagai kemajuan yang signifikan. Basis data dengan bitstream dihasilkan oleh proyek AFOCL.
  • Menghapus dukungan yang tidak lengkap untuk rendering perantara dari shader SPIR 1.x/2.0. SPIR-V dinyatakan sebagai bahasa arsiran perantara yang direkomendasikan.
  • Aktifkan dukungan untuk FP16 dan ruang alamat umum menggunakan entri SPIR-V.
  • Menambahkan dukungan untuk Dentang/LLVM 17.0.
  • Implementasi cl_ext_float_atomics (pada FP32 + FP64) saat menggunakan LLVM 17.
  • Dukungan untuk Dentang/LLVM 10-13 sudah tidak digunakan lagi.

Akhirnya, harus disebutkan bahwa PoCL-Remote dianggap siap untuk pengujian di luar laboratorium, karena telah resmi terintegrasi dalam versi baru 5.0 ini. Jika Anda tertarik untuk mempelajarinya lebih lanjut, Anda dapat berkonsultasi dengan detailnya di tautan berikut.

untuk tertarik dengan proyek tersebut, Anda harus tahu bahwa kode proyek didistribusikan di bawah lisensi MIT dan pekerjaan didukung pada platform X86_64, MIPS32, ARM v7, AMD HSA APU dan berbagai prosesor TTA khusus dengan arsitektur VLIW.


tinggalkan Komentar Anda

Alamat email Anda tidak akan dipublikasikan. Bidang yang harus diisi ditandai dengan *

*

*

  1. Penanggung jawab data: Miguel Ángel Gatón
  2. Tujuan data: Mengontrol SPAM, manajemen komentar.
  3. Legitimasi: Persetujuan Anda
  4. Komunikasi data: Data tidak akan dikomunikasikan kepada pihak ketiga kecuali dengan kewajiban hukum.
  5. Penyimpanan data: Basis data dihosting oleh Occentus Networks (UE)
  6. Hak: Anda dapat membatasi, memulihkan, dan menghapus informasi Anda kapan saja.