Radeon Open Compute “ROCm” Stack v3.1 Släppt med RAS för Vega 7nm, SLURM-stöd för bättre resurshantering, men Navi saknas fortfarande

Radeon Open Compute eller ”ROCm” stack ny version är nu tillgänglig för nedladdning. Radeon Open Compute v3.1 har med sig en hel del funktioner, men konstigt saknas fortfarande stöd för AMD Navi och GFX10.

ROCm, den mest accepterade universella plattformen för GPU-accelererad databehandling, finns nu på version 3.1. Den senaste uppdateringen av den modulära plattformen som gör det möjligt för maskinvaruleverantörer att bygga drivrutiner som stöder ROCm-ramverket innehåller några mycket efterlängtade funktioner som RAS-stöd för 7nm Vega och SLURM-stöd för AMD-grafikprocessorer. Men av ännu okända skäl har ROCm fortfarande inte fullständigt stöd för nästa generations AMD Navi Architecture.

Vad är nytt i Radeon ROCm v3.1:

Den största och mest uppenbara förändringen i den nya installationen av Radeon ROCm v3.1 är i ROCm Installation Directory Structure. En ny installation av ROCm-verktygslådan installerar paketen i/ opt / rocm- mapp. Tidigare installerades ROCm-verktygspaketpaket i/ opt / rocm mapp.

Den nya versionen av ROCm har förbättrat RAS-stöd (Reliability, Accessibility and Serviceability) för Vega 7nm GPU: er. Det här 7nm Vega-arbetet är förmodligen under mikroskopet fortfarande för Vegabaserad “Arcturus” beräkningsaccelerator kommer i år. Stödet inkluderar:

  • UMC RAS ​​- HBM ECC (okorrigerbar felinjektion), sida pension, RAS återställning via GPU (BACO) återställning
  • GFX RAS - GFX, MMHUB ECC (okorrigerbar felinjektion), RAS-återställning via GPU (BACO) återställning
  • PCIE RAS - PCIE_BIF ECC (okorrigerbar felinjektion), återställning av RAS via GPU (BACO)

Radeon ROCm v3.1 får också SLURM-stöd för AMD-grafikprocessorer. SLURM eller Simple Linux Utility for Resource Management är ett av de mycket föredragna och lättanvända klusterhanterings- och jobbschemaläggningssystemet för Linux-kluster. SLURM är att föredra på grund av att den är öppen källkod, feltolerant och mycket skalbar.

Detta system kan nu interagera bra med AMD GPU: er. Den senaste versionen 20.02.0 av SLURM innehåller AMD-plugins som gör det möjligt för SLURM att upptäcka och konfigurera AMD GPU: er automatiskt. Den samlar också in och rapporterar energiförbrukningen för grafikchips. SLURM-stödet är ett användbart tillskott med tanke på det ökande antalet superdatorer som använder Radeon GPU: er och andra större AMD GPU-kluster.

Trots införandet av flera funktioner finns det fortfarande inga tecken på GFX10 / Navi-stöd i ROCm. GitHub-sidan för ROCm har uppdaterats för att återspegla alla ändringar, installationsanmärkningar och kända problem.

Facebook Twitter Google Plus Pinterest