728x90
apex
2

[Linux] APEX Install

apex를 install하기 전 확인해야할 것은 /usr/local/에 있는 CUDA 버전과 cudatoolkit 버전과 동일해야한다는 것이다. (cudatoolkit이 없을 경우 10.2라고 생각하면 됨) 만약 CUDA 버전을 다른 버전으로 install 해야한다면 CUDA Install를 보고 진행하면 된다. 버전을 동일하게 맞춰주었다면 이후부터는 apex github에 나와있듯이 다음과 같이 입력하여 install하면 된다. * pytorch 1.9.0까지 지원하는 듯 하다. * NVIDIA Driver는 설치할 CUDA 버전 이상의 버전이 설치되어있어야한다. git clone https://github.com/NVIDIA/apex cd apex pip install -v --disable-pip-..

Temp 2022.08.01

[Optimization] APEX ASP (Automatic SParsity)

ASP는 모델의 학습, 추론 속도를 높이고 메모리 효율과 accuracy를 유지하는 것이 목적, 이를 위해 weight를 saprse하게 연산할 수 있게 하는 mask를 구하는 방식이다. NVIDIA ampere gpu 에서는 2:4 fine grained sparsity가 지원되어있다. 이 방식으로 pruning을 지원하다. 2:4 fine grained sparsity는 아래 그림을 확인하면 간단하게 이해할 수 있다. 2:4 fine grained sparsity는 위 그림과 같이 1D 또는 2D (2D도 가능하다)에서 작은 값 2개를 탈락시키는 방식으로 동작한다. 이렇게 생선된 마스크를 사용해서 weight는 이렇게 pruned 되어있는 살이있는 value들만 모아서 아래 그림의 오른쪽 Sparse..

Deep Learning 2022.07.30
728x90