본문 바로가기
Development/etc

[Nvidia Driver] NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running

by shuka 2022. 7. 12.
728x90
728x90

Nvidia Driver 설치시 문제

 

A100에서 nvidia driver를 설치f 완료하고 드라이버 확인을 위해 nvidia-smi를 치면 다음과 같은 오류가 발생할 수 있다.

 

해당 부분에 대한 오류가 A100에서만 발생하는 오류인줄 알고 있었는데, V100이나 nvidia 30대 gpu 등 여러 부분에서 발생하는 것을 확인했다.

 

"NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running."

 

해당 오류에 대해서 많을 블로그들을 찾아봤지만 지웠다가  다시 설치하라는 얘기가 많은데 내 경우에는 다른 방법으로 해결을 해야 했다.

 

 

해결 방법

나한테 발생한 문제에 대한 해결 방법은 grub를 수정해 주는 것이다.

 

nvidia driver를 설치하고 grub를 수정해도 되는지는 잘 모르겠지만 나는 grub를 수정하고 nvidia driver를 설치했다.

 

다음과 같은 위치에 grub를 vim(or vi 등)으로 실행한다.

vim /etc/default/grub

 

그러면 밑의 이미지와 같이 뜬다.

 

여기서 splash 뒤에 'pci=realloc=off'를 추가해주면 된다.

 

그리고 저장을 한 후, grub를 update하면 된다.

update-grub

 

여기서 혹시 모르니 재부팅 한번 해주고 각자의 방법대로 설치하면 nvidia-smi로 드라이버를 확인할 수 있다.

728x90
반응형

댓글