728x90
728x90
docker에서 발생하는 memory error
local에서 잘 돌아가던 pytorch 코드를 docker의 container를 생성하여 pytorch 코드를 실행하면 가끔 메모리가 부족하다는 오류를 확인할 경우가 있다.
Unexpected bus error encountered in worker. This might be caused by insufficient shared memory(shm)
Memory Error을 해결하기 위한 방법
이러한 오류가 떴을 경우 내 경우에는 docker의 container 생성할 때 optiojn 하나를 추가해 주면 해결이 됐다.
--ipc string IPC mode to use
--ipc라는 option이 있는데 option을 밑에와 같이 host로 설정해 주변 해결이 된다.
--ipc=host
docker option에서 ipc란
--ipc에 대한 설명은 docker docs를 보면 다음과 같이 적혀 있다.
IPC (POSIX/SysV IPC) namespace provides separation of named shared memory segments, semaphores and message queues.
https://docs.docker.com/engine/reference/run/#ipc-settings---ipc
728x90
반응형
'Development > Pytorch' 카테고리의 다른 글
deepspeed를 이용하여 pytorch 모델 학습 방법 (5) | 2023.04.27 |
---|---|
[Pytorch] CUDA error: CUBLAS_STATUS_INVALID_VALUE when calling `cublasSgemm (0) | 2022.12.14 |
[Pytorch] pytorch모델을 onnx모델로 변환 방법 (0) | 2021.10.25 |
댓글