Clemson University HPC 관리자

NGC 컨테이너로 HPC 클러스터 향상 프로비저닝

클렘슨 대학교
클렘슨 대학교

Srinath와 Clemson HPC 관리 팀은 다음을 제공하는 솔루션이 필요했습니다. 원활한 HPC 경험을 제공하고 IT와 연구원 모두의 효율성을 극대화합니다. 또한 작업을 단순화하고 사용자가 더 빨리 연구를 수행할 수 있도록 해야합니다.

NGC 컨테이너 레지스트리에서 소프트웨어 컨테이너를 찾았습니다. GPU 최적화 애플리케이션 컨테이너는 HPC 관리자의 수고를 덜어줍니다. 응용 프로그램 및 모든 관련 종속성은 기본 하드웨어 또는 설치된 기타 소프트웨어에 구애받지 않는 독립형 환경에 패키징됩니다.

따라서 컨테이너는 설치 프로세스를 제거하고 클러스터의 다른 애플리케이션에 영향을 주지 않고 애플리케이션 배포를 완료할 수 있습니다.

예를 들어 컨테이너를 사용하면 HPC 관리자가 VMD와 같은 다른 애플리케이션을 방해하지 않고 NAMD와 같은 애플리케이션을 업그레이드할 수 있습니다.

그리고 한 사용자가 최신 버전의 NAMD를 사용하고 다른 사용자가 이전 버전으로 계속 작업하기를 원하면 두 버전 모두 자체 컨테이너에서 병렬로 실행할 수 있으므로 연구원이 시뮬레이션에 접근하는 방식에 유연성을 제공합니다.

그리고 한 사용자가 최신 버전의 NAMD를 사용하고 다른 사용자가 이전 버전으로 계속 작업하기를 원하면 두 버전 모두 자체 컨테이너에서 병렬로 실행할 수 있으므로 연구원이 시뮬레이션에 접근하는 방식에 유연성을 제공합니다.

컨테이너가 HPC에 제공하는 또 다른 중요한 이점은 재현성입니다. 이는 연구원에게 주요 고려 사항이지만 베어 메탈 설정에서는 달성하기가 매우 어렵습니다. 컨테이너에서 실행되는 응용 프로그램은 항상 동일한 환경을 사용하기 때문에 성능을 재현하고 이식할 수 있으므로 사용자가 연구를 공유하고 기반으로 구축할 수 있습니다.

NGC 컨티에너 배포 손쉬운 Palmetto

Clemson은 이러한 모든 이점을 보았지만 아마도 가장 중요한 것은 Srinath와 HPC 관리 팀이 Palmetto 클러스터에 컨테이너를 배포합니다.

HPC 환경용으로 설계된 Singularity에서 NGC 컨테이너를 실행함으로써 Srinath는 사용자에게 NVIDIA GPU Cloud에서 컨테이너를 다운로드하고 Singularity에서 컨테이너를 실행하는 단계별 지침을 안내합니다.

NGC 컨테이너는 또한 사용자가 TensorFlow와 같은 소프트웨어의 빈번한 릴리스에 대한 업데이트를 요구할 때 Srinath와 그의 팀이 보다 신속하게 대응할 수 있도록 합니다. Srinath는 "NGC 컨테이너가 Singularity에서 작동한다는 사실 외에 NGC 컨테이너에서 가장 좋아하는 것 중 하나는 최신 버전의 애플리케이션을 사용할 수 있다는 점입니다."라고 말했습니다.

컨테이너 혜택 관리자 및 비슷한 사용자

조직이 NGC 컨테이너의 이점을 경험하는 데 오랜 시간이 걸리지 않았으며 Clemson은 IT 부서에서 집안일을 크게 줄이는 것부터 시작하여 수많은 성과를 즉시 깨달았습니다.

Srinath는 "소프트웨어 설치에 소요되는 시간을 줄임으로써 우선 순위가 더 높은 작업을 확실히 처리할수 있습니다."라고 말했습니다. "예를 들어 워크플로 개선 또는 코드 병렬화와 같은 실제 문제가 있는 연구원을 도울 수 있습니다."

분자 역학 연구를 위해 단백질, 지질 및 핵산을 시뮬레이션하는 GROMACS와 같은 응용 프로그램을 설치하는 데 반나절 이상을 소비하는 대신 사용자는 이제 응용 프로그램을 몇 분 안에 배포할 수 있습니다. 클러스터에서 실행하십시오. Srinath는 반나절 작업을 분 단위로 줄이는 비율이 대부분의앱을 설치하는데 걸리는 시간을 나타냅니다.

+ Recent posts