전체 글

HPC 단순환 신청 배포 엔비디아 GPU 클라우드 컨테이너

HPC 리소스 액세스 가능성에 대한 답 찾기

 

50개 이상의 대학 학과의 교수진과 대학원생이 연구를 지원하기 위해 고성능 컴퓨팅 (HPC) 리소스와 응용 프로그램을 찾고 있을 때 상황이 급하게 복잡해질 수 있습니다.

 

Clemson University에서 IT 관리자는 액세스 권한을 관리합니다. 2,000개 이상의 NVIDIA GPU로 구성된 학교의 Palmetto HPC 클러스터 최신 Tesla V100을 포함한 가속 노드. 다양한 연구 프로젝트에 참여하는 과학자들은 자주 시간을 요청합니다.

 

클러스터에서 분자 역학, 양자 화학, 전산 유체 역학 및 딥 러닝 전반에 걸쳐 가장 까다로운 시뮬레이션을 수행합니다.

 

Clemson IT 부서의 연구 진행자인 Ashwin Srinath는 “그들은 문제를 해결하고 싶어하는데 너무 커서 랩톱이나 워크스테이션에서 해결할 수 없습니다. “대부분의 우리 연구원들은 HPC가 작동하는 방식에 대해 별로 알고 싶어하지 않습니다.그들은 단지 정말 큰 기계에서 프로그램을 실행하기를 원할 뿐입니다.”

 

그러나 HPC 리소스에 이러한 종류의 서비스를 제공하기 위해 노력하는 것은 어려운 일입니다. 이미 복잡한 환경 모듈 네트워크의 베어메탈에 애플리케이션을 설치하거나 업데이트하면 IT가 느려지고 애플리케이션 액세스가 지연되어 연구 속도가 느려집니다. 종속성을 업데이트하면 의도치 않게 종속성 네트워크가 끊어져 다른 응용 프로그램이 중단되는 경우가 많습니다.

 

또한 지원해야 할 다양한 유형의 사용자와 프로젝트가 있기 때문에 HPC 관리자는 매우 다양한 애플리케이션에 대한 신규 설치 및 앱 업그레이드 요청을 이행하는 데 지나치게 많은 시간을 소비합니다. 일부 사용자는 이전 버전의 응용 프로그램에서 시뮬레이션을 실행하고 다른 사용자는 최신 기능에 액세스하기를 원할 수 있으므로 상황이 더욱 복잡해집니다.

 

여러 버전의 응용 프로그램을 설치, 업데이트 및 유지 관리해야 하는 것은 연구원 생산성을 저하시킬 수 있는 부차적인 우선 순위입니다.

 

HPC
HPC

 

아마도 더 중요한 것은 이렇게 추가된 IT 워크로드가 시뮬레이션을 실행하기 위해 더 오래 기다려야 함으로써 애플리케이션 사용자의 생산성을 저해한다는 것입니다.

 

또한 때때로 기능이 제한된 이전 버전의 애플리케이션에서 시뮬레이션을 실행하는 것 외에는 선택의 여지가 없어 제한된 통찰력과 차선의 결과를 얻을 수 있습니다.

+ Recent posts