- 슈퍼컴퓨터의 구축비용과 전력소모 절감하는 소프트웨어 신기술 개발
□ 구축비용과 전력소모를 크게 절감하면서도 세계에서 가장 빠른 슈퍼컴퓨터를 구축하는데 필요한 소프트웨어 신기술이 국내 연구진에 의해 개발되었다.
○ 서울대 이재진 교수(매니코어 프로그래밍 연구단장, 44세)가 주도한 이번 성과는 교육과학기술부(장관 이주호)와 한국연구재단(이사장 이승종)이 추진하는 리더연구자지원사업(창의적연구)의 지원으로 창출되었다.
□ 이재진 교수 연구팀은 일반적인 슈퍼컴퓨터와는 달리 노드* 한 대에 최대 6개의 그래픽 처리장치(GPU)를 장착하는 방법으로 기존 슈퍼컴퓨터의 노드 당 계산 속도를 세계에서 가장 빠른 수준으로 끌어올리는데 성공하였다.
*) 노드(node) : 데이터를 전송하는 통로에 접속되는 하나 이상의 단위. 주로 통신망의 분기점이나 단말기의 접속점을 말함
○ 한 노드에 다수의 GPU를 장착하여 노드 당 계산 속도를 높이면 적은 수의 노드로도 많은 양의 계산을 한꺼번에 처리할 수 있는 장점이 있다. 만일 이것이 가능하면 슈퍼컴퓨터의 구축비용뿐만 아니라 소모되는 전력도 획기적으로 줄일 수 있다.
○ 그러나 지금까지 다수의 GPU를 효율적으로 장착하는 소프트웨어 기술이 개발되지 못해, 대부분의 슈퍼컴퓨터에는 각 노드 당 최대 2개의 GPU밖에 장착하지 못했다. 그러나 이 교수팀이 개발한 소프트웨어 기술을 사용하면 노드마다 최소 3개 이상의 GPU를 장착하고 효율적으로 계산할 수 있게 된다.
□ 이재진 교수팀은 이번 연구결과를 바탕으로 16개의 노드(총 96개 GPU 장착)로 구성된 슈퍼컴퓨터 시작품 ‘스누코어(SnuCore)'를 자체 제작하는데 성공하였다.
○ 일반적으로 슈퍼컴퓨터의 계산 속도를 평가하는데 사용하는 프로그램(린팩 벤치마크)으로 측정한 스누코어의 노드 당 계산 속도는 0.991테라플롭스(TFLOPS)*로 이 수치는 현존하는 슈퍼컴퓨터 중에서 가장 빠르고, 전력효율 면에서도 와트당 871메가플롭스(MFLOPS)로 세계 20위권의 탁월한 수준이다.
*) FLOPS(floating-point operations per second) : 컴퓨터 성능의 단위로 초당 몇 회의 실수 연산을 수행할 수 있는지를 알려줌 (TFLOPS ? 초당 1012회, MFLOPS ? 초당 106회)
○ 스누코어는 시중에서 흔히 구할 수 있는 부품(AMD의 CPU와 GPU, 타이안의 마더보드 및 멜라녹스의 인피니밴드 네트워크 장비 등)과 연구팀이 자체 설계한 냉각 시스템을 이용해 제작되었다.
○ 연구팀은 새로 개발한 소프트웨어 최적화 기술을 다양한 프로그래밍 언어(OpenCL과 MPI)를 사용해 린팩 벤치마크에 적용하였고, 그 결과 스누코어의 각 노드에 장착된 6개의 GPU를 효율적으로 사용하여 세계에서 가장 빠른 노드 당 계산속도와 세계 20위권의 전력효율을 얻을 수 있었다.
○ 스누코어의 성능 대비 가격은 다른 세계 최상위급 슈퍼컴퓨터들과 비교해도 최대 8.3%(1/12)로 저렴하다. 따라서 스누코어에 적용된 소프트웨어 기술을 사용하면 세계 최상급의 성능을 지닌 슈퍼컴퓨터를, 기성부품을 사용하여 저렴한 비용으로 구축할 수 있게 된다.
○ 이 교수팀은 이번 연구결과를 소속대학(서울대)에서 개발하고 있는 OpenCL* 기반의 프로그래밍 환경인 SnuCL에 적용하여 추후 일반 국민에게도 공개할 예정이다.
*) OpenCL(Open Computing Language) : 개방형 범용 병렬 컴퓨팅 프레임워크
□ 이재진 교수는 “이번 연구는 소프트웨어 기술이 뒷받침되었을 때 슈퍼컴퓨터의 구축·관리 비용이 획기적으로 절감되고 IT분야의 저탄소 녹색성장에도 기여할 수 있음을 보여준 구체적인 사례”라며, “다른 IT분야에 비해 슈퍼컴퓨터의 연구개발이 뒤처져 있는 우리나라가 미국·일본·중국 등 슈퍼컴퓨터 강국과 나란히 설 수 있는 계기가 될 것”이라고 연구의의를 밝혔다.
- TAG
-