1초에 5천兆 연산...초고성능 AI 시스템 국내에서 개발
2021-12-02 09:58
고성능·저전력 AI 반도체 통해 기존보다 연산성능 4배, 전력효율 7배 향상
자율주행차, 클라우드, 데이터 센터 등 대규모 AI 서비스에 활용 전망
자율주행차, 클라우드, 데이터 센터 등 대규모 AI 서비스에 활용 전망
국내 연구진이 자체 개발한 인공지능(AI) 반도체를 기반으로 AI 학습과 추론을 가속화할 수 있는 시스템을 개발했다. 이론상 1초에 5천조(兆)회 연산이 가능하다.
한국전자통신연구원(ETRI)이 2일 고성능 AI 반도체 칩을 활용해 낮은 전력으로도 초당 약 5천조회 연산이 가능한 인공지능 시스템을 개발했다고 밝혔다.
사회 전반에 AI가 쓰이면서 대규모 연산 처리 필요성도 커지고 있지만, 기존 컴퓨터와 모바일 기기의 프로세서는 단순 계산에 최적화돼 있다. 그래픽 처리장치(GPU)도 AI에 널리 활용되고 있으나, 구조적으로 AI 연산 처리에 최적화되지 않아 데이터 지연과 전력 낭비가 발생한다. 신경망처리장치(NPU) 기반 AI 반도체가 차세대 AI 두뇌로 떠오르는 이유다.
ETRI는 작년 NPU 기반 AI 반도체 칩, AB9(알데바란9)을 공개한 데 이어, 올해 이를 기반으로 하는 보드와 인공지능 시스템을 개발하는 데 성공했다. 자율주행차, 클라우드, 데이터센터, 사람·사물·음성 인식 등 AI 응용 서비스를 제공하는 고성능 서버에 본격적으로 활용하기 위함이다.
이번에 개발한 NPU 보드 'ABrain-S'는 AB9을 기반으로 독자적인 설계를 이뤄, 기존보다 부피가 작고 전력 소모도 적다. 인공지능 알고리즘 처리를 위해 입출력 데이터를 16GB까지 저장할 수 있는 메모리와 데이터 이동 속도를 높이는 입출력 방식도 적용했다.
연구진은 고성능·고효율 서버를 구현하기 위해서는 NPU 보드를 최대한 집적화하는 것이 핵심이라고 설명했다. 현재 AI 알고리즘 처리 가속기로 많이 활용되는 GPU 보드는 부피가 커서 1개 서버에 6~7대밖에 장착할 수 없으며, 전력도 많이 소모한다. 반면, AB9을 내장한 NPU 보드는 한 서버에 최대 20개씩 장착할 수 있다. 기존 시스템과 비교해 공간·전력효율을 개선하면서, 공간에 필요한 비용도 줄였다. AB9은 동전 크기의 작은 면적에서도 초당 40조회 연산 성능을 내면서 전력 소모는 15W 수준으로 매우 낮기 때문이다.
이를 바탕으로 ETRI는 서버 8개를 쌓아 랙 서버(Rack Server) 형태로 구성한 인공지능 시스템, 아트브레인(ArtBrain-K)도 만들었다. 개발된 시스템은 최대 5페타플롭스(PetaFLOPS) 성능을 발휘한다. 서버 1개당 1초에 약 5천조회 연산이 가능한 것으로, 기존 GPU 기반 인공지능 서버 대비 약 4배 높은 연산 성능과 7배 높은 전력효율이다.
아트브레인이 데이터센터 등에 적용되면 처리 용량과 속도가 대폭 개선된다. 따라서 트랜스포머 계열 인공지능 알고리즘 등 초거대 인공신경망(Huge Neural Network) 등 고성능 컴퓨팅 자원이 필요한 곳에 활용될 전망이다.
이 밖에도 ETRI는 AI 알고리즘을 쉽게 개발할 수 있도록 SW 개발환경도구 'AIwareRT'를 깃허브(Github)에 공개했다. 프로그래밍에 필요한 기본적인 구조와 알고리즘, 시뮬레이터, 최적화 도구 등을 라이브러리 형태로 제공해, 프로그래밍 언어에 생소한 사람들도 쉽게 사용해볼 수 있게 구성했다.
ETRI 한진호 인공지능프로세서연구실장은 "AI 반도체 자체 개발로 비메모리 반도체 분야 원천기술을 보유하고 있다. AI 반도체를 탑재한 NPU 보드와 NPU 서버시스템과 관련 SW까지 개발해 우리가 개발한 기술의 경쟁력을 높이는 데 성공했다"고 말했다.
현재 반도체 기업과 AI 하드웨어 기업 등에 기술을 이전했으며, 공항 자동 출입국 시스템에 적용돼 얼굴인식·출입국 보안에 활용 중이다.
향후 연구진은 본 기술을 고도화해 더 높은 성능을 지닌 서버·시스템을 구축할 예정이며, 딥러닝이 적용되는 AI 분야 부품의 국산화를 위한 지원도 진행할 계획이다.
한국전자통신연구원(ETRI)이 2일 고성능 AI 반도체 칩을 활용해 낮은 전력으로도 초당 약 5천조회 연산이 가능한 인공지능 시스템을 개발했다고 밝혔다.
사회 전반에 AI가 쓰이면서 대규모 연산 처리 필요성도 커지고 있지만, 기존 컴퓨터와 모바일 기기의 프로세서는 단순 계산에 최적화돼 있다. 그래픽 처리장치(GPU)도 AI에 널리 활용되고 있으나, 구조적으로 AI 연산 처리에 최적화되지 않아 데이터 지연과 전력 낭비가 발생한다. 신경망처리장치(NPU) 기반 AI 반도체가 차세대 AI 두뇌로 떠오르는 이유다.
ETRI는 작년 NPU 기반 AI 반도체 칩, AB9(알데바란9)을 공개한 데 이어, 올해 이를 기반으로 하는 보드와 인공지능 시스템을 개발하는 데 성공했다. 자율주행차, 클라우드, 데이터센터, 사람·사물·음성 인식 등 AI 응용 서비스를 제공하는 고성능 서버에 본격적으로 활용하기 위함이다.
이번에 개발한 NPU 보드 'ABrain-S'는 AB9을 기반으로 독자적인 설계를 이뤄, 기존보다 부피가 작고 전력 소모도 적다. 인공지능 알고리즘 처리를 위해 입출력 데이터를 16GB까지 저장할 수 있는 메모리와 데이터 이동 속도를 높이는 입출력 방식도 적용했다.
연구진은 고성능·고효율 서버를 구현하기 위해서는 NPU 보드를 최대한 집적화하는 것이 핵심이라고 설명했다. 현재 AI 알고리즘 처리 가속기로 많이 활용되는 GPU 보드는 부피가 커서 1개 서버에 6~7대밖에 장착할 수 없으며, 전력도 많이 소모한다. 반면, AB9을 내장한 NPU 보드는 한 서버에 최대 20개씩 장착할 수 있다. 기존 시스템과 비교해 공간·전력효율을 개선하면서, 공간에 필요한 비용도 줄였다. AB9은 동전 크기의 작은 면적에서도 초당 40조회 연산 성능을 내면서 전력 소모는 15W 수준으로 매우 낮기 때문이다.
이를 바탕으로 ETRI는 서버 8개를 쌓아 랙 서버(Rack Server) 형태로 구성한 인공지능 시스템, 아트브레인(ArtBrain-K)도 만들었다. 개발된 시스템은 최대 5페타플롭스(PetaFLOPS) 성능을 발휘한다. 서버 1개당 1초에 약 5천조회 연산이 가능한 것으로, 기존 GPU 기반 인공지능 서버 대비 약 4배 높은 연산 성능과 7배 높은 전력효율이다.
아트브레인이 데이터센터 등에 적용되면 처리 용량과 속도가 대폭 개선된다. 따라서 트랜스포머 계열 인공지능 알고리즘 등 초거대 인공신경망(Huge Neural Network) 등 고성능 컴퓨팅 자원이 필요한 곳에 활용될 전망이다.
이 밖에도 ETRI는 AI 알고리즘을 쉽게 개발할 수 있도록 SW 개발환경도구 'AIwareRT'를 깃허브(Github)에 공개했다. 프로그래밍에 필요한 기본적인 구조와 알고리즘, 시뮬레이터, 최적화 도구 등을 라이브러리 형태로 제공해, 프로그래밍 언어에 생소한 사람들도 쉽게 사용해볼 수 있게 구성했다.
ETRI 한진호 인공지능프로세서연구실장은 "AI 반도체 자체 개발로 비메모리 반도체 분야 원천기술을 보유하고 있다. AI 반도체를 탑재한 NPU 보드와 NPU 서버시스템과 관련 SW까지 개발해 우리가 개발한 기술의 경쟁력을 높이는 데 성공했다"고 말했다.
현재 반도체 기업과 AI 하드웨어 기업 등에 기술을 이전했으며, 공항 자동 출입국 시스템에 적용돼 얼굴인식·출입국 보안에 활용 중이다.
향후 연구진은 본 기술을 고도화해 더 높은 성능을 지닌 서버·시스템을 구축할 예정이며, 딥러닝이 적용되는 AI 분야 부품의 국산화를 위한 지원도 진행할 계획이다.