과학기술정보통신부는 16일 KAIST(한국과학기술원) 연구팀이 구글 딥마인드에서 개발한 바둑 인공지능 프로그램인 ‘알파고’에서 활용된 ‘심층 강화학습’을 높은 성능과 전력효율로 처리할 수 있는 첨단 인공지능 반도체 기술을 개발했다고 밝혔다.
심층 강화학습이란 인공지능이 주어진 환경에서 시행착오로 얻어진 경험을 활용해 스스로 최적의 답안을 도출하면 인간이 그 결과에 대한 피드백을 주는 방식을 의미한다.
이번 연구는 반도체 분야 최고 학회 중 하나인 ‘IEEE VLSI 기술 및 회로에 대한 심포지엄(VLSI Symposia)’에서 하이라이트 논문으로 선정돼 큰 주목을 받았다.
연구팀은 심층 신경망 데이터에 대한 압축률 증가, 데이터 압축 상태로 연산, 연산·저장 기능이 통합된 SRAM 기반의 PIM 반도체 기술을 사용했다. 특히 PIM 반도체는 정수 단위로만 연산이 가능했지만, 이번 연구를 통해 세계 최초로 소수점 기반 연산이 가능한 기술을 개발했다.
실제 OmniDRL을 심층 강화학습 알고리즘 성능 비교 연구에 주로 활용되는 ‘인간형 로봇 적응 보행 시스템’을 적용한 결과, OmniDRL이 연결되지 않았을 때보다 7배 이상 빠른 속도로 적응 보행이 가능한 것으로 나타났다.
유회준 KAIST 교수는 “이번 연구는 한 개의 반도체에서 심층 신경망을 높은 압축을 유지한 상태로 추론·학습이 가능하게 했다”면서 “불가능이라 여겨졌던 소수점 연산이 가능한 인공지능 반도체 기술을 개발했다는 점에서 의미가 크다”고 말했다. 유 교수는 “향후 지능형 로봇 조종, 자율주행 드론, 게임 등 다양한 분야에 응용이 가능할 것으로 기대된다”고 밝혔다.
송경희 과기정통부 인공지능기반정책관은 “이번 연구는 반도체 분야의 새로운 패러다임인 인공지능 반도체 분야에서 국내의 연구결과가 국제적으로 인정받았다는 점에서 의미가 크다”고 말했다.
과기정통부는 지난해 착수한 1조원 규모의 인공지능 반도체 연구개발을 지속하고, 내년부터 4000억원 규모의 PIM 반도체 기술 개발 사업을 본격적으로 추진하는 등 인공지능 반도체 분야에 대한 투자를 지속 확대해 나갈 계획이다.