김화종 "AI는 신약 개발에 필수…바이오 데이터 한계 극복해야"
2024-05-27 15:30
한국제약바이오협회 K-멜로디 사업단장
구글·엔비디아 등 빅테크도 신약개발 뛰어들어
"AI 학습 데이터 제한적…연합학습이 실마리"
구글·엔비디아 등 빅테크도 신약개발 뛰어들어
"AI 학습 데이터 제한적…연합학습이 실마리"
"비행기처럼 보편적 도구가 된 인공지능(AI)이 신약 개발 분야에서 필수 기술이 됐지만 AI 성능을 좌우하는 데이터가 특히 바이오 분야에서는 제한적이라 성능 향상에 한계가 있다. 데이터 공유 체계가 필요하다."
김화종 한국제약바이오협회 연합학습 기반 신약개발 가속화 프로젝트(K-MELLODDY·멜로디) 사업단장이 27일 서울 중구 더플라자호텔에서 아주경제신문 주최로 열린 '제14회 글로벌헬스케어포럼'에서 이같이 말했다.
김 단장은 'AI 기술과 신약 개발 변화'를 주제로 한 발표에서 신약 개발 분야에선 공유된 데이터가 제한적이라 초거대언어모델(LLM) 같은 파운데이션 모델의 성능을 높이는 데 한계가 있다고 지적했다. 그는 "AI 핵심은 컴퓨팅 역량이나 소프트웨어 자체가 아니라 데이터"라면서 "챗GPT와 같은 일반 LLM을 학습시키는 데이터는 이미 많이 개방돼 있지만 신약 개발 관련 데이터는 제약사들이 내놓지 않으면 접근할 수 없다"고 말했다. 바이오 AI 기술 성능을 높이려면 제약사들이 데이터를 공유하는 체계가 필요하다는 것이다.
김 단장은 "바이오 분야 특성상 데이터 자체를 공개하기는 어렵기 때문에 데이터를 이동하지 않고 머신러닝 모델 파라미터를 각 기관에 이동시켜 데이터를 학습하는 연합학습 방법을 채택하고 있다"고 설명했다. 이어 "우리 정부도 관련 사업을 추진 중이고 이달 중 참여기관 선정 작업에 착수할 것"이라고 밝혔다. 보건복지부와 과학기술정보통신부는 공동으로 K-멜로디 사업을 추진 중이다. 관련 연구개발(R&D)에 5년간 총 348억원의 예산을 투입한다.
글로벌 빅테크 기업들이 AI를 활용한 신약 개발에 뛰어들고 있는 만큼 정통적인 개발 방식은 경쟁력이 떨어질 수 있다고도 경고했다. 알파고를 개발한 구글 딥마인드의 자회사 아이소모픽랩스는 최근 단백질 구조를 예측하고 만드는 '알파폴드 3' 버전을 공개했다. AI칩 선두 주자인 엔비디아도 신약 개발을 위한 생성형 AI 플랫폼을 내놓았다. 신약 개발 전 과정에 AI 기술을 활용하면 개발 기간 단축 등 혁신 가능성이 무궁무진하다고 김 단장은 내다봤다.