르쿤 교수는 11일 서울 여의도 페어몬트 앰배서더 호텔에서 열린 '2024 K-사이언스&테크놀로지 글로벌 포럼' 기조연설에서 "(AI 학습에 주로 활용되는) 언어는 눈에 보이기 때문에 쉽지만 우리의 세상은 이보다 훨씬 복잡하다"며 "AI를 통해서 세상을 이해하려면 아직 더 많은 발전이 필요하다"고 짚었다. 그는 AI가 시도 쓸 수 있고 변호사 시험도 통과할 수 있지만, 정작 어린아이도 할 수 있는 식탁 정리 등은 여전히 할수 없다는 점을 예로 들었다. AI가 수많은 언어 기반의 데이터 위주로 학습을 하지만 이것만으로는 한계가 있다는 의미다.
르쿤 교수는 AI가 이미지와 동영상 등 각종 데이터를 통해 예측과 추론 능력을 키우도록 하는 모델인 'JEPA(Joint-Embedding Predictive Architecture)'가 AI 발전에 필수적이라고 봤다. AI가 데이터를 스스로 학습할 수 있도록 하되 기존 LLM처럼 언어뿐만이 아니라 다양한 데이터를 학습해 각 데이터 간 관계와 맥락을 이해토록 하는 것이다. 어린아이, 혹은 강아지·고양이 등이 세상을 배우는 방식과 비슷하다는 것이 그의 설명이다. 그는 "4살짜리 아이가 일생 동안 1000시간을 본다고 하면 이를 통해 전달되는 데이터는 10의 14승 바이트에 달하는 것으로 추정된다"며 "어마어마한 양의 정보가 데이터를 일일이 입력하는 것이 아니라 관찰을 통해 축적되는 것"이라고 설명했다.
그가 오픈소스 모델의 중요성을 강조한 것은 AI의 이러한 발전을 위해서는 그만큼 많은 양의 데이터가 요구되기 때문이다. 모든 인간의 지식과 문화가 AI를 통해 축적되면 나아가 인간의 모든 가치체계와 언어 등도 AI에 쌓일 것이고, 그럼으로써 인류가 같이 쓸 수 있는 AI가 만들어질 것이라고 르쿤 교수는 봤다. 이를 위해서는 전 세계 모든 기업과 공공기관 등이 오픈소스 기반으로 협력해 자료를 공유해야 한다는 것이 그의 견해다. 그가 몸담고 있는 메타는 '라마' 시리즈를 중심으로 오픈소스 전략을 취하고 있다.
이날 포럼은 과학기술 국제협력의 정책·사례·사업성과 공유 등을 주제로 진행됐다. 73개 국가와 4개 국제기구의 주한 외교관 108명을 비롯해 정부 인사, 국제 공동연구 참여 연구자 등 총 200여명이 참석했다. 르쿤 교수도 최근 한국 정부와 뉴욕대가 함께 설립한 '글로벌 AI 프론티어 랩'을 언급하며 "한국 학계에서도 관련 연구를 하는 것으로 아는데 이들과 협력할 기회가 있기를 희망한다"고 말했다.
포럼 축사에 나선 유상임 과학기술정보통신부 장관은 "한국은 과학기술 글로벌 허브로 도약하기 위해 전력을 다하고 있다"며 "중장기적으로 민관 공동의 과학기술 국제협력 생태계 조성을 위해 올해 글로벌 연구개발(R&D) 투자 규모를 1조8000억원으로 확대하고, 과학기술 국제협력 정책과 과제를 담은 이니셔티브도 발표했다. 법제도 정비도 추진할 것"이라고 말했다.