새 모델 개발 지연 오픈AI... "학습에 필요한 데이터 등 한계"

2024-12-23 14:32
  • 글자크기 설정

일리야 수츠케버, "인터넷은 오직 하나...데이터는 늘지 않아"

사진AP연합뉴스
[사진=AP·연합뉴스]
미 일간 월스트리트저널(WSJ)이 챗GPT 개발사 오픈AI의 차세대 주력 인공지능(AI) 모델 개발이 당초 목표보다 훨씬 늦어지고 있다고 22일(현지시간) 전했다.

WSJ의 보도에 따르면 오픈AI의 코드명 '오리온'(Orion)으로 알려진 차세대 AI 모델 GPT-5는 개발 일정이 기약 없이 지연되고 있으며 막대한 비용을 쓰고 있다.

오픈AI의 최대 투자사인 마이크로소프트(MS)는 올해 중반께 새 모델이 나올 것으로 예상했으나, 오픈AI는 이런 기대에 부응하지 못했다는 분석이다. 

샘 올트먼 오픈AI 최고경영자(CEO)는 지난 20일 고급 추론 AI 모델 'o3'를 공개했지만, GPT-5라고 부를 만한 새 주력 모델이 언제 나올지에 대해서는 언급하지 않았다.

오픈AI는 지금까지 18개월이 넘는 개발 기간 중 방대한 양의 데이터를 처리하는 대규모 훈련을 최소 2차례 진행했지만 기대했던 결과를 얻지 못한 것으로 전해졌다. 새 모델은 기존의 GPT-4보다는 나은 성능을 보였지만, 여기에 투입된 막대한 비용을 정당화할 만큼의 충분한 진보는 보여주지 못했다고 WSJ 소식통들은 말했다.

업계 추정치에 따르면 이 정도의 대규모 AI 훈련에는 6개월간 컴퓨팅 비용만으로 약 5억 달러(약 7247억5000만원)가 소요될 수 있다.

WSJ는 이전 모델의 경우 오픈AI는 인터넷에서 수집한 뉴스 기사나 소셜미디어 게시물, 과학 논문 등 데이터를 AI 훈련에 사용했으나, 새 모델을 개발하는 과정에서는 더 지능적인 훈련에 필요한 데이터가 그만큼 충분하지 않은 것이 주요 난관으로 꼽힌다고 전했다. 

이 문제를 해결하기 위해 오픈AI는 새로운 데이터를 직접 만들고 소프트웨어 엔지니어나 수학자들을 고용해 새로운 소프트웨어 코드를 만들거나 복잡한 수학 문제를 풀도록 하는 방법을 시도하고 있으나 이 과정은 기존 방식보다 시간이 훨씬 많이 걸린다.

AI 모델의 성능 향상이 정체기를 맞은 것이 아니냐는 논쟁은 업계 전반에 걸쳐 가열되고 있다. 

오픈AI의 공동 창립자이자 수석과학자였다가 회사를 떠난 일리야 수츠케버는 지난 13일 한 강연에서 "컴퓨터 연산 능력은 향상하고 있지만, 데이터는 늘지 않고 있다"며 "우리가 가진 인터넷은 오직 하나뿐이기 때문"이라고 지적했다.

그는 데이터를 유한한 자원인 화석연료에 비유하면서 "우리가 알고 있는 (생성형 AI의) 사전 훈련은 의심할 여지 없이 끝날 것"이라고 단언했다.

 

©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지

0개의 댓글
0 / 300

로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?

닫기

댓글을 삭제 하시겠습니까?

닫기

이미 참여하셨습니다.

닫기

이미 신고 접수한 게시물입니다.

닫기
신고사유
0 / 100
닫기

신고접수가 완료되었습니다. 담당자가 확인후 신속히 처리하도록 하겠습니다.

닫기

차단해제 하시겠습니까?

닫기

사용자 차단 시 현재 사용자의 게시물을 보실 수 없습니다.

닫기
공유하기
닫기
기사 이미지 확대 보기
닫기
언어선택
  • 중국어
  • 영어
  • 일본어
  • 베트남어
닫기