'소라' 정식 출시한 오픈AI…글로벌 영상 생성 AI 경쟁 본격화
2024-12-10 13:29
지난 2월 선공개했던 '소라', 이날 정식 출시…최대 영상 길이 20초
챗GPT 유료 구독자라면 누구나 이용 가능…딥페이크 대응책도 마련
올들어 메타·구글 비롯해 美·中 스타트업 잇따라 영상 생성 AI 출시
챗GPT 유료 구독자라면 누구나 이용 가능…딥페이크 대응책도 마련
올들어 메타·구글 비롯해 美·中 스타트업 잇따라 영상 생성 AI 출시
오픈AI가 이날 선보인 '소라 터보'는 텍스트-비디오 생성 AI 모델이다. 텍스트로 프롬프트(명령어)를 넣으면 이를 바탕으로 동영상을 만들어 준다. 최대 1분까지 영상 제작이 가능했던 기존 공개 버전보다 길이는 짧아졌지만, 생성 속도는 훨씬 빨라졌다. 이용자는 영상을 양옆으로 넓게 펼칠 수 있고, 수직이나 정사각형 비율 등도 가능하다. 기존 동영상을 확장하거나 빠진 프레임을 채우는 기능도 제공한다.
소라 터보는 챗GPT와 별도 사이트인 '소라닷컴'에서 사용 가능하다. 챗GPT 유료 이용자들을 대상으로 제공된다. 오픈AI에 따르면 월 22달러의 챗GPT 플러스 이용자는 1000크레딧(최대 50개 영상)이 제공되며 해상도 720p, 최대 5초까지만 생성할 수 있다. 월 200달러의 챗GPT 프로 이용자는 1만크레딧(최대 500개 영상)이 제공되며 1080p 해상도로 20초까지 생성 가능하다. 오픈AI는 내년 초 소라 관련 추가 요금제도 발표할 예정이다. 다만 유럽연합(EU)과 영국·스위스 등 유럽 국가는 이번에 출시 대상에서 제외됐다.
오픈AI는 그간 '소라'를 영화·음악 분야 일부 종사자 등 제한적인 인원들만 사용할 수 있도록 했다. 이번에 챗GPT 유료 구독자라면 누구나 사용할 수 있게 확장함으로써 향후 영상 생성 AI 시장 경쟁이 치열해질 전망이다. 메타와 구글 등 빅테크 기업들은 물론 AI 스타트업들도 올들어 영상 생성 AI를 쏟아내면서다.
메타는 지난 10월 '무비 젠(Movie Gen)'을 공개해 영상 생성 AI 경쟁에 뛰어들었다. 텍스트를 입력하면 최대 16초 길이의 동영상이 생성된다. 기존 영상이나 이미지 편집 기능도 제공하며 사용자의 이미지를 활용할 수도 있다. 내년 중 인스타그램에 '무비 젠'을 적용하겠다는 방침이다. 구글 역시 최근 영상 생성 AI 모델인 '비오(Veo)'를 기업 고객 대상으로 제공하기 시작했다. 기업 고객의 AI 모델 학습·배포와 AI 앱 개발을 지원하는 '버텍스 AI'를 통해 활용할 수 있다. 런웨이·루마랩스 등 스타트업들도 일찌감치 관련 모델을 출시했다.
중국 기업들의 움직임도 눈에 띈다. 지난 6월 콰이쇼우가 '클링(Kling)'을 출시한 것이 대표적이다. 클링은 출시 당시 1080p 해상도로 무려 2분에 달하는 영상 생성이 가능하다는 점에서 주목받았다. 스타트업인 센슈AI는 지난 4월 '소라'에 이어 두 번째로 영상 생성 AI인 '비두(Vidu)'를 공개한 뒤 8월에 글로벌 출시했다. 4초·8초 분량의 영상 생성이 가능하다. 이외 '틱톡' 모회사인 바이트댄스가 지난 7월 '지멩AI'를 공개했고 알리바바 역시 지난 9월 텍스트 기반 영상 생성 기술을 발표하는 등 중국 빅테크 기업들도 관심이 크다.
영상 생성 AI가 우후죽순으로 생기면서 딥페이크 등 이를 악용하는 사례가 늘어날 것으로 우려된다. 이를 의식한듯 오픈AI는 '소라' 제작 영상에 AI가 만들었음을 알리는 워터마크를 추가했으며, 외부 레드팀(취약점을 발견해 AI 안전성·신뢰성을 검증하는 팀)과 협력해 딥페이크 방지를 위해 노력했다는 점을 강조했다. 오픈AI는 "허위 정보, 불법 콘텐츠, 안전 분야 등에서 레드팀과 협력해 모델을 엄격히 테스트했다"고 설명했다.