오픈AI가 이날 선보인 '소라 터보'는 텍스트-비디오 생성 AI 모델이다. 텍스트로 프롬프트(명령어)를 넣으면 이를 바탕으로 동영상을 만들어 준다. 최대 1분까지 영상 제작이 가능했던 기존 공개 버전보다 길이는 짧아졌지만, 생성 속도는 훨씬 빨라졌다. 이용자는 영상을 양옆으로 넓게 펼칠 수 있고, 수직이나 정사각형 비율 등도 가능하다. 기존 동영상을 확장하거나 빠진 프레임을 채우는 기능도 제공한다.
소라 터보는 챗GPT와 별도 사이트인 '소라닷컴'에서 사용 가능하다. 챗GPT 유료 이용자들을 대상으로 제공된다. 오픈AI에 따르면 월 22달러의 챗GPT 플러스 이용자는 1000크레딧(최대 50개 영상)이 제공되며 해상도 720p, 최대 5초까지만 생성할 수 있다. 월 200달러의 챗GPT 프로 이용자는 1만크레딧(최대 500개 영상)이 제공되며 1080p 해상도로 20초까지 생성 가능하다. 오픈AI는 내년 초 소라 관련 추가 요금제도 발표할 예정이다. 다만 유럽연합(EU)과 영국·스위스 등 유럽 국가는 이번에 출시 대상에서 제외됐다.
오픈AI는 그간 '소라'를 영화·음악 분야 일부 종사자 등 제한적인 인원들만 사용할 수 있도록 했다. 이번에 챗GPT 유료 구독자라면 누구나 사용할 수 있게 확장함으로써 향후 영상 생성 AI 시장 경쟁이 치열해질 전망이다. 메타와 구글 등 빅테크 기업들은 물론 AI 스타트업들도 올들어 영상 생성 AI를 쏟아내면서다.
중국 기업들의 움직임도 눈에 띈다. 지난 6월 콰이쇼우가 '클링(Kling)'을 출시한 것이 대표적이다. 클링은 출시 당시 1080p 해상도로 무려 2분에 달하는 영상 생성이 가능하다는 점에서 주목받았다. 스타트업인 센슈AI는 지난 4월 '소라'에 이어 두 번째로 영상 생성 AI인 '비두(Vidu)'를 공개한 뒤 8월에 글로벌 출시했다. 4초·8초 분량의 영상 생성이 가능하다. 이외 '틱톡' 모회사인 바이트댄스가 지난 7월 '지멩AI'를 공개했고 알리바바 역시 지난 9월 텍스트 기반 영상 생성 기술을 발표하는 등 중국 빅테크 기업들도 관심이 크다.
영상 생성 AI가 우후죽순으로 생기면서 딥페이크 등 이를 악용하는 사례가 늘어날 것으로 우려된다. 이를 의식한듯 오픈AI는 '소라' 제작 영상에 AI가 만들었음을 알리는 워터마크를 추가했으며, 외부 레드팀(취약점을 발견해 AI 안전성·신뢰성을 검증하는 팀)과 협력해 딥페이크 방지를 위해 노력했다는 점을 강조했다. 오픈AI는 "허위 정보, 불법 콘텐츠, 안전 분야 등에서 레드팀과 협력해 모델을 엄격히 테스트했다"고 설명했다.