인스타그램·페이스북 모회사 메타가 사실적이고 개인화된 영상 생성과 세밀한 편집이 가능하고 소리까지 입혀주는 동영상 생성 인공지능(AI)을 선보였다. 발전한 기술만큼 과제도 만만치 않아 일반 이용자들이 직접 사용하기까지는 시간이 걸릴 예정이다.
메타는 4일(현지시간) 동영상 생성 AI 모델 ‘무비 젠’을 공개했다. 텍스트로 요청하면 최대 16초 길이의 동영상을 만들 수 있다. 전반적인 품질, 동작, 자연스러움, 일관성 측면에서 오픈AI의 ‘소라’, 런웨이의 ‘젠3’ 등 경쟁사 모델보다 우수하다고 회사는 설명했다.
무비 젠은 동영상을 만들어주는 것을 넘어 기존 영상을 요청대로 편집해주는 기능이 있다. 예를 들어 영상 속 강아지에게 옷을 입히거나 털 색깔을 바꾸거나 배경을 고풍스러운 정원으로 변경할 수 있다. 사진을 사용해 실제 인물이 등장하는 맞춤형 동영상을 만들 수도 있다. ‘절벽과 사람을 향해 비가 쏟아지고 배경에선 음악이 흐른다’와 같은 요청을 관련 영상과 함께 제시하면 그에 걸맞은 빗소리와 음악이 들어간 배경음을 제작해준다. 회사는 “라이선스가 있는 데이터세트와 공개적으로 사용 가능한 데이터세트를 조합해 모델을 훈련했다”고 전했다.
영상까지 만들어주는 AI의 등장에 영화를 비롯한 관련 업계 종사자들은 AI가 자신의 작업에 어떤 영향을 미칠지를 우려하고 있다. 메타는 “생성형 AI가 창작자의 작업을 대체하는 것은 아니라는 점을 아는 것이 중요하다”며 영화 제작자와 창작자들의 피드백을 꾸준히 반영하겠다고 했다.
곧바로 대중이 무비 젠을 써볼 수 있는 건 아니다. 무비 젠은 일부 내부 직원과 영화 제작자를 포함한 소수의 외부 파트너에게만 우선 제공된다. 메타는 내년에 자사 애플리케이션(앱)에 무비 젠을 탑재할 계획이다.
메타의 최고제품책임자인 크리스 콕스는 스레드에 “아직 비용이 많이 들고 생성 시간이 너무 길기 때문에 아직은 제품으로 출시할 준비가 되지 않았다”면서도 “결과가 상당히 인상적이어서 현재 상황을 공유하고 싶었다”고 적었다.
생성형 AI 제품 담당 부사장인 코너 헤이즈도 “현재 비디오 생성에 수십분이 걸린다”며 휴대폰으로 AI를 사용할 일반 소비자들에겐 너무 긴 시간이라고 블룸버그통신에 말했다. 안전과 책임 문제도 해결하고 있다고 언급했다. 인물 사진을 이용한 영상 생성 기능을 제공하기 위해선 딥페이크 악용을 방지하는 장치가 필수적이다.
경쟁사들의 행보도 차이를 보인다. 지난 2월 최대 60초 분량의 영상을 생성하는 ‘소라’를 공개한 오픈AI 역시 출시는 하지 않은 상태다. 영상 생성 시간이 너무 길고 품질이 들쭉날쭉한 문제를 해결하고자 성능 향상에 집중하고 있는 것으로 알려졌다. 구글도 5월 선보인 ‘비오’를 미국 거주 18세 이상 이용자 일부에게 시범적으로 제공하고 있다. 현재 미국 AI 스타트업 런웨이(젠), 루마(드림머신), 피카랩스(피카), 중국 동영상 플랫폼 콰이쇼우(클링) 등은 서비스를 출시해 운영 중이다.