시선뉴스=양원민 기자 / 디자인=김선희 proㅣ어릴적 상상했던 인공지능은 어땠는가? 현재의 인공지능 기술은 계속해서 기존의 데이터와 비교 학습하며 새로운 창작물까지 만들어낼 수 있는 ‘생성형AI’ 단계까지 왔는데, 이번에 ‘챗GPT’로 세상을 놀라게 했던 오픈AI사에서 ‘소라’(Sora)를 출시해 다시 한번 이목을 끌고 있다.

‘소라’(Sora)는 간단한 텍스트만으로 고화질의 동영상을 생성할 수 있는 ‘텍스트 투 비디오’(Text to Video·텍스트를 동영상으로 만드는)시스템이다. 또 기존의 이미지를 동영상으로 만들 수 있고, 기존의 동영상을 확장하거나 누락된 프레임도 채울 수 있다고 한다. ‘소라’는 일본어로 ‘하늘’을 뜻하는 단어로, 오픈AI는 해당 이름에 대해 무한한 잠재력을 의미한다고 밝혔다.

외에도 오픈AI는 “여러 캐릭터와 특정 유형의 동작, 복잡한 장면 등 최대 1분 길이의 동영상을 빠르게 제작할 수 있고, 언어에 대한 깊은 이해를 갖고 있어 프롬프트를 정확하게 해석하고 생생한 감정을 표현하는 매력적인 캐릭터를 생성할 수 있다”고 ‘소라’에 대해 설명하기도 했다.

‘소라’가 공개되며 ‘소라’를 이용해 만든 영상도 공개됐다. ‘눈밭을 달리는 매머드’나 ‘검은 가죽 재킷과 빨간색 원피스를 입은 여성이 간판이 가득한 도쿄 거리를 걷는 모습’ 등 텍스트가 그대로 구현된 다양한 영상이 함께 공개됐다.

다만, 소라는 아직 사용할 수 없다. 소라는 ‘제한된 수의 창작자’만 사용할 수 있도록 허용된 상태로 전문가팀에 맡겨 안전성 여부 등을 평가해야 하기 때문이다. 그래도 하반기부터는 이용할 수 있을 전망이다. 오픈AI 미라 무라티 최고기술책임자(CTO)는 지난 13일(현지시간) 게재된 월스트리트저널(WSJ)과의 인터뷰에서 “올해 (대중들이) 소라를 이용할 수 있을 것”이라며 “몇 달 후가 될 수도 있다”고 밝혔다.

한편, ‘소라’ 공개 이후 외신과 업계 전문가들은 ‘영상 제작의 혁명’이라는 찬사와 이러한 기술로 인한 피해가 확산할 수 있다는 우려를 동시에 내놓았다. 그래서 이를 방지하기 위해 각국에서 선거운동에 생성형 AI 기술을 활용한 영상을 금지하고 나섰다.

이러한 범세계적 우려에 무라티 CTO도 이를 방지하기 위한 정책을 적용한다고 했다. 무라티 CTO에 따르면 ‘소라’는 공인의 이미지는 생성할 수 없고, 만들어진 영상은 실제와 구별하기 위한 워터마크가 표시된다고 한다.

외에도 윤리적 문제가 남아있다. 노골적으로 폭력적인 콘텐츠는 필터링할 수 있지만, 나라·문화·시대·인종·종교 등 감지하고 필터링하기 어려운 편견이나 고정관념·차별 등이 존재하기 때문이다. 

사실 이런 ‘텍스트 투 비디오’ 기술이 처음 나온 것은 아니다. 앞서 페이스북 모회사인 메타(Meta)와 구글(Google) 등도 ‘텍스트 투 비디오’ 모델을 개발한 바 있다. 메타의 텍스트 투 비디오 AI 이름은 ‘메이크어 비디오’(Make-a-Video)고 구글의 프로그램은 ‘이매진 비디오’(Imagen Video)다. 하지만 이들도 이러한 문제들을 해결하지 못해 아직은 모델을 공개하지 않은 상태이다.

전문가들이 내다봤듯 영상의 시대에 살고 있는 우리에게 있어 ‘소라’는 많은 것을 바꿔놓을 전망이다. 이미 많은 것들이 AI로 대체되고 있는 세상에 우리의 자리를 잃지 않기 위해선 기술의 발전과 더불어 적절한 규제와 대책 등이 함께 마련되어야 할 것이다.

SNS 기사보내기
관련기사