상세 컨텐츠

본문 제목

OpenAI 생성형 동영상(text-to-video model) 모델 'Sora' 공개

전략_경영/AI트랜스포메이션

by Marketcast 2024. 2. 16. 09:51

본문

OpeAI가 텍스트 비디오를 만들 수 있는 생성형 동영상 서비스 'Sora'를 공개하였다. 텍스트 비디오 모델(text-to-video model)인 Sora는 만들고자 하는 영상을 텍스트로 입력하면 최대 1분 길이의 동영상을 생성할 수 있다.  

Sora는 여러 캐릭터, 특정 유형의 동작, 피사체와 배경의 정확한 디테일이 포함된 복잡한 장면을 생성할 수 있다. 이 모델은 사용자가 프롬프트(Prompt)에서 요청한 내용 뿐만 아니라 실제 세계에 이러한 사물이 어떻게 존재하는지도 이해한다.

이 모델은 언어에 대한 깊은 이해를 바탕으로 프롬프트를 정확하게 해석하고 생동감 넘치는 감정을 표현하는 매력적인 캐릭터를 생성할 수 있다. 또한 Sora는 하나의 동영상 내에서 캐릭터와 시각적 스타일을 정확하게 유지하는 여러 장면을 생성할 수 있다.

Sora는 정적 노이즈(static noise)처럼 보이는 동영상으로 시작하여 여러 단계에 걸쳐 노이즈를 제거하여 점차적으로 변환하는 diffusion model로, 동영상을 생성한다.Sora는 전체 동영상을 한 번에 생성하거나 생성된 동영상을 확장하여 더 길게 만들 수 있다. 모델에 한 번에 여러 프레임을 예측할 수 있는 기능을 제공함으로써 피사체가 일시적으로 시야에서 사라져도 동일하게 유지되도록 하는 까다로운 문제를 해결했다.

(Prompt: Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance creates a warm glow, the low camera view is stunning capturing the large furry mammal with beautiful photography, depth of field)

상세내용 보기 

 

OpenAI 생성형 동영상(text-to-video model) 모델 'Sora' 공개

OpeAI가 텍스트 비디오를 만들 수 있는 생성형 동영상 서비스 'Sora'를 공개하였다. 텍스트 비디오 모델(text-to-video model)인 Sora는 만들고자 하는 영상을 텍스트로 입력하면 최대 1분 길이의 동영상을

contents.premium.naver.com

 

관련글 더보기

댓글 영역