VEO

https://aistudio.google.com/models/veo
VEO 는 구글 DeepMind 가 만든 AI 영상 생성 모델이다.
텍스트나 이미지를 입력하면 짧은 영상을 만들어주는 인공지능이다.
VEO 는 사용자가 프롬프트를 입력하면 그 설명에 맞는 영상을 생성한다.
또는 이미지를 넣고 프롬프트를 입력하여 영상 형태로도 사용할 수 있다.
VEO의 특징
- 텍스트로 영상 생성
원하는 장면 , 분위기 , 카메라 움직임 , 인물 행동을 글로 설명하면 영상을 생성한다. - 이미지 기반 영상 생성
정지 이미지를 업로드하고 , 그 이미지가 움직이는 짧은 영상으로 생성한다. - 소리까지 생성
VEO 3 부터는 영상뿐 아니라 효과음 , 배경음 , 대사 같은 네이티브 오디오 생성도 가능하다. - 짧은 클립 중심
Gemini API 문서 기준으로 VEO 3.1 은 고품질의 8초 영상을 생성하는 모델로 설명한다.
해상도는 720p , 1080p , 4K 옵션이 언급된다.
성공적인 프롬프트 4개 요소 ( SACA )
- Subject ( 피사체 ) : 무엇이 등장하는가?
- Action ( 행동 ) : 무엇을 하고 있는가?
- Atmosphere ( 분위기 ) : 배경과 느낌은?
- Camera ( 카메라 ) : 시점은?
Motion Bucket ID
영상의 역동성을 결정하는 가장 중요한 파라미터이다.
| 값 ( Value ) | 효과 | 추천 상황 |
| 10 ~ 50 | 매우 적은 움직임 | 배경 , 풍경 , 정적인 인물 |
| 100 ~ 127 ( 기본 ) | 적당한 움직임 | 일반적인 캐릭터 모션 , 머리카락 휘날림 |
| 180 이상 | 과격한 움직임 ( 깨질 수 있다 ) | 폭발 , 액션씬 , 카메라 급전환 |
결과물 저장 ( Output )
설정된 값들을 바탕으로 실제 영상을 연산하는 단계이다.
노이즈를 제거하며 이미지를 영상으로 만든다.

- Connect ( 연결 ) : 앞서 설정한 Generate 블록의 오른쪽 포트와 Output 블록을 연결한다.
- Layout ( 설정 ) : 출력 방식을 선택한다.
Manual Layout : 생성된 영상을 화면에 그대로 띄운다. - Run & Preview ( 실행 ) : 상단의 [ Preview ] 탭을 클릭하면 AI 가 영상을 생성하고 결과를 보여준다.
노드 기반 AI Advanced Features ( 고급 기능 )
더 전문적인 영상을 만들기 위한 3가지 핵심 기술
- Text - to - Video
이미지 없이 텍스트만으로 영상 생성 - Camera Control
Zoom , Pan , Tilt - Hight Quality
해상도 및 프레임 레이트 업스케일링