릴리즈아티클커뮤니티
아티클 목록
VercelVercel기술 블로그engineering

AI Gateway를 활용한 영상 생성

AI Gateway로 앱에 영상 생성 기능을 통합하세요. 제품 영상, 동적 콘텐츠, 마케팅 에셋을 대규모로 제작할 수 있습니다.

원본 링크

AI Gateway에서 비디오 생성을 지원합니다. 실사 수준의 시네마틱 영상 제작, 오디오 동기화, 일관된 아이덴티티를 유지하는 맞춤형 콘텐츠 생성까지—모두 AI SDK 6 하나로 가능합니다.

시작하는 두 가지 방법

비디오 생성은 현재 베타로, Pro 및 Enterprise 플랜과 유료 AI Gateway 사용자에게 제공됩니다.

  • AI SDK 6: 텍스트·이미지 생성과 동일한 인터페이스로 비디오를 프로그래밍 방식으로 생성할 수 있습니다. 하나의 API, 하나의 인증 흐름, 하나의 옵저버빌리티 대시보드로 전체 AI 파이프라인을 관리하세요.

  • AI Gateway Playground: 각 모델 페이지에 내장된 AI Gateway playground에서 코드 없이 비디오 모델을 자유롭게 실험해 보세요. 프로바이더를 비교하고, 프롬프트를 조정하고, 결과물을 다운로드할 수 있습니다. 모델 목록에서 원하는 비디오 생성 모델을 클릭하면 바로 접근할 수 있습니다.

4개 비디오 모델, 17가지 변형

  • xAI의 Grok Imagine은 빠른 속도와 뛰어난 지시 따르기가 강점입니다. 스타일 트랜스퍼를 활용한 비디오 생성과 편집을 몇 초 만에 처리합니다.

  • Alibaba의 Wan은 레퍼런스 기반 생성과 멀티샷 스토리텔링에 특화되어 있으며, 장면 간 아이덴티티를 일관되게 유지합니다.

  • Kling은 이미지-투-비디오 변환과 네이티브 오디오에 강합니다. 최신 3.0 모델은 자동 장면 전환이 포함된 멀티샷 비디오를 지원합니다.

  • Google의 Veo는 높은 시각적 충실도와 물리 사실성이 돋보입니다. 시네마틱 조명과 물리 표현을 갖춘 네이티브 오디오 생성을 지원합니다.

비디오 요청의 이해

비디오 모델은 단순히 원하는 장면을 묘사하는 것만으로는 충분하지 않습니다. 이미지 생성과 달리, 비디오 프롬프트에는 모션 큐(카메라 움직임, 객체 동작, 타이밍)와 선택적으로 오디오 지시를 포함할 수 있습니다. 각 프로바이더는 providerOptions를 통해 서로 다른 기능을 제공하며, 이를 통해 근본적으로 다른 생성 모드를 활용할 수 있습니다. 모델별 옵션은 문서를 참고하세요.

생성 유형

AI Gateway에서 현재 지원하는 비디오 생성 유형은 4가지입니다:

유형

입력

설명

활용 사례

텍스트-투-비디오

텍스트 프롬프트

장면을 묘사하면 비디오 생성

광고 크리에이티브, 설명 영상, 소셜 콘텐츠

이미지-투-비디오

이미지, 텍스트 프롬프트(선택)

정지 이미지에 모션을 부여하여 애니메이션화

제품 쇼케이스, 로고 리빌, 사진 애니메이션

첫 프레임·끝 프레임

이미지 2장, 텍스트 프롬프트(선택)

시작과 끝 상태를 지정하면 모델이 중간 과정을 생성

비포/애프터 리빌, 타임랩스, 전환 효과

레퍼런스-투-비디오

이미지 또는 비디오

레퍼런스 이미지나 비디오에서 캐릭터를 추출하여 새로운 장면에 배치

대변인 콘텐츠, 일관된 브랜드 캐릭터

AI Gateway에서 제공하는 각 모델 제작사별 현재 지원 기능은 다음과 같습니다:

모델 제작사

지원 기능

xAI

텍스트-투-비디오, 이미지-투-비디오, 비디오 편집, 오디오

Wan

텍스트-투-비디오, 이미지-투-비디오, 레퍼런스-투-비디오, 오디오

Kling

텍스트-투-비디오, 이미지-투-비디오, 첫 프레임·끝 프레임, 오디오

Veo

텍스트-투-비디오, 이미지-투-비디오, 오디오

텍스트-투-비디오

원하는 내용을 텍스트로 묘사하면 비디오가 생성됩니다. 모델이 시각, 모션, 그리고 선택적으로 오디오까지 처리합니다. 간단한 텍스트 프롬프트만으로 실사에 가까운 프로덕션 수준의 영상을 만들 수 있습니다.

예시: 대규모 프로그래밍 방식의 비디오 생성. 앱, 플랫폼, 콘텐츠 파이프라인에서 온디맨드로 비디오를 생성하세요. 라이선스 비용이나 프로덕션 과정 없이, 프롬프트만 입력하면 결과물이 나옵니다.

이 예시에서는 klingai/kling-v2.6-t2v를 사용하여 텍스트 프롬프트에 화면 비율과 길이를 지정해 비디오를 생성합니다.

예시: 크리에이티브 콘텐츠 생성. 간단한 프롬프트 하나로 소셜 미디어, 광고, 스토리텔링에 활용할 수 있는 완성도 높은 영상 클립을 만들어 보세요. 자연스러운 모션과 시네마틱 퀄리티를 갖추고 있습니다.

구체적이고 상세한 프롬프트를 설정하면, google/veo-3.1-generate-001가 풍부한 디테일과 정확한 모션이 담긴 비디오를 생성합니다.

이미지-투-비디오

시작 이미지를 제공하면 이를 애니메이션으로 변환합니다. 초기 구도를 직접 설정하고, 모션 생성은 모델에 맡기세요.

예시: 제품 이미지 애니메이션화. 기존 제품 사진을 인터랙티브 비디오로 변환할 수 있습니다.

klingai/kling-v2.6-i2v 모델은 이미지 URL과 프롬프트에 포함된 모션 설명을 기반으로 제품 이미지를 애니메이션화합니다.

예시: 일러스트레이션 애니메이션. 정적인 아트워크에 은은한 모션을 더해 생동감을 불어넣으세요. 테마 콘텐츠나 대규모 마케팅에 적합합니다.

예시: 라이프스타일 및 제품 포토그래피. 음식, 음료, 라이프스타일 사진에 미세한 움직임을 추가하여 소셜 콘텐츠로 활용하세요.

여기서는 커피 사진에 조명 방향과 세밀한 디테일을 적용하여 더욱 인터랙티브한 비디오로 렌더링합니다.

첫 프레임·끝 프레임

시작과 끝 상태를 정의하면, 모델이 둘 사이의 매끄러운 전환 영상을 생성합니다.

예시: 비포/애프터 리빌. 의상 교체, 제품 비교, 시간 경과에 따른 변화 등—이미지 2장을 업로드하면 자연스러운 전환 영상을 얻을 수 있습니다.

이 예시에서는 프롬프트와 프로바이더 옵션에 두 장의 이미지를 사용하여 시작과 끝 상태를 정의합니다.

klingai/kling-v3.0-i2v를 사용하면 image에 시작 프레임을, lastFrameImage에 끝 프레임을 지정할 수 있습니다. 모델이 두 프레임 사이의 전환을 자동으로 생성합니다.

레퍼런스-투-비디오

인물이나 캐릭터의 레퍼런스 비디오 또는 이미지를 제공하면, 모델이 외형과 목소리를 추출하여 일관된 아이덴티티를 유지하는 새로운 장면을 생성합니다.

이 예시에서는 강아지 레퍼런스 이미지 2장을 사용하여 최종 비디오를 생성합니다.

alibaba/wan-v2.6-r2v-flash를 활용하면 프롬프트 내에서 모델이 특정 인물이나 캐릭터를 참조하도록 지시할 수 있습니다. Wan에서는 멀티 레퍼런스-투-비디오에서 최적의 결과를 얻기 위해 프롬프트에 character1, character2 등을 사용하는 것을 권장합니다.

비디오 편집

스타일 트랜스퍼로 기존 비디오를 변환할 수 있습니다. 비디오 URL을 제공하고 원하는 변환 내용을 묘사하면, 모델이 원본 모션을 유지하면서 새로운 스타일을 적용합니다.

여기서는 xai/grok-imagine-video이 이전에 생성한 비디오를 소스로 활용하여 수채화 스타일로 편집합니다.

시작하기

비디오 모델의 추가 예시와 상세 설정 옵션은 비디오 생성 문서를 참고하세요. 비디오 생성 퀵 스타트에서 간단한 시작 스크립트도 확인할 수 있습니다.

아래 각 비디오 모델의 체인지로그에서 더 자세한 예시와 프롬프트를 확인해 보세요.