비주얼 스토리텔링(Visual Storytelling)은 유튜브 롱폼, 쇼츠(Shorts), 쇼핑 영상의 기획부터 대본 작성, AI 이미지/동영상 생성, 음성(TTS) 합성, 그리고 최종 영상 편집까지 한 번에 처리할 수 있는 올인원 자동화 도구입니다.
이 가이드는 사용자가 해당 기능을 100% 활용할 수 있도록, 기초 설정부터 고급 자동화 기능까지 단계별로 상세하게 설명합니다.
비주얼 스토리텔링

1. 시작하기 전 준비 사항

비주얼 스토리텔링 기능을 원활하게 사용하기 위해서는 설정 탭에서 다음 항목들이 올바르게 입력되어 있어야 합니다.

  • 구글 Gemini API Key (필수): 대본 작성 및 기본 AI 이미지 생성에 사용됩니다. 무료 키도 가능하지만, 안정적인 대량 작업을 위해 유료 계정 연동을 권장합니다.
  • Gemini Gems / Whisk URL (선택): 고퀄리티 이미지를 생성하려면 구글의 Gemini Gems나 Labs Whisk URL을 설정에 등록해야 합니다.
  • 유튜브 API (선택): 완성된 영상을 바로 업로드하려면 설정 탭의 Tube-Connect 섹션에서 API Key와 Client ID를 입력해야 합니다.
  • 관리자/유료 인증: 일부 고급 자동화(전체 자동 생성 등) 기능은 관리자 또는 유료 인증이 필요할 수 있습니다.

2. STEP 1: 주제 선정 및 기획 (자동 추천 활용)

아이디어가 떠오르지 않을 때, AI가 트렌디한 주제를 제안해 줍니다.


  1. 유튜브 탭 이동: 확장 프로그램 탭 메뉴에서 유튜브를 클릭합니다.
  2. 모드 선택:
    • 롱폼: 10분 내외의 서사가 있는 콘텐츠 (정보, 미스터리, 다큐 등).
    • 숏폼: 60초 이내의 짧고 강렬한 콘텐츠 (후킹, 반전 중심).
    • 쇼핑 숏폼: 상품 판매 및 홍보를 위한 구매 전환 유도 콘텐츠.
  3. 주제 카테고리 선택: 드롭다운 메뉴에서 '미스터리/공포', '경제/재테크', '요리/레시피' 등 원하는 분야를 선택합니다.
  4. 추천받기 클릭: 추천받기 버튼을 누르면 하단에 AI가 분석한 10개의 추천 주제 칩(Chip)이 생성됩니다.
  5. 주제 적용: 마음에 드는 주제 칩을 클릭하면, 자동으로 주제 입력란에 텍스트가 채워집니다.
  6. 현재 페이지 내용 가져오기: 밴치마킹 하고 싶은 사이트에 접속후 누르시면 내용을 크롤링하여 가져옵니다.

3. STEP 2: 스토리 및 프롬프트 생성

선정된 주제를 바탕으로 전체 스토리 라인과 장면별 AI 프롬프트를 생성합니다.

[주제 및 참고 자료 입력]

  • 주제 입력: 직접 입력하거나 추천받은 주제를 사용합니다.
  • 참고 자료 (선택): 특정 뉴스 기사나 블로그 글을 바탕으로 영상을 만들고 싶다면, 📄 현재 페이지 내용 가져오기 버튼을 눌러 현재 보고 있는 웹페이지의 텍스트를 크롤링해 입력할 수 있습니다.

[스토리 & 프롬프트 생성]

  • 🎨 스토리 & 프롬프트 생성 버튼을 클릭합니다.
  • AI가 서론-본론-결론(롱폼) 또는 후킹-전개-CTA(숏폼) 구조에 맞춰 [순서, 핵심 내용, 대사, AI 프롬프트]가 담긴 테이블을 생성합니다.
  • 사이드바(패널)가 열리며 결과가 표시됩니다.
💡 팁: 생성된 프롬프트가 마음에 들지 않는다면, 상단의 프롬프트 재생성 기능을 통해 구조를 변경하거나 내용을 다듬을 수 있습니다. 또한, 테이블 내의 텍스트를 직접 클릭하여 수정(Content Editable)할 수 있습니다.


4. STEP 3: 캐릭터 및 스타일 설정 (일관성 유지)

영상의 퀄리티를 높이기 위해 등장인물(캐릭터)의 일관성을 유지하는 것이 중요합니다. Gems 캐릭터 모델 설정 기능을 활용하세요.

[캐릭터 모델 생성/지정]

  • 프리셋 선택: '웹툰형', '픽사 스타일', '실사 한국인' 등 20여 가지 프리셋 중 하나를 선택하거나 직접 프롬프트를 입력합니다.
  • AI 생성: ⚡ API 생성 버튼을 누르면 즉시 캐릭터 이미지를 생성합니다.
  • Web 생성: 🌐 Web 생성 버튼을 누르면 Gemini 웹사이트를 통해 고화질 캐릭터를 생성하고 가져옵니다.
  • 파일/클립보드: 이미 가지고 있는 캐릭터 이미지가 있다면 📁 파일이나 📋 붙여넣기를 통해 등록합니다.


[대표 이미지 자동 적용]

  • 참고 자료를 크롤링했을 때 본문에 이미지가 있다면, 대표 이미지 토글을 켜서 해당 이미지를 캐릭터 모델로 자동 지정할 수 있습니다.
  • 효과: 이렇게 설정된 캐릭터 모델은 이후 모든 장면 생성 시 참조 이미지(Reference Image)로 함께 전송되어, 캐릭터의 얼굴이나 복장이 바뀌지 않도록 유지해줍니다.

5. STEP 4: 이미지 및 동영상 생성 (핵심 자동화)

비주얼 스토리텔링의 핵심 기능입니다. 테이블의 각 행(장면)에 맞는 시각 자료를 생성합니다.

A. 생성 방식 선택 (버튼 종류)

  • ⚡ API 생성: 가장 빠릅니다. Gemini API를 사용하여 즉시 이미지를 생성합니다.
  • 🌐 Gems 생성: 사전에 설정한 'Gemini Gems' 웹페이지를 통해 고퀄리티 이미지를 생성하고 자동으로 가져옵니다.
  • 🧪 위스크(Whisk) 생성: 구글 Labs의 Whisk 도구를 이용하여 스타일이 반영된 이미지를 생성합니다.
  • 🎬 그록(Grok) 동영상: 생성된 이미지를 기반으로 'Grok(그록)' AI를 통해 짧은 동영상을 생성합니다.

B. 전체 자동화 (일괄 작업)

  • 💎 Gems 전체 이미지: 모든 장면의 이미지를 Gems를 통해 순차적으로 생성합니다.
  • 🧪 위스크 전체 이미지: 모든 장면을 Whisk 스타일로 생성합니다.
  • 🎬 그록 전체 동영상: 모든 장면을 일괄적으로 그록에 전송하여 동영상으로 변환합니다.
  • 💎 Gems + 🎬 그록 (최강 콤보): [이미지 생성 -> 다운로드 -> 동영상 생성 -> 다운로드]까지의 모든 과정이 전자동으로 이루어집니다. 가장 추천하는 기능입니다.
📍 드래그 앤 드롭 지원: 외부에서 가져온 파일이 있다면 테이블의 이미지 영역으로 직접 드래그 앤 드롭하여 적용 가능합니다.

6. STEP 5: AI 성우(TTS) 더빙 및 오디오 설정

  • 성우 선택: 🗣️ AI 성우 선택 드롭다운에서 Zephyr, Puck 등 자연스러운 보이스를 선택합니다.
  • 감정별 스타일: '슬픔', '공포', '뉴스 앵커' 등 상황에 맞는 연기톤을 선택할 수 있습니다.
  • 개별 재생/저장: 테이블의 대사 열에 있는 🔊 재생 버튼을 누르면 즉시 미리듣기 및 저장이 가능합니다.
  • 전체 음성 저장: 📥 전체 음성 저장 버튼 클릭 시 모든 대사를 순차 변환하여 .wav 파일로 다운로드합니다.



7. STEP 6: 영상 변환, 병합 및 편집

  1. 방법 1 (자체 렌더링): [🎬 동영상 변환] 클릭. 캔버스 기능을 이용해 '줌인/줌아웃' 효과와 자막 바를 입혀 .webm 영상으로 렌더링합니다.
  2. 방법 2 (그록 병합): [🎞️ 그록 영상 합치기] 클릭. 개별 동영상 클립들을 FFmpeg를 이용해 하나의 긴 영상(merged.mp4)으로 병합합니다.
  3. 방법 3 (전용 편집기): [🎬 영상 편집기 열기] 클릭. 타임라인에서 싱크 조절 및 최종 MP4 내보내기가 가능합니다.

8. 고급 기능 및 팁

  • 스피치 타임(Speech Time) 연동: 상단의 ⏱️ 예상 대사 길이 배지를 클릭하면 전체 대사가 복사되고 자동으로 길이 예측 사이트가 열립니다.
  • CapCut(캡컷) 오토 싱크: ✂️ CapCut 자동화 메뉴로 draft_content.json 파일을 생성해 캡컷 프로젝트에 덮어씌우면 즉시 완성된 타임라인을 얻습니다.
⚠️ 주의사항: 작업이 끝나면 '저장소 초기화'를 해주세요. 

9. 🛍️ 쇼핑 숏폼 치트키: 상품 URL 하나로 영상 만들기

쇼핑몰 셀러나 제휴 마케터에게 가장 강력한 기능입니다. 복잡한 프롬프트 입력 없이, 판매 중인 상품 페이지의 내용과 사진을 그대로 가져와 AI 모델로 설정하고, 일관된 상품이 등장하는 숏폼 영상을 제작할 수 있습니다.

📌 프로세스 미리보기
상품 페이지 크롤링 ➔ 대표 이미지 모델 설정 ➔ 쇼핑 숏폼 스토리 생성 ➔ 상품이 등장하는 영상 완성

🚀 상세 진행 방법

1단계: 상품 정보 가져오기 (크롤링)

  • 브라우저의 현재 탭을 판매하고 싶은 상품 상세 페이지(스마트스토어, 쿠팡 등)로 맞춰놓습니다.
  • 📄 현재 페이지 내용 가져오기 버튼을 클릭합니다.
  • 작동 원리: AI가 현재 페이지의 '상품명', '상세 설명', '대표 이미지'를 자동으로 분석합니다.
  • 결과: '참고 자료' 입력란에 상품의 핵심 소구점(USP)이 정리되어 입력됩니다.

2단계: 상품을 '주연 배우'로 만들기 (모델 설정)

  • 크롤링 완료 후 Gems 캐릭터 모델 설정 영역의 토글 스위치를 ON으로 켭니다.
  • 핵심 기능: 크롤링된 데이터에서 '상품의 대표 누끼컷'을 찾아 자동으로 캐릭터 모델로 등록합니다.
  • 효과: 이후 생성되는 모든 장면에서 해당 상품 이미지가 일관되게 등장합니다.

3단계: 쇼핑 전용 스토리 생성

  • 모드 선택에서 쇼핑 숏폼을 선택합니다. (문제 제기 - 상품 등장 - 해결/시연 - 구매 유도 구조)
  • 🎨 스토리 & 프롬프트 생성 버튼을 클릭합니다.
  • 결과 확인: 상품 장점을 극대화하는 대본과 장면 묘사 프롬프트가 포함된 스토리보드가 완성됩니다.

10. 🔍 [심화] 결과 테이블의 4대 핵심 기능 완벽 해부

생성된 결과 테이블의 헤더(맨 윗줄) 버튼을 활용하면 작업 시간을 1/10로 단축할 수 있습니다.


기능명 상세 설명 및 활용 방법
① 📋 불러오기 (Load) 외부 대본 완벽 연동
- 엑셀, 메모장, 챗GPT의 표 데이터를 복사해 붙여넣으면 즉시 스토리보드로 변환.
- 지원 형식: 엑셀 셀 복사, 마크다운 표, 웹 테이블 등.
② 📥 전체 이미지 삽입 외부 이미지 일괄 적용
- 미드저니 등에서 만든 파일을 숫자 순서(01, 02...)대로 자동 매칭 삽입.
- 사용법: 이미지 다중 선택 후 열기 클릭 시 각 행에 자동 배치.
③ 📥 전체 음성 저장 TTS 일괄 추출
- 모든 행의 대사를 개별 .wav 파일로 자동 다운로드.
- 팁: 내장 편집기 타임라인에도 오디오가 자동으로 싱크될 준비를 마침.
④ 📥 전체 이미지 저장 결과물 백업 및 외부 편집용
- 생성된 모든 이미지를 고화질 PNG로 일괄 다운로드.
- 프리미어 프로나 캡컷으로 가져가서 작업할 때 필수 기능.

© 2026 AI 키워드 마스터 - All Manual Content Included.