SLATE: il sistema di produzione video AI di MaiDreamsLab
Deep dive sul sistema SLATE in 5 fasi (Script, Layout, Assets, Timing, Export). Metodologia + tool desktop Python/SQLite per portare disciplina di set sui modelli AI.
Founder · AI Visual Specialist
SLATE � il sistema di produzione video AI proprietario di MaiDreamsLab, organizzato in 5 fasi � Script, Layout, Assets, Timing, Export � pensato per portare disciplina di set sui modelli generativi. � sia una metodologia (le 5 fasi documentate in questo articolo) sia un tool desktop standalone Python + SQLite che codifica le fasi in workflow tecnico.
Questo articolo � il deep dive su come usiamo SLATE internamente. Per la versione executive summary vai sulla pagina metodologia. Per i risparmi di tempo verificati vai sulla proof page.
Perch� un sistema nominato e non un “usiamo l’AI”
SLATE nasce da un problema concreto e ripetibile: centinaia di immagini sparse, prompt persi, nessuna continuit� visiva. � esattamente la situazione che vive chiunque provi a fare produzione AI senza struttura. Modelli potentissimi ti restituiscono migliaia di asset bellissimi e inutilizzabili � perch� non sono tracciati, non sono lockati, non sono organizzati in una sequenza.
SLATE risolve questi tre problemi:
- Tracciabilit� � ogni shot ha un ID, ogni prompt � salvato e ricostruibile
- Consistency � character/location/prop sono reference image lockate, applicate automaticamente
- Continuit� � la timeline pre-assembly mostra il ritmo prima della generazione finale
� stato sviluppato da Gianni Spezzano integrando 15 anni di filiera cinematografica italiana (Gomorra, Pesci Piccoli/The Jackal, cortometraggi premiati) con i tool generativi 2024-2026. La struttura in 5 fasi non � teorica: � il prodotto di mesi di lavoro su progetti reali (Il Fabbricante di Mondi, Vito Mellusso, Theter Spec Spot) che hanno definito il workflow.
Phase 1 � Script: dalla sceneggiatura al breakdown shot-by-shot
Obiettivo: trasformare una sceneggiatura tradizionale in un breakdown tecnico machine-readable. Componente core di SLATE: Script Converter. Output: struttura shot-by-shot con metadati tecnici.
Lo Script Converter � il primo componente di SLATE che incontri. Importa una sceneggiatura in formato standard (Fountain, Final Draft, PDF) e la converte in:
- Lista scene con beat narrativi
- Breakdown shot-by-shot con metadati per ogni shot: lens suggerita, lighting mood, durata target, tag di sequenza
- Brief automatico per ogni shot che incolla in modo strutturato i parametri della scena nel prompt di generazione
Il salto qui rispetto al workflow “scrivi un prompt e vedi cosa esce” � enorme: passi da prompt artigianali e improvvisati a brief che ereditano automaticamente i parametri di scena (location, mood, character).
Phase 2 � Layout: generazione shot-by-shot con context
Obiettivo: generare il primo visual di ogni shot, con piena consapevolezza del context narrativo. Componente core: generazione AI integrata con shot ID e position. Output: prima passata visiva ready for review.
In Layout la generazione AI non � pi� “lanciamo prompt e vediamo”. Ogni shot � generato con consapevolezza di:
- Il suo shot ID univoco (es. SC03_SH07_dolly-in-protagonista)
- La sua posizione nella sequenza (cosa viene prima, cosa viene dopo)
- I reference asset gi� lockati nella fase Assets (anche se Assets formalmente arriva dopo, in pratica � gi� popolata dalle scene precedenti)
- Il prompt template ereditato dalla fase Script
Il risultato � che, anche se generi 100 shot in una sessione, ognuno � gi� nel posto giusto della sequenza, con prompt e parametri tracciati. Niente pi� cartelle “AI_test_v3_final_VERA.zip” piene di immagini di cui non ricordi pi� il prompt.
Phase 3 � Assets: la libreria che lock-a la consistency
Obiettivo: definire una volta sola i protagonisti visivi del progetto e applicarli automaticamente. Componente core: Assets library con reference linkage. Output: consistency cross-shot e cross-episode.
Assets � la fase che fa la vera differenza tra “esperimento generativo” e “produzione brand-safe”. Il workflow �:
- Definisci una volta ogni elemento ricorrente: il volto del protagonista, la location chiave, il prop simbolico, l’iconografia di brand. Per ognuno selezioni una o pi� reference image.
- Le reference vengono linkate agli shot che le richiedono.
- A ogni generazione successiva, le reference vengono passate automaticamente al modello (come image-to-video conditioning, IP-Adapter, LoRA � dipende dal modello).
Su Vito Mellusso, la nostra serie comica AI, questa fase ha permesso di mantenere il personaggio identico cross-episode senza dover fare fine-tuning custom per ogni puntata. Su Il Fabbricante di Mondi ha tenuto coerenti gli elementi fantasy del mondo narrativo.
Phase 4 � Timing: pre-assembly visivo
Obiettivo: vedere il film prima che esista, in forma di filmstrip orizzontale. Componente core: timeline view con 3 modalit� di visualizzazione (Technical, Visual Grid, Pre-Assembly). Output: approvazione del cut visivo prima della generazione massiva.
Timing � il momento in cui si corregge la regia. Dopo Layout hai un primo visual per ogni shot (anche solo una still frame). In Timing li metti tutti in fila in tre viste:
Visualization mode 01 � Technical Control
Tabella completa con tutti i shot, prompt, metadati. Per chi vuole avere il controllo tecnico totale.
Visualization mode 02 � Visual Grid
Griglia visiva di tutti gli shot. Quick scanning, selezione, comparison cross-sequenza.
Visualization mode 03 � Pre-Assembly
Filmstrip orizzontale che mostra gli shot in sequenza temporale, con la loro durata target. Vedi il ritmo, la continuit�, i gap narrativi prima di aver generato un singolo frame di video finale.
Questa fase � dove la maggior parte delle correzioni dovrebbe avvenire. Cambiare un shot in Pre-Assembly costa zero (uno still da ri-generare). Lo stesso cambio in fase di Export, dopo aver generato il video finale, costa giorni di re-generation.
Phase 5 � Export: pacchetti pronti per le piattaforme
Obiettivo: consegnare alla generazione video pacchetti ZIP organizzati, machine-readable. Componente core: export engine con API integration o pacchetti manuali. Output: ZIP per shot ID + motion prompts ready, o direct API call.
Export � dove SLATE si interfaccia con le piattaforme video. Due modalit�:
Direct API integration
Per i tool che hanno API attive (oggi: Google Gemini integrato; altri in roadmap), SLATE passa direttamente i prompt di motion + le reference image alla piattaforma, senza intermediari.
ZIP package export
Per i tool senza API attiva (oggi: Veo, Kling, Luma, Runway via interfaccia web), SLATE produce un ZIP organizzato:
- Una cartella per shot ID
- Reference image incluse
- Motion prompt scritto e pronto da incollare
- Metadati tecnici (durata target, mood, lens)
L’operatore prende il pacchetto, lo carica sulla piattaforma, processa, e rimette i video finali nella cartella dello shot. Lineare, tracciabile, ricostruibile.
I 2 gate di approvazione formali
SLATE come metodologia di produzione (oltre che come tool) prevede 2 gate scritti:
| Gate | Quando | Cosa firma il cliente |
|---|---|---|
| Gate #1 | Fine Timing | Il pre-assembly visivo = la regia del film |
| Gate #2 | Fine Export + post | Master finale broadcast-ready |
Le revisioni dopo un gate sono billable extra. Quelle prima del gate sono incluse. Questo schema protegge sia il cliente (sa esattamente quando pu� cambiare) sia lo studio.
L’architettura tecnica di SLATE
Per chi � curioso:
Backend
Python standalone, SQLite local database, project isolation
Frontend
Web interface locale (gira sul desktop), 3 visualization mode, real-time preview
Integrazione
Personal API support (le tue chiavi), Google Gemini attivo, architettura espandibile
Export
ZIP organizzato per shot ID, motion prompt inclusi, platform-ready
Zero cloud
Tutto gira in locale � niente upload su server di terzi, niente lock-in proprietario
Zero cloud. Tutto gira in locale. Niente upload di immagini su server di terzi, niente lock-in su piattaforme proprietarie, pieno controllo sui dati.
Le tre regole non scritte di SLATE
Heuristic interne che usiamo da sempre:
Regola #1
Mai forzare uno shot debole nel cut finale. Se dopo 3-5 varianti generate non funziona, torna in Layout. Un cut con uno shot debole � un cut debole. Punto.
Regola #2
Mai bruciare compute prima del Gate #1. La generazione video massiva (la pi� costosa) inizia solo dopo che il pre-assembly visivo in Timing � approvato.
Regola #3 � Non negoziabile
La regia umana � non negoziabile. SLATE � un tool che amplifica il direttore. Non lo sostituisce. Ogni progetto ha un regista firmato responsabile delle scelte di linguaggio, taglio, sound.
SLATE come prodotto consulting
Oltre a essere il workflow interno di MaiDreamsLab, SLATE � disponibile in consulting per production company, agenzie e team enterprise. Il pacchetto consulting include:
- Onboarding del tool sul tuo team (1-2 giorni)
- Integrazione con il vostro workflow esistente
- Setup delle API personali (Gemini, e in roadmap altre piattaforme)
- Training su sceneggiatura ? Script Converter ? Layout ? Assets ? Timing ? Export
- Supporto per il primo progetto pilota
Se sei interessato a SLATE per il tuo team, scrivi qui. Per vederlo in azione, leggi i case studies.
In sintesi
~60%
risparmio di tempo documentato sulla produzione end-to-end vs filiera tradizionale
SLATE non � “il workflow magico”. � disciplina cinematografica tradotta in tool. � rigorosa in fase di Script e Timing per essere veloce in fase di Layout e Export. I gate formali proteggono cliente e studio. La pipeline elimina i tre dolori classici della produzione AI: prompt persi, asset incoerenti, nessuna continuit�.
Per applicarlo al tuo prossimo progetto, parliamone in una call diagnostica di 30 minuti.
Ultimo aggiornamento:
Hai un brief?
Prenota una call diagnostica gratuita di 30 minuti: ti diciamo se SLATE è applicabile al tuo progetto.
Prenota una call