SLATE: il sistema di produzione video AI di MaiDreamsLab

SLATE � il sistema di produzione video AI proprietario di MaiDreamsLab, organizzato in 5 fasi � Script, Layout, Assets, Timing, Export � pensato per portare disciplina di set sui modelli generativi. � sia una metodologia (le 5 fasi documentate in questo articolo) sia un tool desktop standalone Python + SQLite che codifica le fasi in workflow tecnico.

Questo articolo � il deep dive su come usiamo SLATE internamente. Per la versione executive summary vai sulla pagina metodologia. Per i risparmi di tempo verificati vai sulla proof page.

S � ScriptL � LayoutA � AssetsT � TimingE � Export

Perch� un sistema nominato e non un “usiamo l’AI”

SLATE nasce da un problema concreto e ripetibile: centinaia di immagini sparse, prompt persi, nessuna continuit� visiva. � esattamente la situazione che vive chiunque provi a fare produzione AI senza struttura. Modelli potentissimi ti restituiscono migliaia di asset bellissimi e inutilizzabili � perch� non sono tracciati, non sono lockati, non sono organizzati in una sequenza.

SLATE risolve questi tre problemi:

Tracciabilit� � ogni shot ha un ID, ogni prompt � salvato e ricostruibile
Consistency � character/location/prop sono reference image lockate, applicate automaticamente
Continuit� � la timeline pre-assembly mostra il ritmo prima della generazione finale

� stato sviluppato da Gianni Spezzano integrando 15 anni di filiera cinematografica italiana (Gomorra, Pesci Piccoli/The Jackal, cortometraggi premiati) con i tool generativi 2024-2026. La struttura in 5 fasi non � teorica: � il prodotto di mesi di lavoro su progetti reali (Il Fabbricante di Mondi, Vito Mellusso, Theter Spec Spot) che hanno definito il workflow.

Phase 1 � Script: dalla sceneggiatura al breakdown shot-by-shot

Obiettivo: trasformare una sceneggiatura tradizionale in un breakdown tecnico machine-readable. Componente core di SLATE: Script Converter. Output: struttura shot-by-shot con metadati tecnici.

Lo Script Converter � il primo componente di SLATE che incontri. Importa una sceneggiatura in formato standard (Fountain, Final Draft, PDF) e la converte in:

Lista scene con beat narrativi
Breakdown shot-by-shot con metadati per ogni shot: lens suggerita, lighting mood, durata target, tag di sequenza
Brief automatico per ogni shot che incolla in modo strutturato i parametri della scena nel prompt di generazione

Il salto qui rispetto al workflow “scrivi un prompt e vedi cosa esce” � enorme: passi da prompt artigianali e improvvisati a brief che ereditano automaticamente i parametri di scena (location, mood, character).

Phase 2 � Layout: generazione shot-by-shot con context

Obiettivo: generare il primo visual di ogni shot, con piena consapevolezza del context narrativo. Componente core: generazione AI integrata con shot ID e position. Output: prima passata visiva ready for review.

In Layout la generazione AI non � pi� “lanciamo prompt e vediamo”. Ogni shot � generato con consapevolezza di:

Il suo shot ID univoco (es. SC03_SH07_dolly-in-protagonista)
La sua posizione nella sequenza (cosa viene prima, cosa viene dopo)
I reference asset gi� lockati nella fase Assets (anche se Assets formalmente arriva dopo, in pratica � gi� popolata dalle scene precedenti)
Il prompt template ereditato dalla fase Script

Il risultato � che, anche se generi 100 shot in una sessione, ognuno � gi� nel posto giusto della sequenza, con prompt e parametri tracciati. Niente pi� cartelle “AI_test_v3_final_VERA.zip” piene di immagini di cui non ricordi pi� il prompt.

Phase 3 � Assets: la libreria che lock-a la consistency

Obiettivo: definire una volta sola i protagonisti visivi del progetto e applicarli automaticamente. Componente core: Assets library con reference linkage. Output: consistency cross-shot e cross-episode.

Assets � la fase che fa la vera differenza tra “esperimento generativo” e “produzione brand-safe”. Il workflow �:

Definisci una volta ogni elemento ricorrente: il volto del protagonista, la location chiave, il prop simbolico, l’iconografia di brand. Per ognuno selezioni una o pi� reference image.
Le reference vengono linkate agli shot che le richiedono.
A ogni generazione successiva, le reference vengono passate automaticamente al modello (come image-to-video conditioning, IP-Adapter, LoRA � dipende dal modello).

Su Vito Mellusso, la nostra serie comica AI, questa fase ha permesso di mantenere il personaggio identico cross-episode senza dover fare fine-tuning custom per ogni puntata. Su Il Fabbricante di Mondi ha tenuto coerenti gli elementi fantasy del mondo narrativo.

Phase 4 � Timing: pre-assembly visivo

Obiettivo: vedere il film prima che esista, in forma di filmstrip orizzontale. Componente core: timeline view con 3 modalit� di visualizzazione (Technical, Visual Grid, Pre-Assembly). Output: approvazione del cut visivo prima della generazione massiva.

Timing � il momento in cui si corregge la regia. Dopo Layout hai un primo visual per ogni shot (anche solo una still frame). In Timing li metti tutti in fila in tre viste:

Visualization mode 01 � Technical Control

Tabella completa con tutti i shot, prompt, metadati. Per chi vuole avere il controllo tecnico totale.

Visualization mode 02 � Visual Grid

Griglia visiva di tutti gli shot. Quick scanning, selezione, comparison cross-sequenza.

Visualization mode 03 � Pre-Assembly

Filmstrip orizzontale che mostra gli shot in sequenza temporale, con la loro durata target. Vedi il ritmo, la continuit�, i gap narrativi prima di aver generato un singolo frame di video finale.

Questa fase � dove la maggior parte delle correzioni dovrebbe avvenire. Cambiare un shot in Pre-Assembly costa zero (uno still da ri-generare). Lo stesso cambio in fase di Export, dopo aver generato il video finale, costa giorni di re-generation.

Phase 5 � Export: pacchetti pronti per le piattaforme

Obiettivo: consegnare alla generazione video pacchetti ZIP organizzati, machine-readable. Componente core: export engine con API integration o pacchetti manuali. Output: ZIP per shot ID + motion prompts ready, o direct API call.

Export � dove SLATE si interfaccia con le piattaforme video. Due modalit�:

Direct API integration

Per i tool che hanno API attive (oggi: Google Gemini integrato; altri in roadmap), SLATE passa direttamente i prompt di motion + le reference image alla piattaforma, senza intermediari.

ZIP package export

Per i tool senza API attiva (oggi: Veo, Kling, Luma, Runway via interfaccia web), SLATE produce un ZIP organizzato:

Una cartella per shot ID
Reference image incluse
Motion prompt scritto e pronto da incollare
Metadati tecnici (durata target, mood, lens)

L’operatore prende il pacchetto, lo carica sulla piattaforma, processa, e rimette i video finali nella cartella dello shot. Lineare, tracciabile, ricostruibile.

I 2 gate di approvazione formali

SLATE come metodologia di produzione (oltre che come tool) prevede 2 gate scritti:

Gate	Quando	Cosa firma il cliente
Gate #1	Fine Timing	Il pre-assembly visivo = la regia del film
Gate #2	Fine Export + post	Master finale broadcast-ready

Le revisioni dopo un gate sono billable extra. Quelle prima del gate sono incluse. Questo schema protegge sia il cliente (sa esattamente quando pu� cambiare) sia lo studio.

L’architettura tecnica di SLATE

Per chi � curioso:

Backend

Python standalone, SQLite local database, project isolation

Frontend

Web interface locale (gira sul desktop), 3 visualization mode, real-time preview

Integrazione

Personal API support (le tue chiavi), Google Gemini attivo, architettura espandibile

Export

ZIP organizzato per shot ID, motion prompt inclusi, platform-ready

Zero cloud

Tutto gira in locale � niente upload su server di terzi, niente lock-in proprietario

Zero cloud. Tutto gira in locale. Niente upload di immagini su server di terzi, niente lock-in su piattaforme proprietarie, pieno controllo sui dati.

Le tre regole non scritte di SLATE

Heuristic interne che usiamo da sempre:

Regola #1

Mai forzare uno shot debole nel cut finale. Se dopo 3-5 varianti generate non funziona, torna in Layout. Un cut con uno shot debole � un cut debole. Punto.

Regola #2

Mai bruciare compute prima del Gate #1. La generazione video massiva (la pi� costosa) inizia solo dopo che il pre-assembly visivo in Timing � approvato.

Regola #3 � Non negoziabile

La regia umana � non negoziabile. SLATE � un tool che amplifica il direttore. Non lo sostituisce. Ogni progetto ha un regista firmato responsabile delle scelte di linguaggio, taglio, sound.

SLATE come prodotto consulting

Oltre a essere il workflow interno di MaiDreamsLab, SLATE � disponibile in consulting per production company, agenzie e team enterprise. Il pacchetto consulting include:

Onboarding del tool sul tuo team (1-2 giorni)
Integrazione con il vostro workflow esistente
Setup delle API personali (Gemini, e in roadmap altre piattaforme)
Training su sceneggiatura ? Script Converter ? Layout ? Assets ? Timing ? Export
Supporto per il primo progetto pilota

Se sei interessato a SLATE per il tuo team, scrivi qui. Per vederlo in azione, leggi i case studies.

In sintesi

~60%

risparmio di tempo documentato sulla produzione end-to-end vs filiera tradizionale

SLATE non � “il workflow magico”. � disciplina cinematografica tradotta in tool. � rigorosa in fase di Script e Timing per essere veloce in fase di Layout e Export. I gate formali proteggono cliente e studio. La pipeline elimina i tre dolori classici della produzione AI: prompt persi, asset incoerenti, nessuna continuit�.

Per applicarlo al tuo prossimo progetto, parliamone in una call diagnostica di 30 minuti.