Generare video utilizzando Veo

Veo è il modello di generazione video ad alta fedeltà di Google, in grado di generare video in un'ampia gamma di stili cinematografici e visivi. Veo acquisisce le sfumature dei prompt per riprodurre dettagli complessi in modo coerente nei vari frame.

Questa guida mostra come generare video con Veo. Per suggerimenti sulla scrittura di prompt video, consulta la guida ai prompt di Veo.

Versioni di Veo

L'API Gemini offre due modelli di generazione di video: Veo 3 e Veo 2. Ti consigliamo di utilizzare Veo 3, l'ultimo modello, per la sua qualità superiore e la capacità di generare audio.

Veo 3 è disponibile in anteprima, il che potrebbe comportare limitazioni per l'uso in produzione su larga scala. Veo 2 è stabile e offre una migliore esperienza di produzione.

Per indicazioni dettagliate sulle differenze principali tra le funzionalità dei modelli, consulta la sezione Confronto tra le versioni dei modelli.

Generare video da testo

L'esempio di codice in questa sezione utilizza Veo 3 per generare video con audio integrato.

Python

import time
from google import genai
from google.genai import types

client = genai.Client()

operation = client.models.generate_videos(
    model="veo-3.0-generate-preview",
    prompt="Panning wide shot of a purring kitten sleeping in the sunshine",
    config=types.GenerateVideosConfig(
        person_generation="allow_all",  # "allow_adult" and "dont_allow" for Veo 2 only
        aspect_ratio="16:9",  # "16:9", and "9:16" for Veo 2 only
    ),
)

while not operation.done:
    time.sleep(20)
    operation = client.operations.get(operation)

for n, generated_video in enumerate(operation.response.generated_videos):
    client.files.download(file=generated_video.video)
    generated_video.video.save(f"video{n}.mp4")

JavaScript

import { GoogleGenAI } from "@google/genai";
import { createWriteStream } from "fs";
import { Readable } from "stream";

const ai = new GoogleGenAI({});

async function main() {
  let operation = await ai.models.generateVideos({
    model: "veo-3.0-generate-preview",
    prompt: "Panning wide shot of a purring kitten sleeping in the sunshine",
    config: {
      personGeneration: "allow_all",
      aspectRatio: "16:9",
    },
  });

  while (!operation.done) {
    await new Promise((resolve) => setTimeout(resolve, 10000));
    operation = await ai.operations.getVideosOperation({
      operation: operation,
    });
  }

  operation.response?.generatedVideos?.forEach(async (generatedVideo, n) => {
    const resp = await fetch(`${generatedVideo.video?.uri}&key=GEMINI_API_KEY`); // append your API key
    const writer = createWriteStream(`video${n}.mp4`);
    Readable.fromWeb(resp.body).pipe(writer);
  });
}

main();

Vai

package main

import (
  "context"
  "fmt"
  "os"
  "time"
  "google.golang.org/genai"
)

func main() {

  ctx := context.Background()
  client, err := genai.NewClient(ctx, nil)
  if err != nil {
      log.Fatal(err)
  }

  videoConfig := &genai.GenerateVideosConfig{
      AspectRatio:      "16:9",
      PersonGeneration: "allow_all",
  }

  operation, _ := client.Models.GenerateVideos(
      ctx,
      "veo-3.0-generate-preview",
      "Panning wide shot of a purring kitten sleeping in the sunshine",
      nil,
      videoConfig,
  )

  for !operation.Done {
      time.Sleep(20 * time.Second)
      operation, _ = client.Operations.GetVideosOperation(ctx, operation, nil)
  }

  for n, video := range operation.Response.GeneratedVideos {
      client.Files.Download(ctx, video.Video, nil)
      fname := fmt.Sprintf("video_%d.mp4", n)
      _ = os.WriteFile(fname, video.Video.VideoBytes, 0644)
  }
}

REST

# Use curl to send a POST request to the predictLongRunning endpoint.
# The request body includes the prompt for video generation.
curl "${BASE_URL}/models/veo-3.0-generate-preview:predictLongRunning" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -X "POST" \
  -d '{
    "instances": [{
        "prompt": "Panning wide shot of a purring kitten sleeping in the sunshine"
      }
    ],
    "parameters": {
      "aspectRatio": "16:9",
      "personGeneration": "allow_all",
    }
  }' | tee result.json | jq .name | sed 's/"//g' > op_name

# Obtain operation name to download video.
op_name=$(cat op_name)

# Check against status of operation.
while true; do
  is_done=$(curl -H "x-goog-api-key: $GEMINI_API_KEY" "${BASE_URL}/${op_name}" | tee op_check.json | jq .done)

  if [ "${is_done}" = "true" ]; then
    cat op_check.json
    echo "** Attach API_KEY to download video, or examine error message."
    break
  fi

  echo "** Video ${op_name} has not downloaded yet!  Check again after 5 seconds..."

  # Wait for 5 seoncds to check again.
  sleep 5

done

Gattino che dorme al sole.

L'esecuzione di questo codice richiede circa un minuto, anche se potrebbe richiedere più tempo se le risorse sono limitate. Al termine dell'esecuzione, dovresti vedere un video di un gattino che dorme, come quello che abbiamo qui.

Se visualizzi un messaggio di errore anziché un video, significa che le risorse sono limitate e la tua richiesta non è stata completata. In questo caso, esegui di nuovo il codice.

I video generati vengono memorizzati sul server per 2 giorni, dopodiché vengono rimossi. Se vuoi salvare una copia locale del video generato, devi eseguire result() e save() entro 2 giorni dalla generazione.

Generare video da immagini

Il seguente codice genera un'immagine utilizzando Imagen, quindi la utilizza come frame iniziale per il video generato.

Innanzitutto, genera un'immagine utilizzando Imagen:

Python

prompt="Panning wide shot of a calico kitten sleeping in the sunshine",

imagen = client.models.generate_images(
    model="imagen-3.0-generate-002",
    prompt=prompt,
    config=types.GenerateImagesConfig(
      aspect_ratio="16:9",
      number_of_images=1
    )
)

imagen.generated_images[0].image

JavaScript

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({});
const response = await ai.models.generateImages({
  model: "imagen-3.0-generate-002",
  prompt: "Panning wide shot of a calico kitten sleeping in the sunshine",
  config: {
    numberOfImages: 1,
  },
});

// you'll pass response.generatedImages[0].image.imageBytes to Veo

Vai

package main

import (
    "context"
    "fmt"
    "os"
    "time"
    "google.golang.org/genai"
)

func main() {

    ctx := context.Background()
    client, err := genai.NewClient(ctx, nil)
  if err != nil {
      log.Fatal(err)
  }

    config := &genai.GenerateImagesConfig{
        AspectRatio:    "16:9",
        NumberOfImages: 1,
    }

    response, _ := client.Models.GenerateImages(
        ctx,
        "imagen-3.0-generate-002",
        "Panning wide shot of a calico kitten sleeping in the sunshine",
        config,
    )

    // you'll pass response.GeneratedImages[0].Image to Veo
}

Quindi, genera un video utilizzando l'immagine risultante come primo frame:

Python

operation = client.models.generate_videos(
    model="veo-2.0-generate-001",
    prompt=prompt,
    image = imagen.generated_images[0].image,
    config=types.GenerateVideosConfig(
      person_generation="dont_allow",  # "dont_allow" or "allow_adult"
      aspect_ratio="16:9",  # "16:9" or "9:16"
      number_of_videos=2
    ),
)

# Wait for videos to generate
 while not operation.done:
  time.sleep(20)
  operation = client.operations.get(operation)

for n, video in enumerate(operation.response.generated_videos):
    fname = f'with_image_input{n}.mp4'
    print(fname)
    client.files.download(file=video.video)
    video.video.save(fname)

JavaScript

import { GoogleGenAI } from "@google/genai";
import { createWriteStream } from "fs";
import { Readable } from "stream";

const ai = new GoogleGenAI({});

async function main() {
  // get image bytes from Imagen, as shown above

  let operation = await ai.models.generateVideos({
    model: "veo-2.0-generate-001",
    prompt: "Panning wide shot of a calico kitten sleeping in the sunshine",
    image: {
      imageBytes: response.generatedImages[0].image.imageBytes, // response from Imagen
      mimeType: "image/png",
    },
    config: {
      aspectRatio: "16:9",
      numberOfVideos: 2,
    },
  });

  while (!operation.done) {
    await new Promise((resolve) => setTimeout(resolve, 10000));
    operation = await ai.operations.getVideosOperation({
      operation: operation,
    });
  }

  operation.response?.generatedVideos?.forEach(async (generatedVideo, n) => {
    const resp = await fetch(
      `${generatedVideo.video?.uri}&key=GEMINI_API_KEY`, // append your API key
    );
    const writer = createWriteStream(`video${n}.mp4`);
    Readable.fromWeb(resp.body).pipe(writer);
  });
}

main();

Vai

    image := response.GeneratedImages[0].Image

    videoConfig := &genai.GenerateVideosConfig{
      AspectRatio:    "16:9",
      NumberOfVideos: 2,
    }

    operation, _ := client.Models.GenerateVideos(
        ctx,
        "veo-2.0-generate-001",
        "A dramatic scene based on the input image",
        image,
        videoConfig,
    )

    for !operation.Done {
        time.Sleep(20 * time.Second)
        operation, _ = client.Operations.GetVideosOperation(ctx, operation, nil)
    }

    for n, video := range operation.Response.GeneratedVideos {
        client.Files.Download(ctx, video.Video, nil)
        fname := fmt.Sprintf("video_with_image_input_%d.mp4", n)
        _ = os.WriteFile(fname, video.Video.VideoBytes, 0644)
    }

Parametri del modello Veo

Le convenzioni di denominazione variano in base al linguaggio di programmazione.

  • prompt: Il prompt di testo per il video. Se presente, il parametro image è facoltativo.
  • image: l'immagine da utilizzare come primo fotogramma del video. Se presente, il parametro prompt è facoltativo.
  • negativePrompt: Stringa di testo che descrive qualsiasi cosa che vuoi scoraggiare il modello a generare
  • aspectRatio: modifica le proporzioni del video generato.
    • "16:9": supportato in Veo 3 e Veo 2.
    • "9:16": Supportato solo in Veo 2 (il valore predefinito è "16:9").
  • personGeneration: consente al modello di generare video di persone. Sono supportati i seguenti valori:
    • Generazione di video da testo:
      • "allow_all": Genera video che includono adulti e bambini. Attualmente, l'unico valore personGeneration disponibile per Veo 3.
      • "dont_allow": solo Veo 2. Non consentire l'inclusione di persone o volti.
      • "allow_adult": solo Veo 2. Genera video che includono adulti, ma non bambini.
    • Generazione di video da immagini: solo Veo 2
      • "dont_allow": non consentire l'inclusione di persone o volti.
      • "allow_adult": genera video che includono adulti, ma non bambini.
    • Vedi Limitazioni.
  • numberOfVideos: Output video richiesti
    • 1: supportato in Veo 3 e Veo 2
    • 2: Supportato solo in Veo 2.
  • durationSeconds: solo Veo 2. Durata di ogni video di output in secondi, compresa tra 5 e 8.
    • Non configurabile per Veo 3, l'impostazione predefinita è 8 secondi.
  • enhancePrompt: solo Veo 2. Attiva o disattiva il prompt rewriter. Abilitato per impostazione predefinita.
    • Non configurabile per Veo 3, il miglioramento del prompt predefinito è sempre attivo.

Consulta la tabella Confronto tra le versioni del modello per un confronto diretto tra i parametri di Veo 3 e Veo 2.

Specifiche

Modalità
  • Generazione di video da testo
  • Generazione di immagini in video (solo Veo 2)
Latenza delle richieste
  • Minimo: 11 secondi
  • Max: 6 minuti (durante le ore di punta)
Generazione di lunghezza variabile
  • Veo 2: 5-8 secondi
  • Veo 3: 8 secondi
Risoluzione 720p
Frequenza fotogrammi 24 fps
Proporzioni
  • 16:9 - orizzontale
  • 9:16 - verticale (solo Veo 2)
Lingue di input (da testo a video) Inglese
Limitazioni
  • La funzionalità Da immagine a video personGeneration non è consentita in UE, Regno Unito, Svizzera e MENA
  • Text-to-video personGeneration: "allow_all" non è consentito in UE, Regno Unito, Svizzera e MENA

I video creati da Veo presentano una filigrana realizzata con SynthID, il nostro strumento per l'applicazione di filigrane e l'identificazione di contenuti creati con l'AI, e vengono sottoposti a filtri di sicurezza e processi di controllo della memorizzazione che contribuiscono a ridurre i rischi per la privacy, il copyright e i pregiudizi.

Guida ai prompt di Veo

Questa sezione della guida di Veo contiene esempi di video che puoi creare utilizzando Veo e mostra come modificare i prompt per produrre risultati diversi.

Filtri di sicurezza

Veo applica filtri di sicurezza in Gemini per garantire che i video generati e le foto caricate non contengano contenuti offensivi. I prompt che violano i nostri termini e linee guida vengono bloccati.

Nozioni di base sulla scrittura di prompt

I prompt efficaci sono descrittivi e chiari. Per ottenere il massimo da Veo, inizia identificando la tua idea principale, perfezionala aggiungendo parole chiave e modificatori e incorpora la terminologia specifica dei video nei tuoi prompt.

I seguenti elementi devono essere inclusi nel prompt:

  • Soggetto: l'oggetto, la persona, l'animale o il paesaggio che vuoi includere nel video, ad esempio paesaggio urbano, natura, veicoli o cuccioli.
  • Azione: cosa sta facendo il soggetto (ad esempio, camminando, correndo o girando la testa).
  • Stile: specifica la direzione creativa utilizzando parole chiave specifiche per lo stile cinematografico, ad esempio fantascienza, film horror, film noir o stili di animazione come cartone animato.
  • Posizionamento e movimento della videocamera: [facoltativo] controlla la posizione e il movimento della videocamera utilizzando termini come vista aerea, altezza degli occhi, inquadratura dall'alto, carrellata o dal basso.
  • Composizione: [facoltativo] come è inquadrato lo scatto, ad esempio campo lungo, primo piano, scatto singolo o scatto a due.
  • Effetti di messa a fuoco e obiettivo: [facoltativo] utilizza termini come messa a fuoco selettiva, messa a fuoco profonda, messa a fuoco morbida, obiettivo macro e obiettivo grandangolare per ottenere effetti visivi specifici.
  • Atmosfera: [facoltativo] in che modo il colore e la luce contribuiscono alla scena, ad esempio toni blu, notte o toni caldi.
  • Indicazioni audio implicite o esplicite: [solo Veo 3] Con Veo 3, puoi fornire indicazioni per effetti sonori, rumore ambientale e dialoghi.

Altri suggerimenti per scrivere prompt

I seguenti suggerimenti ti aiutano a scrivere prompt che generano i tuoi video:

  • Utilizza un linguaggio descrittivo: utilizza aggettivi e avverbi per fornire un quadro chiaro a Veo.
  • Fornisci il contesto: se necessario, includi informazioni di base per aiutare il modello a capire cosa vuoi.
  • Fai riferimento a stili artistici specifici: se hai in mente un'estetica particolare, fai riferimento a stili artistici o movimenti artistici specifici.
  • Utilizza strumenti di prompt engineering: valuta la possibilità di esplorare strumenti o risorse di prompt engineering per perfezionare i prompt e ottenere risultati ottimali. Per saperne di più, consulta Introduzione alla progettazione dei prompt.
  • Migliora i dettagli del viso nelle tue immagini personali e di gruppo: specifica i dettagli del viso come punto focale della foto, ad esempio utilizzando la parola ritratto nel prompt.

Prompt e output di esempio

Questa sezione presenta diversi prompt, evidenziando come i dettagli descrittivi possano migliorare il risultato di ogni video.

Audio integrato

Questi video mostrano come puoi richiedere la generazione di audio di Veo 3 con livelli di dettaglio crescenti.

Prompt Output generato
Maggiori dettagli
Primo piano di due persone che fissano un disegno criptico su una parete, la luce di una torcia che tremola. "Questa deve essere la chiave", mormorò, tracciando il disegno. "Ma cosa significa?" ha chiesto, perplessa, inclinando la testa. Pietra umida, intagli intricati, simboli nascosti. Un ronzio leggero e inquietante risuona sullo sfondo.
Cacciatori di tesori in una grotta.
Meno dettagli
Campeggio (stop motion): camper: "Ora sono tutt'uno con la natura!" Orso: "La natura preferirebbe un po' di spazio personale".
Cacciatori di tesori in una grotta.

Prova questi prompt per ascoltare l'audio. Prova Veo 3

Ghiaccioli

Questo video mostra come utilizzare gli elementi delle basi per la scrittura di prompt nel prompt.

Prompt Output generato
Primo piano (composizione) di stalattiti che si sciolgono (soggetto) su una parete rocciosa congelata (contesto) con tonalità fredde di blu (atmosfera), con zoom (movimento della videocamera) che mantiene i dettagli ravvicinati delle gocce d'acqua (azione). Stalattiti che gocciolano su uno sfondo blu.

Uomo al telefono

Questi video mostrano come rivedere il prompt con dettagli sempre più specifici per fare in modo che Veo perfezioni l'output in base alle tue preferenze.

Prompt Output generato
Meno dettagli
La videocamera si sposta per mostrare il primo piano di un uomo disperato che indossa un impermeabile verde. Sta effettuando una chiamata con un telefono a muro in stile retrò con una luce verde al neon. Sembra una scena di un film.
Uomo che parla al telefono.
Maggiori dettagli
Un primo piano cinematografico segue un uomo disperato con un cappotto verde consunto mentre compone un numero su un telefono a disco montato su un muro di mattoni grezzi, immerso nel bagliore inquietante di un'insegna al neon verde. La videocamera si avvicina, rivelando la tensione nella mascella e la disperazione incisa sul suo volto mentre fatica a fare la chiamata. La profondità di campo ridotta mette a fuoco la sua fronte aggrottata e il telefono nero con tasti rotanti, sfocando lo sfondo in un mare di colori al neon e ombre indistinte, creando un senso di urgenza e isolamento.
Uomo che parla al telefono

Leopardo delle nevi

Questo esempio mostra l'output che Veo potrebbe generare per un prompt semplice.

Prompt Output generato
Una simpatica creatura con pelliccia simile a quella del leopardo delle nevi cammina in una foresta invernale, rendering in stile cartone animato 3D. Il leopardo delle nevi è letargico.

Leopardo delle nevi che corre

Questo prompt è più dettagliato e mostra un output generato che potrebbe avvicinarsi di più a ciò che vuoi nel tuo video.

Prompt Output generato
Crea una breve scena animata in 3D in un allegro stile cartone animato. Una simpatica creatura con pelliccia simile a quella del leopardo delle nevi, grandi occhi espressivi e una forma amichevole e arrotondata che trotterella felice in una foresta invernale fantastica. La scena dovrebbe mostrare alberi arrotondati e innevati, fiocchi di neve che cadono delicatamente e una calda luce solare che filtra attraverso i rami. I movimenti rimbalzanti della creatura e il suo ampio sorriso devono trasmettere pura gioia. Punta a un tono allegro e commovente con colori vivaci e allegri e animazioni giocose. Il leopardo delle nevi sta correndo più velocemente.

Esempi per elementi di scrittura

Questi esempi mostrano come perfezionare i prompt in base a ogni elemento di base.

Oggetto

Questo esempio mostra come specificare una descrizione del soggetto. La descrizione può includere un soggetto o più soggetti e azioni. In questo caso, il soggetto è "condominio in cemento bianco".

Prompt Output generato
Rendering architettonico di un condominio in cemento bianco con forme organiche fluide, che si fondono perfettamente con la vegetazione lussureggiante ed elementi futuristici Segnaposto.

Contesto

Questo esempio mostra come specificare il contesto. Lo sfondo o il contesto in cui verrà inserito il soggetto sono molto importanti. Prova a posizionare il soggetto in una serie di sfondi diversi, come una strada trafficata o lo spazio.

Prompt Output generato
Un satellite che fluttua nello spazio con la luna e alcune stelle sullo sfondo. Satellite che fluttua nell'atmosfera.

Azione

Questo esempio mostra come specificare l'azione: cosa sta facendo il soggetto, ad esempio camminare, correre o girare la testa.

Prompt Output generato
Un'inquadratura ampia di una donna che cammina lungo la spiaggia, con un'espressione serena e rilassata, mentre guarda l'orizzonte al tramonto. Il tramonto è assolutamente meraviglioso.

Stile

Questo esempio mostra come specificare lo stile. Puoi aggiungere parole chiave per migliorare la qualità della generazione e avvicinarla allo stile previsto, ad esempio profondità di campo ridotta, fotogramma di un film, minimalista, surreale, vintage, futuristico o doppia esposizione.

Prompt Output generato
Stile noir, uomo e donna camminano per strada, mistero, cinematografico, bianco e nero. Lo stile noir è assolutamente meraviglioso.

Movimento della videocamera

Questo esempio mostra come specificare il movimento della videocamera. Le opzioni per il movimento della videocamera includono ripresa in soggettiva, vista aerea, vista con drone di monitoraggio o ripresa di monitoraggio.

Prompt Output generato
Una ripresa in soggettiva da un'auto d'epoca che guida sotto la pioggia, Canada di notte, cinematografica. Il tramonto è assolutamente meraviglioso.

Composizione

Questo esempio mostra come specificare la composizione: come viene inquadrata la ripresa (campo lungo, primo piano, angolazione dal basso e così via).

Prompt Output generato
Primo piano estremo di un occhio con il riflesso della città. Il tramonto è assolutamente meraviglioso.
Crea un video con un'inquadratura ampia di un surfista che cammina su una spiaggia con una tavola da surf, un bellissimo tramonto, in stile cinematografico. Il tramonto è assolutamente meraviglioso.

Atmosfera

Questo esempio mostra come specificare l'ambiente. Le palette di colori svolgono un ruolo fondamentale nella fotografia, influenzando l'atmosfera e trasmettendo le emozioni che si vogliono comunicare. Prova con "toni caldi arancioni tenui", "luce naturale", "alba" o "tramonto". Ad esempio, una tavolozza calda e dorata può infondere un'atmosfera romantica e suggestiva in una fotografia.

Prompt Output generato
Primo piano di una ragazza che tiene in braccio un adorabile cucciolo di golden retriever nel parco, luce solare. Un cucciolo tra le braccia di una bambina.
Primo piano cinematografico di una donna triste che viaggia in autobus sotto la pioggia, con tonalità fredde di blu e un'atmosfera malinconica. Una donna che viaggia su un autobus e si sente triste.

Utilizzare immagini di riferimento per generare video

Puoi dare vita alle immagini utilizzando la funzionalità di conversione di immagini in video di Veo. Puoi utilizzare asset esistenti o provare Imagen per generare qualcosa di nuovo.

Prompt Output generato
Coniglio con una barretta di cioccolato. Il coniglio sta scappando.
Il coniglietto scappa. Il coniglio sta scappando.

Prompt negativi

I prompt negativi possono essere uno strumento efficace per specificare gli elementi che non vuoi nel video. Descrivi cosa vuoi che il modello non generi dopo la frase "Prompt negativo". Segui questi suggerimenti:

  • ❌ Non utilizzare un linguaggio istruttivo o parole come no o non. Ad esempio, "Nessuna parete" o "Non mostrare le pareti".

  • ✅ Descrivi ciò che non vuoi vedere. Ad esempio, "muro, cornice", il che significa che non vuoi un muro o una cornice nel video.

Prompt Output generato
Genera una breve animazione stilizzata di una grande quercia solitaria con le foglie che si muovono vigorosamente a causa di un forte vento. L'albero deve avere una forma leggermente esagerata e fantasiosa, con rami dinamici e fluenti. Le foglie devono mostrare una varietà di colori autunnali, che turbinano e danzano nel vento. L'animazione deve utilizzare una tavolozza di colori caldi e invitanti. Albero con parole.
Genera una breve animazione stilizzata di una grande quercia solitaria con le foglie che si muovono vigorosamente a causa di un forte vento. L'albero deve avere una forma leggermente esagerata e fantasiosa, con rami dinamici e fluenti. Le foglie devono mostrare una varietà di colori autunnali, che turbinano e danzano nel vento. L'animazione deve utilizzare una tavolozza di colori caldi e invitanti.

Con prompt negativo: sfondo urbano, strutture create dall'uomo, atmosfera cupa, tempestosa o minacciosa.
Albero senza parole negative.

Proporzioni

La generazione di video con Gemini Veo supporta i seguenti due formati:

Proporzioni Descrizione
Widescreen o 16:9 Le proporzioni più comuni per televisori, monitor e schermi di cellulari (orizzontale). Utilizza questa opzione quando vuoi catturare una porzione più ampia dello sfondo, ad esempio in paesaggi panoramici.
Verticale o 9:16
(solo Veo 2)
Widescreen ruotato. Questo formato è stato reso popolare dalle applicazioni di video nel formato breve, come YouTube Shorts. Utilizza questo formato per ritratti o oggetti alti con un forte orientamento verticale, come edifici, alberi, cascate o palazzi.

Widescreen

Questo prompt è un esempio delle proporzioni widescreen 16:9.

Prompt Output generato
Crea un video con la visuale di un drone che segue un uomo alla guida di un'auto cabriolet rossa a Palm Springs negli anni '70, con una calda luce solare e lunghe ombre. La cascata è assolutamente meravigliosa.

Verticale

Questo prompt è un esempio di proporzioni verticali 9:16. Questo rapporto è disponibile solo per Veo 2.

Prompt Output generato
Crea un video che metta in evidenza il movimento fluido di una maestosa cascata hawaiana all'interno di una lussureggiante foresta pluviale. Concentrati sul flusso d'acqua realistico, sul fogliame dettagliato e sull'illuminazione naturale per trasmettere tranquillità. Cattura l'acqua impetuosa, l'atmosfera nebbiosa e la luce del sole che filtra attraverso la fitta canopia. Utilizza movimenti di macchina fluidi e cinematografici per mostrare la cascata e l'ambiente circostante. Punta a un tono tranquillo e realistico, trasportando lo spettatore nella serena bellezza della foresta pluviale hawaiana. La cascata è assolutamente meravigliosa.

Confronto tra le versioni del modello

Per prestazioni, fedeltà e qualità ottimali, consigliamo di utilizzare Veo 3.

La seguente tabella descrive le differenze in termini di funzionalità, specifiche e parametri tra Veo 2 e lo stato attuale dell'anteprima di Veo 3:

Modello Veo 3 Veo 2
Disponibilità Anteprima Stabile
Audio Audio con video (sempre attivo) Senza audio
Generazione Da testo a video Da testo e immagine a video
Video per richiesta 1 1 o 2
aspectRatio Solo 16:9 16:9 o 19:6
personGeneration Solo allow_all (non configurabile) allow_adult, dont_allow o allow_all (solo da testo a video)
durationSeconds Non configurabile, solo 8 secondi 5-8 secondi
enhancePrompt Non configurabile, sempre attivo Attiva (impostazione predefinita) o disattiva

Puoi eseguire la migrazione da Veo 2 a Veo 3 aggiornando il nome del modello in modo da utilizzare un codice modello Veo 3, con modifiche minime ai parametri.

Passaggi successivi

  • Acquisisci maggiore esperienza nella generazione di video AI con Veo Colab.
  • Dai un'occhiata ad alcuni esempi interessanti che utilizzano Veo 2 sul sito di Google DeepMind