Tecnologia

I video della nuova AI di Google sono impressionanti

27-05-2025, 14:45

AGI - Durante la conferenza annuale Google I/O 2025, l'azienda ha svelato Veo 3, la nuova versione del suo modello di intelligenza artificiale per la generazione di video, capace per la prima volta di creare audio sincronizzato ai clip generati. Secondo quanto dichiarato, Veo 3 può produrre effetti sonori, rumori ambientali e persino dialoghi coerenti con la scena visiva. Disponibile all'interno dell'app Gemini, Veo 3 può essere utilizzato da chi è iscritto al piano AI Ultra da 249,99 dollari al mese. I video sono impressionati, davvero realistici. Basta farsi un giro su TikTok o su YouTube per averne una piena dimostrazione. Fanno così impressione da generare nuove discussioni sul rinnovato pericolo di non riuscire a distinguere tra realtà e finzione, verità e artificialità. "Per la prima volta, stiamo uscendo dall'era del cinema muto dell'intelligenza artificiale” ha spiegato Demis Hassabis, CEO di Google DeepMind. “Puoi fornire a Veo 3 un prompt che descrive personaggi e ambienti, suggerendo anche i dialoghi e specificando come devono suonare”. Insomma, se non proprio il cinema sicuramente si possono creare dei trailer molto convincenti. Qualità e sincronizzazione automatica Rispetto alla versione precedente (Veo 2), Google afferma che Veo 3 offre miglioramenti significativi nella qualità del materiale prodotto. Soprattutto se si considera l'impatto visivo. Ma la vera novità, si legge, sui siti specializzati, è la capacità del modello di interpretare i pixel del video per generare una componente audio perfettamente sincronizzata, una funzione resa possibile dagli studi precedenti di DeepMind sul cosiddetto “video-to-audio AI”. Già a giugno 2024, DeepMind aveva infatti rivelato lo sviluppo di una tecnologia per creare colonne sonore per i video, addestrando un modello su un mix di clip visivi, effetti sonori e trascrizioni di dialoghi. Google non ha specificato le fonti esatte dei dati utilizzati per l'addestramento di Veo 3, ma è probabile che YouTube, di proprietà della stessa Google, abbia avuto un ruolo decisivo. La concorrenza e l'effetto sull'industria Il mercato dei video generati da AI è sempre più affollato, con startup come Runway, Genmo, Lightricks, Pika, Higgsfield, Kling, Luma e colossi come OpenAI e Alibaba che rilasciano nuovi modelli a ritmo serrato. Spesso, le differenze tra i modelli sono minime. Ma la generazione audio integrata, scrive Edgadget, potrebbe rappresentare un punto di svolta per Veo 3, se le promesse saranno mantenute. Flow: il nuovo strumento AI per il cinema Nell'ambito della stessa conferenza, Google ha presentato anche Flow, un nuovo strumento di filmmaking basato su AI, progettato per lavorare con i modelli più avanzati della casa: Veo, Imagen (per le immagini) e Gemini (per l'elaborazione del linguaggio). "Flow è ispirato a quella sensazione in cui il tempo rallenta e la creazione è fluida, iterativa e piena di possibilità", spiega Google nel suo blog. Con Flow, i creativi possono descrivere una scena o una clip usando il linguaggio naturale, e il sistema genera il risultato usando i modelli interconnessi. È possibile: usare asset personali (immagini, personaggi, stili); generare elementi originali con Imagen; Integrare asset già creati in più scene con coerenza stilistica; avviare una scena da un'immagine; aggiungere o rimuovere oggetti; passare da ritratto a paesaggio; controllare i movimenti di camera (rotazioni, dolly, zoom). Al momento, Flow è disponibile solo per gli abbonati AI Pro e AI Ultra negli Stati Uniti, ma Google prevede un'espansione globale.

CONTINUA A LEGGERE