Indice della documentazione

Studio Audio

Genera voce sintetizzata, musica strumentale, musica con voce e effetti audio. Post-produzione inclusa.

Cosa puoi fare

Studio Audio crea e modifica audio in ogni forma:

  • Voce sintetizzata — leggi testi a voce alta (TTS)
  • Musica strumentale — genere e mood (jazz, lo-fi, cinematico, ecc.)
  • Musica con voce — descrizione + testo cantato (lyrics)
  • Post-produzione — separazione stem, riduzione rumore, mastering

Parte 1: Generazione voce e musica

Scegli il tipo

In alto a sinistra, tre pulsanti:

  • Voce — sintesi vocale da testo
  • Musica strumentale — genere e atmosfera
  • Musica con voce — brano completo con lyrics

Voce sintetizzata

  1. Scegli il modello:
  • Chatterbox TTS — veloce, qualità buona, gratuito
  • Chatterbox HD — qualità HD locale, gratuito, voce più naturale
  • IndexTTS2 — Premium HD — voce ultra-realistica, emozionale, gating (piano a pagamento)
  • Modelli cloud (MiniMax, F5-TTS, Qwen3-TTS) — qualità eccellente, con opzioni di voce ricca
  1. Scrivi il testo che vuoi sentire letto ad alta voce
  1. Opzionale: seleziona la voce
  • Modelli cloud hanno voci preset (Maria, Luca, ecc.)
  • Alcuni modelli permettono voce su misura: descrivi la voce desiderata (*"voce maschile profonda e calma"*)
  1. Genera — la voce viene creata in pochi secondi

Musica strumentale

  1. Scegli il modello:
  • Stable Audio — gratuito, strumentale di qualità
  • Lyria 2, Eleven Music — cloud, qualità premium
  1. Descrivi il genere e il mood
  • Esempio: *"lo-fi hip hop, rilassante, con piano e batteria soft"*
  • Esempio: *"cinematico epico, archi, ottoni, drammatico"*
  1. Durata: 10–120 secondi (dipende dal modello)
  1. Genera — la musica viene creata

Musica con voce

  1. Scegli il modello:
  • ACE-Step — gratuito, genera brani completi con lyrics
  • Yue, Lyria 2 (cloud) — premium, qualità studio
  1. Scrivi lo stile/genere
  • Esempio: *"pop melodico, energico, female vocals"*
  1. Incolla i lyrics (opzionale)
  • Usa tag come [verse], [chorus] per strutturare il brano
  • Se vuoto, il modello genera musica strumentale
  1. Durata: 15–300 secondi
  1. Genera — il brano viene creato con voce sintetizzata

Parte 2: Post-produzione audio

Dopo aver generato un audio o caricato il tuo, puoi applicare effetti:

Dalla Galleria → "Usa in"

  1. Genera o carica un audio
  2. In Galleria, clicca Usa inPost-produzione audio
  3. Scegli l'effetto:
  • Stem split (Demucs) — separa voce, batteria, bassi, altri strumenti
  • Denoise voce — rimuove i rumori di fondo dalla voce
  • Master su reference — matching automatico del mastering (fornisci un audio "reference" e lo shaping si applica al tuo)

Effetti disponibili

EffettoCosa faQuando usarlo
DemucsSepara voce da musicaSe vuoi usare solo la voce, o solo la musica di un brano
DenoiseToglie rumori e frusciiVoce registrata male, registrazione da microfono economico
MatcheringCopia lo stile di masteringVuoi che la tua traccia suoni come quella di un altro artista

Gestione sessione

A destra, Galleria audio mostra:

  • Tutti gli audio generati nella sessione attuale
  • Durata e modello usato
  • Pulsanti: Ascolta, Scarica, Usa in, Elimina

Premi Nuova sessione per cancellare la griglia e ricominciare.

Modelli gratuiti vs Premium

ModelloCostoQualitàQuando usarlo
Chatterbox TTSGratisBuonaTTS veloce, narrativo
Chatterbox HDGratisBuona HDTTS più naturale, locale
Stable AudioGratisBuonaMusica strumentale veloce
ACE-StepGratisBuonaBrani con voce sintetizzata
Cloud (MiniMax, F5, Qwen, Lyria, Eleven)A creditiEccellenteStudio quality, voce naturalissima

Tempistiche reali

  • Voce TTS: 5–20 secondi
  • Musica strumentale: 20–60 secondi
  • Musica con voce: 1–3 minuti
  • Post-produzione (stem/denoise/master): 30–120 secondi

Problemi comuni

"La voce non si ascolta"

→ Prova un modello diverso. Alcuni modelli richiedono crediti (lucchetto 🔒).

"L'audio è troppo veloce/lento"

→ Modelli cloud permettono il parametro Velocità: regolalo da 0.5× a 2.0×.

"Voglio clonare la MIA voce"

→ Registra un campione audio (10–20 secondi), caricalo come Campione voce. I modelli F5-TTS e Qwen3-TTS supportano il cloning zero-shot.

"Il mastering sounds "strano""

→ Usa un audio reference di qualità (da Spotify, YouTube con buona mastering). Il matching sarà fedele al reference.

Pro tip

Genera la voce narrante in Studio Audio, poi mandala a Cinema Studio per sincronizzarla con un video con lip sync. Oppure genera musica + voce in un brano completo e usalo come colonna sonora nei tuoi video.