Indice della documentazione

Studio Voce

Sintesi vocale avanzata, clone della tua voce personale e voci premium HD per piani a pagamento.

Cosa puoi fare

Studio Voce trasforma testi in audio con la voce che scegli:

  • Testo → voce — leggi testi a voce alta
  • Voce clonata personale — registra la TUA voce e clonala
  • Voci premium — voce ultra-realistica e naturalissima
  • Preview e controlli — prova subito e regola ogni dettaglio

Come registrare e clonare la TUA voce

Questo è l'elemento distintivo di Studio Voce: puoi registrare un campione audio e usarlo per generare testi con la TUA voce.

Passo 1: Registrazione

  1. Clicca Registra voce personale
  2. Accorda il browser il permesso di usare il microfono
  3. Parla in un tono naturale e chiaro, per 10–30 secondi
  4. Equalizzatore live → Vedi i livelli audio in tempo reale (grafico dinamico). Evita picchi rossi (distorsione)
  5. Clicca Fine registrazione quando hai finito

Passo 2: Salva il campione

Una volta registrato:

  • Ascolta l'anteprima (pulsante ▶)
  • Clicca Salva campione — viene memorizzato nel tuo profilo

Puoi registrare più campioni (voci diverse, toni, lingue). Ciascuno sarà usabile in futuro.

Passo 3: Usa il campione

  1. Scegli il tuo campione vocale dalla lista
  2. Scrivi il testo che vuoi sentire con la TUA voce
  3. Premi Genera
  4. L'audio viene creato in pochi secondi, con la tua voce clonata

Voci preset e voci premium

Se non vuoi clonare la tua voce, puoi usare una voce preset o una voce premium:

Voci preset (gratuito)

Modelli come Chatterbox TTS e Qwen3-TTS offrono voci preregistrate:

  • Scegli dalla lista (es. "Serena", "Luca", "Maria")
  • Scrivi il testo
  • Genera istantaneamente

Voci premium (con piano a pagamento)

Se hai il piano Pro o Enterprise:

  • IndexTTS2 — Premium HD — voce ultra-naturalistica e emozionale, generata in locale
  • ElevenLabs v3 — voce studio-quality, 32 preset + custom voice cloning
  • MiniMax Speech 2.8 HD — con emozioni (felice, triste, arrabbiato, ecc.)

Le voci premium sono più costose in crediti ma la qualità è cinema-grade: quasi indistinguibili da una voce umana vera.

Parametri di generazione

Seconda la voce scelta, puoi regolare:

  • Testo: cosa farà dire all'AI
  • Voce/Campione: quale voce usare
  • Velocità: da 0.5× (lentissimo) a 2.0× (velocissimo). Default 1.0×
  • Lingua (alcuni modelli): auto-riconoscimento o scelta manuale (IT, EN, ES, FR, ecc.)
  • Emozione (modelli premium): happy, sad, angry, neutral, ecc.

Anteprima e download

  1. Genera → l'audio appare in Galleria a destra
  2. Clicca su un audio per ascoltarlo
  3. Premi Scarica per salvare nel tuo computer
  4. Premi Usa in per mandarlo a un altro studio (Cinema, Avatar, Video)

Modelli di sintesi vocale

ModelloCostoQualità voceLingueQuando usarlo
Chatterbox TTSGratisBuonaIT, EN, ES, FR, DE, ecc.TTS veloce e semplice
Chatterbox HDGratisBuona HDIT, EN, ES, FRTTS locale, più naturale
Qwen3-TTSPremiumEccellente11 lingueMultilingue, voce realistica
IndexTTS2 HDPremiumStudio-qualityIT, EN, ES, FRVoce ultra-naturalistica, emozionale
ElevenLabs v3PremiumCinematica32 lingueVoci professionali, premium voice clone

Registrazione: come ottenere il massimo

Prima di registrare, trova un posto silenzioso:

  • Chiudi porte e finestre
  • Spegni ventilatori, AC, rumori di fondo
  • Usa un microfono dedicato (cuffie con mic, lavalier, USB condenser) se possibile
  • Se usi il microfono del laptop/telefono, posizionati vicino (15 cm circa)

Durante la registrazione:

  • Parla in modo naturale e chiaro, non robotico
  • Mantieni un tono coerente (non urlare, non sussurrare)
  • Leggi 2–3 frasi semplici
  • Guarda l'equalizzatore live — mantieni il livello nel verde (max giallo)

Dopo la registrazione:

  • Ascolta l'anteprima
  • Se senti rumori o distorsione, registra di nuovo

Il campione migliore = voce naturale, no rumori, volume moderato.

Problemi comuni

"La registrazione non partenza"

→ Il browser non ha il permesso. Controlla l'icona di candado/microfono in alto a sinistra e consenti l'accesso.

"L'audio registrato suona robotico"

→ Prova di nuovo con tono più naturale e meno affrettato. Evita di leggere "tipo AI".

"La voce clonata non assomiglia al mio campione"

→ Prova a registrare di nuovo con una registrazione di qualità migliore (più silenziosa, più chiara). Il modello che usi (es. F5-TTS) farà il meglio possibile, ma la fedeltà dipende dal campione.

"Voglio una voce premium ma non ho crediti"

→ Acquista crediti dal menu Account → Crediti in alto a destra. Le voci premium costan un po' di più ma la qualità vale la pena.

"Il testo non viene pronunciato bene (es. nomi, acronimi)"

→ Alcuni modelli hanno limitazioni con acronimi e nomi stranieri. Prova a riscrivere il testo in modo foneticamente più chiaro, oppure usa un modello cloud (ElevenLabs è migliore su questo).

Pro tip

Registra 5–10 campioni diversi (toni, lingue, velocità) e salvali. Potrai usarli in qualsiasi momento per generare nuovi testi con la tua voce. Perfetto per narrativa, podcast, video YouTube.