RealSinger
Aggiustamento dei margini di
selezione del fonema
|
Dopo la registrazione di ogni parola, il
programma tenta di localizzare un fonema nella
parola stessa (quello che è scritto in
maiuscolo nella parola dell'esempio) e di
eliminare le altre parti della parola.
Talvolta ci riesce, talvolta no. Si può
allora lasciare così com'è la
selezione fatta dal programma oppure
migliorarla. Sovente l'orecchio è miglior
giudice dell'analisi matematica e quindi si
raccomanda di cercare la zona di selezione nel
fonema registrato anche se il risultato sembra
corretto.
Qui sotto, l'elenco dei diversi tipi di
fonemi che è possibile siano stati
registrati e che il programma si aspetta che
siano selezionati prima di convalidarli.
Otturazione glottica
|
 |
Quando si pronunzia una consonante plosiva
vocalizzata (G, B, D) , la bocca si chiude
completamente per un istante e il suono rimane
attutito per un breve momento. Questo momento,
però, non è completamente silenzioso:
mentre la bocca è chiusa l'aria continua
ad uscire dai polmoni e le corde vocali a
vibrare. La pressione dell'aria nella bocca
chiusa aumenta fino a che le labbra si aprono
di nuovo e la consonante viene emessa con molta
potenza (è questo il motivo per il quale
queste consonanti sono dette
"plosive").L'otturazione corrisponde alla parte
"a bocca chiusa" che si può osservare nel
grafico del suono: un periodo di debole
intensità limitato da fonemi più
forti.
 |
Nota per
la lingua tedesca:
In tedesco le consonanti plosive
vocalizzate non possono trovarsi in
fine di parola; esse sono allora
pronunciate come il loro equivalente
non vocalizzato (G=>K, B=>P,
D=>T).
Ciò nonostante sarà
necessario pronunciare veramente una
consonante vocalizzata alla fine della
parola. Per facilità si immagini
che dopo la plosiva ci sia una vocale
molto corta. Per esempio: se è
richiesto di registrare la sillaba
"caB", la si pronunzi "caB(e)" con una
"e" finale molto corta.
|
Vocali di transizione (trans)
|
 |
Abitualmente queste vocali sono usate soltanto
in forma corta (mai prolungate).
In questo caso, invece, la parola richiesta
dovrà essere pronunciata in modo un po'
diverso da quello della "vita reale" e le
vocali dovranno essere prolungate ("oui"
proninciato /uuuuuuui/ e non /uiiiiiiiii/;
"huile" pronunciato /yyyyyyyyil/ e non
/yiiiiil/).
Quando si fissano i limiti della selezione si
badi di selezionare soltanto questa vocale e
non quella che segue.
Vocali "statiche"
|
 |
Sono chiamate "statiche" perché il loro
valore fonetico non varia per tutto il tempo
della loro durata (in francese le vocali sono
tutte statiche).
È posibile selezionale soltanto una breve
parte della vocale. Se ne selezioni una parte
il cui timbro udito sembra corretto e enlla
quale le variazioni di potenza e di frequenza
non siano troppo importanti. Più corta
sarà la parte selezionata, più
piccolo sarà il documento di voce alla
fine.
 |
Nota per la lingua tedesca:
In tedesco le vocali hanno una
versione "corta" ed una "lunga";
tuttavia, onde permettere al programma
di analizzare abbastanza dati per le
vocali "corte" queste vocali dovranno
essere prolungate almeno di mezzo
secondo anche se non è così
che le si pronuncia normalmente in
tedesco.
|
Prima parte del dittongo (diphth) -
Solo in inglese -
|
 |
Un dittongo è una vocale che varia nel
tempo durante la pronuncia. Nel nostro caso si
dovrà prolungare soltanto la prima parte
del dittongo e farla sentire come una vocale
statica. Si selezioni una parte della fase
statica.
Dittongo completo (full dipht.) -
Solo in inglese -
|
 |
In questo caso si dovrà registrare il
dittongo intero pronunciandolo molto
rapidamente. Si badi a non lasciar "morire" il
volume o la frequenza alla fine del dittongo
(si immagini si dover dire un'altra parola dopo
il dittongo stesso). Dopo si dovrà
selezionare il dittongo intero. Lo si articoli
bene, ma non lo si prolunghi troppo: in caso
contrario le dimensioni della voce risultante
aumenterebbero.
Consonanti continue
|
 |
Queste consonanti possono essere prolungate
(M, N, L, S, F...).
Si imiti l'esempio e, come per le vocali
statiche, se ne selezioni una parte nella quale
il volume sia più o meno costante.
Consonanti plosive non vocalizzate
(T, P, K)
|
 |
Queste consonanti sono precedute da un breve
momento di arresto glottico, una fase di
silenzio.
Si esageri la pronuncia della consonante
stessa in modo che essa risulti più forte
che se la si pronunciasse in modo naturale. Si
aggiusti poi la zona di selezione in modo che
essa cominci subito dopo l'arresto glottico e
finisca dopo che la consonante e il suo rumore
di soffio sono terminati.
Consonanti plosive vocalizzate
(D,B,G)
|
 |
Queste consonanti sono precedute da un breve
momento di otturazione glottica, una fase di
debole potenza. Si esageri la pronuncia della
consonante stessa in modo che essa risulti
più forte che se la si pronunciasse in
modo naturale. Si aggiusti poi la zona di
selezione in modo che essa cominci subito dopo
l'arresto glottico e finisca dopo che la
consonante e il suo rumore di soffio sono
terminati.
Inspirazione (hhh)
|
 |
È il suono prodotto dal cantore quando
prende il respiro. Si inspiri rapidamente (meno
di un secondo) senza rumore di bocca o di
labbra; si apra la bocca prima di incominciare
la registrazione e poi si inspiri come per la
sorpresa.
Si aggiusti la zona di selezione in modo da
includere tutto il suono (con un corto periodo
di silenzio dopo il suono stesso).
|