les « vocoder »
DESCRIPTION
Les « Vocoder ». Juillet 2001. Comment la parole est produite ?. Les organes. Cavité nasale. Voile du palais. Cavité buccale. Langue. Épiglotte et cordes vocales. Trachée. La production de la parole. Coopération de plusieurs organes: Les poumons produisent une pression d’air. - PowerPoint PPT PresentationTRANSCRIPT
Le contrle avec un DSP
Les VocoderJuillet 2001
Les organesComment la parole est produite ?Cavit nasaleCavit buccaleLanguepiglotte et cordes vocalesTracheVoile du palaisCoopration de plusieurs organes:Les poumons produisent une pression dair.
Cet air circule au travers de lpiglotte.
Les cordes vocales vibrent et interrompent ainsi le dbit dair provoquant une variation de pression quasi-priodique.La production de la paroleCoopration de plusieurs organes:Pour certains sons dits voiss, vos cordes vocales vibrent (ouverture et fermeture). La vitesse laquelle les cordes vocales vibrent dtermine le ton de votre voix. Les femmes et les jeunes enfants ont tendance avoir une grande hauteur (vibration rapide) tandis que les mles adultes ont tendance avoir une faible hauteur (de vibration lente). Pour certains sons fricatifs (ou non voiss), les cordes vocales ne vibrent pas mais restent constamment ouvertes. La production de la parole - 2Coopration de plusieurs organes:La forme de votre conduit vocal dtermine le son que vous faites. Tandis que vous parlez, votre appareil vocal change de forme pour produire un son diffrent. Les modifications du conduit vocal sont relativement lentes (sur l'chelle de 10 ms 100 ms). La quantit d'air provenant de vos poumons dtermine le volume de votre voix.La production de la parole - 3Impulsions de pression:Impulsions de tonalit (pitch impulses).
Frquence du signal de pression:Frquence de tonalit ou fondamentale.Frquence constante = son monotone.La production de la parole - 4
En pratique, la tonalit varie constamment.La production de la parole - 5
Limpulsion de tonalit dplace lair dans la cavit buccale (bouche).Pour certains sons, la cavit nasale est mise contribution.La rsonance de ces cavits entrane la cration dune onde de son qui est le signal de la parole.Comme la langue et le palais permettent de modifier les cavits, cela nous permet de prononcer plusieurs sons.La production de la parole - 6Frquence de rsonance des cavits:Frquence du formant.
Que dsigne formant ?Une des composantes qui permettent de distinguer un son complexe d'un autre, et par exemple un son vocal d'un autre son vocal; les formants sont les frquences (ou les bandes de frquence) les plus intenses; on les obtient en faisant l'analyse du son.La production de la parole - 7Rf.: Grand Dictionnaire TerminologiqueProduction de M et de T.Exemple de position des organes
Schma bloc:Modle de la parole humaine
Schma bloc:Modle lectronique de la parole humaine
Diagramme dun systme complet (LPC)
LPC Vocoder(Voice Coder)Diagramme dun vocoder prdiction linaire
Paramtres dun Vocoder:Articulations : H(z) Filtre LPC;Air : u(n)Vibrations des cordes vocales : V (vois)Priode de vibration des cordes vocales : TConsonnes fricatives et plosives : UV (non vois)Volume dair expuls : G - GainVocoder prdiction linaireFiltre LPC:
Signal de la parole s(n):Vocoder prdiction linaire
Vecteur du modle LPC:
Ce vecteur change tous les 20 msec.
Si lchantillonnage est de 8 kH, cela reprsente 160 chantillons du signal s(n).
On peut transmettre
On transmet ce vecteur de 13 valeurs:
Au lieu de ce vecteur de 160 valeurs:
Donc 12.3 X moins de donnes
Taux de compression
160 valeurs de 8 bits tout les 20 msec donne une cadence de 1280 bits/20 ms ou encore de 64 kbits/sec.Les paramtres a sont ramens sur un total de 34 bits. Le gain G est sur 7 bits et le code U/UV,T est sur 7 bits. Donc 48 bits transmit tous les 20 msec, ce qui donne une cadence de 2.4 kbits/sec. Compression de 26.67 x
Taux de compressionAucune diffrence perue:Si le son est une voyelle ou une consonne non fricative ou non-plosive:Phase sans importance.Si le son est une consonne fricative ou plosive:Squence de bruit blanc utilis,Sensibilit du vecteur SPour un vecteur S donn, dduire le vecteur A.
Soit S:
Sachant que :
On calcule alors linnovation u(n)Analyse de la voie(LPC analysis)
Il faut trouver les ai. On va trouver les coefficients qui vont minimiser lnergie contenue dans linnovation u(n).
Calcul de lnergie contenue dans linnovation:
Minimisation de lnergie contenue dans u(n)
Lnergie sera minimale si:Minimisation de lnergie contenue dans u(n)
Cette dernire opration donne 10 quations rsoudre:10 quations 10 inconnues
Fonction dautocorrlation du signal s(n):Signification de R(k)
Linversion de la matrice 10 X 10 peut tre longue faire (sauf dans MATLAB).
Lalgorithme rcursif de Levinson-Durbin est plus rapide.Linversion de la grosse matriceLes quations traiter pour i allant de 1 10 inclusivement:Lalgorithme rcursif de Levinson-Durbin
i=i+1Soit R(0)=2.4470x108, R(1)=2.2466x108 et R(2) = 1.7823x108:
Itration #1:Exemple:
Itration #2:
et ainsi de suite Exemple:
Une fois cette srie de calculs faits on pose:
Reste calculer les trois autres paramtres V/UV, G et T.Lalgorithme rcursif de Levinson-Durbin
quation propose par Levinson-Durbin:
Variante:Calcul du gain G
Rsoudre cette quation:
Et faire lautocorrlation de u(n): Trouver V/UV, et T
Spectre de lautocorrlation: Dcision base sur lautocorrlation
Son non voisSon voisLa structure en chelle du filtre IIR peut sappliquer:
Utilisation directe des coefficients ki calculs lors de lalgorithme prcdent.Structure en chelle
Indice de qualification de la qualit de la parole
Oreille humaine chelle logarithmiquePlage des amplitudes sonores
La plage dynamique de loreille (inaudible intolrable) est denviron 20 bits.De 1 106.
En pratique, stock sur 16 bits, dont 12 sont significatifs.
Qualit tlphonique :8 kHz et 12 bits.
Plage des amplitudes sonoresExemple:Fonction sinusodale chantillonne.Fentre rectangulaire.Fentrage - rectangulaire
Spectre sinus + fentre rectangulaire
Spectre sinus + fentre rectangulaire
Exemple:Fonction sinusodale chantillonne.Fentre de Hamming.Fentrage - Hamming
Spectre sinus + fentre de Hamming
Spectre sinus + fentre de Hamming
Compaison
Source de pression pour le son
POUMONS
Excitationvoise
CORDES VOCALES
Excitationnon voise
Articulation
BOUCHE, NEZ
a
1-a
PAROLE
Signal quasi-priodique
Signal detype bruit
EXCITATION
ARTICULATION
Source d'nergie
VALEUR D'NERGIE
Gnrateur de tonalit
FRQUENCE DE TONALIT
Gnrateur de bruit
Filtre variable
COEFFICIENTS DU FILTRE
DCISIONVoise/Non voise
PAROLE
EXCITATION
ARTICULATION