les « vocoder »

45
Les « Vocoder » Juillet 2001

Upload: miranda-harvey

Post on 02-Jan-2016

69 views

Category:

Documents


0 download

DESCRIPTION

Les « Vocoder ». Juillet 2001. Comment la parole est produite ?. Les organes. Cavité nasale. Voile du palais. Cavité buccale. Langue. Épiglotte et cordes vocales. Trachée. La production de la parole. Coopération de plusieurs organes: Les poumons produisent une pression d’air. - PowerPoint PPT Presentation

TRANSCRIPT

Le contrle avec un DSP

Les VocoderJuillet 2001

Les organesComment la parole est produite ?Cavit nasaleCavit buccaleLanguepiglotte et cordes vocalesTracheVoile du palaisCoopration de plusieurs organes:Les poumons produisent une pression dair.

Cet air circule au travers de lpiglotte.

Les cordes vocales vibrent et interrompent ainsi le dbit dair provoquant une variation de pression quasi-priodique.La production de la paroleCoopration de plusieurs organes:Pour certains sons dits voiss, vos cordes vocales vibrent (ouverture et fermeture). La vitesse laquelle les cordes vocales vibrent dtermine le ton de votre voix. Les femmes et les jeunes enfants ont tendance avoir une grande hauteur (vibration rapide) tandis que les mles adultes ont tendance avoir une faible hauteur (de vibration lente). Pour certains sons fricatifs (ou non voiss), les cordes vocales ne vibrent pas mais restent constamment ouvertes. La production de la parole - 2Coopration de plusieurs organes:La forme de votre conduit vocal dtermine le son que vous faites. Tandis que vous parlez, votre appareil vocal change de forme pour produire un son diffrent. Les modifications du conduit vocal sont relativement lentes (sur l'chelle de 10 ms 100 ms). La quantit d'air provenant de vos poumons dtermine le volume de votre voix.La production de la parole - 3Impulsions de pression:Impulsions de tonalit (pitch impulses).

Frquence du signal de pression:Frquence de tonalit ou fondamentale.Frquence constante = son monotone.La production de la parole - 4

En pratique, la tonalit varie constamment.La production de la parole - 5

Limpulsion de tonalit dplace lair dans la cavit buccale (bouche).Pour certains sons, la cavit nasale est mise contribution.La rsonance de ces cavits entrane la cration dune onde de son qui est le signal de la parole.Comme la langue et le palais permettent de modifier les cavits, cela nous permet de prononcer plusieurs sons.La production de la parole - 6Frquence de rsonance des cavits:Frquence du formant.

Que dsigne formant ?Une des composantes qui permettent de distinguer un son complexe d'un autre, et par exemple un son vocal d'un autre son vocal; les formants sont les frquences (ou les bandes de frquence) les plus intenses; on les obtient en faisant l'analyse du son.La production de la parole - 7Rf.: Grand Dictionnaire TerminologiqueProduction de M et de T.Exemple de position des organes

Schma bloc:Modle de la parole humaine

Schma bloc:Modle lectronique de la parole humaine

Diagramme dun systme complet (LPC)

LPC Vocoder(Voice Coder)Diagramme dun vocoder prdiction linaire

Paramtres dun Vocoder:Articulations : H(z) Filtre LPC;Air : u(n)Vibrations des cordes vocales : V (vois)Priode de vibration des cordes vocales : TConsonnes fricatives et plosives : UV (non vois)Volume dair expuls : G - GainVocoder prdiction linaireFiltre LPC:

Signal de la parole s(n):Vocoder prdiction linaire

Vecteur du modle LPC:

Ce vecteur change tous les 20 msec.

Si lchantillonnage est de 8 kH, cela reprsente 160 chantillons du signal s(n).

On peut transmettre

On transmet ce vecteur de 13 valeurs:

Au lieu de ce vecteur de 160 valeurs:

Donc 12.3 X moins de donnes

Taux de compression

160 valeurs de 8 bits tout les 20 msec donne une cadence de 1280 bits/20 ms ou encore de 64 kbits/sec.Les paramtres a sont ramens sur un total de 34 bits. Le gain G est sur 7 bits et le code U/UV,T est sur 7 bits. Donc 48 bits transmit tous les 20 msec, ce qui donne une cadence de 2.4 kbits/sec. Compression de 26.67 x

Taux de compressionAucune diffrence perue:Si le son est une voyelle ou une consonne non fricative ou non-plosive:Phase sans importance.Si le son est une consonne fricative ou plosive:Squence de bruit blanc utilis,Sensibilit du vecteur SPour un vecteur S donn, dduire le vecteur A.

Soit S:

Sachant que :

On calcule alors linnovation u(n)Analyse de la voie(LPC analysis)

Il faut trouver les ai. On va trouver les coefficients qui vont minimiser lnergie contenue dans linnovation u(n).

Calcul de lnergie contenue dans linnovation:

Minimisation de lnergie contenue dans u(n)

Lnergie sera minimale si:Minimisation de lnergie contenue dans u(n)

Cette dernire opration donne 10 quations rsoudre:10 quations 10 inconnues

Fonction dautocorrlation du signal s(n):Signification de R(k)

Linversion de la matrice 10 X 10 peut tre longue faire (sauf dans MATLAB).

Lalgorithme rcursif de Levinson-Durbin est plus rapide.Linversion de la grosse matriceLes quations traiter pour i allant de 1 10 inclusivement:Lalgorithme rcursif de Levinson-Durbin

i=i+1Soit R(0)=2.4470x108, R(1)=2.2466x108 et R(2) = 1.7823x108:

Itration #1:Exemple:

Itration #2:

et ainsi de suite Exemple:

Une fois cette srie de calculs faits on pose:

Reste calculer les trois autres paramtres V/UV, G et T.Lalgorithme rcursif de Levinson-Durbin

quation propose par Levinson-Durbin:

Variante:Calcul du gain G

Rsoudre cette quation:

Et faire lautocorrlation de u(n): Trouver V/UV, et T

Spectre de lautocorrlation: Dcision base sur lautocorrlation

Son non voisSon voisLa structure en chelle du filtre IIR peut sappliquer:

Utilisation directe des coefficients ki calculs lors de lalgorithme prcdent.Structure en chelle

Indice de qualification de la qualit de la parole

Oreille humaine chelle logarithmiquePlage des amplitudes sonores

La plage dynamique de loreille (inaudible intolrable) est denviron 20 bits.De 1 106.

En pratique, stock sur 16 bits, dont 12 sont significatifs.

Qualit tlphonique :8 kHz et 12 bits.

Plage des amplitudes sonoresExemple:Fonction sinusodale chantillonne.Fentre rectangulaire.Fentrage - rectangulaire

Spectre sinus + fentre rectangulaire

Spectre sinus + fentre rectangulaire

Exemple:Fonction sinusodale chantillonne.Fentre de Hamming.Fentrage - Hamming

Spectre sinus + fentre de Hamming

Spectre sinus + fentre de Hamming

Compaison

Source de pression pour le son

POUMONS

Excitationvoise

CORDES VOCALES

Excitationnon voise

Articulation

BOUCHE, NEZ

a

1-a

PAROLE

Signal quasi-priodique

Signal detype bruit

EXCITATION

ARTICULATION

Source d'nergie

VALEUR D'NERGIE

Gnrateur de tonalit

FRQUENCE DE TONALIT

Gnrateur de bruit

Filtre variable

COEFFICIENTS DU FILTRE

DCISIONVoise/Non voise

PAROLE

EXCITATION

ARTICULATION