3 normes compression audio video
DESCRIPTION
Les différentes normes de compressionTRANSCRIPT
-
1Normes de Compressionaudio-vido
Ahmed MehaouaMatre de Confrences
Universit de VersaillesLaboratoire CNRS - PRiSM
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 2
Plan
Normes Video de 1re gnration JPEG et Motion JPEG H.261 MPEG-1
Normes Video de 2me Gnration H.263 MPEG-2
Normes Video de 3me Gnration H.263+ MPEG-4 MPEG-7
Normes Audio
-
2Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 3
Bibliographie
Http://www.mpeg.org Understanding Networked Multimedia, F. Fluckiger,
Prentice Hall, 1995 Multimedia : computing, communications and
Applications, R. Steinmetz, Prentice Hall, 1995 Networked Multimedia Systems, Concepts,
Architecture, and Design, S.V. Raghavan, PrenticeHall, 1998
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 4
JPEG et Motion-JPEG
Dfinition : JPEG : norme de compression dimages fixes propose en 1988
par OSI. Motion-JPEG : algorithme de synchronisation image-son
propritaire dbits variables entre 15-25 Mbps (format TV) accepte diffrents formats de couleurs pour le signal en entre.
Applications : Temps de latence rduit Transmission vido qualit TV en temps rel (hardware) DV
-
3Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 5
JPEG et Motion-JPEG
RG
B
Y U
Vsous-chantillonnagedes Couleurs
(optionel)
RGB YUV
pour chaque Matrice
pour chaqueBloc de 8x8
DCTQuantification
DPCM
RLE
DC
AC
Huffman. . . 10110010111
CodageEntropique
Balayageen Zig-Zag
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 6
JPEG et Motion-JPEG
Compression Diffrentielle (DPCM) du cofficient DC :
DCi-1
Blocki-1
DCi
Blocki
DIFF = DCi - DCi-1
-
4Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 7
JPEG et Motion-JPEGLecture en Zig-Zag des coefficients AC pour amliorer la Quantification :
ComposanteDC
DCT
Balayage en zigzag Balayage alternatif
chantillon de l'image (Bloc) Coefficients de la transforme
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 8
DVDigital Video
Format de stockage de la vido numrique pour camravido grand publicCompression Video :
- Similaire Motion-JPEG (image/image)- Format PAL/SECAM : 4:1:1 YCbCr /525- Format NTSC : 4:2:0 YCbCr /625- Table de quantification par MacroBlock- Dbit : 25 Mbps (3.6 Mop/s)
Audio non Compress :- 2 canaux PCM 16 bit, 44.1 Khz- 2 canaux PCM 16 bits, 48 Khz- 4 canaux PCM 12 bits, 32 Khz
-
5Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 9
ITU H.261
Dfinition: norme pour la compression de limages animes et du son propose
en 1990 par UIT. Principe : codage JPEG (Image codes Intra) + codage temporel
(Images codes Prdictives) Succession dimages JPEG (images I) et dimages H.261 (Images P) Formats vido accepts en entre limits :
CIF 352x288 jusqu 30 fps QCIF 176x144
Application : ddi la vidoconfrence sur le RNIS bande troite dbits constants nx64 Kbps (n compris entre 1 et 30)
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 10
ITU H.261Structure des Images
GOB 1 GOB 2
GOB 3
GOB 11 GOB 12
.....
..... .....
MB1MB2 MB11MB22
MB33
MB12
MB23
Y1 Y2
Y3 Y4C1 C2
352 pixels
288
pixel
s
176 pixels
48pi
xel
s
1 8
57 64
8 pixels
8pi
xel
s
.....
.....
.....
.....MB10
.....
16 pixels
16pi
xels
.....
.....
Group of Blocks (GOB)
Macroblocks (MB)
Block
Picture
-
6Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 11
ITU H.261La compression Spatiale (Image I)
Y Cb
Cr
Pour chaque
DCTQuantification
RLEDC
AC
Huffman. . . 10110010111
CodageEntropique
Zig-ZagScan
0 1
2 3
4
5MacroblocLuminance
BlocsChrominance
Macrobloc
Pourchaque
Bloc
Diffrence avec JPEG
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 12
ITU H.261La compression Temporelle (Image P)
0 1
2 3
4
5MacroblocLuminance
BlocsChrominance
DCTQuantification
RLEDC
AC
Huffman. . . 10110010111
CodageEntropique
Zig-ZagScan
Pourchaque
Bloc
Vecteur demouvement
+Vecteur demouvement
Difference
48
64
Image Rfrence
Image courante
meilleureconcordance
-
7Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 13
ITU H.261Contrle de Flux
DCT
DCT-1
Quant
Q-1
Huffman
Compensation demouvement et Mmoire
Tampon detransmission
ContrleVideo IN Video Out
Vect
eur
sde
mo
uve
me
nt
seuil
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 14
ITU H.261Flux Binaire compress
Picture Temporal Picture GOB GOB GOB.......
GOB Group Quanti- MB .......start code Number MB
TypeReferenceStart Code
zation Value
@ADDR TYPE QUANT Vector CBP Bloc #0 Bloc #5.......
DC Val. EOBVal. Val. .......
Niveau Image
Niveau Groupof Block
Niveau Block
Niveau MacroBlock
-
8Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 15
ITU H.261Flux Binaire compress (2)
PSC TR PTYPR PEI PSPARE GOB DATA
GBSC GN GQUANT GEI GSPARE MB DATA
MBA MTYPE MQUANT MVD CBP BLOCK DATA
TCOEF EOB
Niveau image
Niveau groupe de blocs
Niveau macrobloc
Niveau bloc
PSC : Picture Start Code (20 bits)TR : Temporal Reference (5 bits)PTYPR : Type Information (6 bits)PEI : Extra Insertion Information (1 bit)PSPARE : Spare Information (16 bits)
GBSC : Group of Bloc Start Code (16 bits)GN : Group Number (4 bits)
GQUANT : Quantizer Information (5 bits)GEI : Extra Insertion Information (1 bit)GSPARE : Spare Information (18 bits)
MBA : Macro-Block Address (variable)MTYPE : Block Type Information (variable)MQUANT : Quantizer Type (5 bits)MVD : Motion Vector Data (variable)CBP : Coded Block Patterns (variable)TCOEF : Transform Coefficients (variable)EOB : End Of Block (2 bits)
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 16
OSI MPEG-1
Dfinition: norme de compression dimages animes et du son propose en 1991 par OSI. Suppose un systme de communication fiable (bus PC) naccepte que la vido progressive (non compatible avec format TV) Regroupe 3 normes :
IS-11172-1 (Systme) IS-11172-2 (Vido) IS-11172-3 (Audio)
Application : Ddi au stockage sur CD-Rom, Vido-CD, CD Interactif (Philips) Qualit VHS avec dbit constant jusqu 1.8 Mbps (nx150 Kbp/s)
-
9Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 17
OSI MPEG-1
La compression dfinit 3 type dimages : Image Intra (I) (codage JPEG) Image Predictive (P) (codage H.261) Image Bidirectionnelle (B) (codage temporel amlior)
Ces images sont entrelaces pour former un groupe dimages
Formats vido accepts en entre : SIF 352x288 jusqu 30 fps
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 18
OSI MPEG-1Groupe dImages
I B B P B B P B B P B B I
Groupe d'images (GOP) (N = 12, M = 3)
-
10
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 19
OSI MPEG-1Structure des images
Video Sequence
Group of Picture
Picture
Slice
Macroblock
Block
8 pixels
8pi
xel
s
. . . . . . . .
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 20
OSI MPEG-1Structure du flux binaire
Bloc 4Bloc 3Bloc 2Bloc 1
...
Macro-Bloc 1
Macro-Bloc 2
Macro-Bloc j
...Tranche 1 Tranche 2 Tranche i
...Image 1 Image 2 Image m
...GOP 1 GOP 2 GOP nSquence
Groupe d'images(GOP)
Image
Tranche
Macrobloc(16 x 16) pixels
Bloc(8 x 8) pixels Header
6
-
11
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 21
OSI MPEG-1
BLOC : unit de traitement de la DCT MACROBLOCK : unit de traitement de la compensation de
mouvements (en-tte contient le type de codage, les vecteurs demvts, echelle de quantification).
TRANCHE : unit autonome de codage et de resynchronisation ducodeur (en-tte contient position de la tranche dans limage)
IMAGE : unit daccs et daffichage (en-tte contient le numro desquence)
GOP: unit de codage (en-tte contient info. dhorloge) SEQUENCE: unit dinitialisation (en-tete contient valeur du dbit
binaire, ratio daspect, frequence dimages et matrices dequantification).
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 22
OSI MPEG-1Codage Bidirectionnel (Image B)Image Rfrence Passe Image Rfrence Future
+ 2- =
VM1 VM2
0 1
2 3
4
5MacroblocLuminance
BlocsChrominance
+Vecteurs de mouvement
VM1 et VM2
pour chaqueBloc de 8x8
DCTQuantification
DPCM
RLE
DC
AC
Huffman. . . 10110010111
CodageEntropique
Zig-ZagScan
VM1 et VM2
Image courante B
-
12
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 23
OSI MPEG-1VCD
Dfinition : Video Compact DiskDvelopp en 1983 pour le support de la vido de qualit TV.
- VCD v1.0 (Codage MPEG-1 et lecture linaire)- VCD v2.0 (Codage MPEG-1 avec accs interactif similaire CD-I)- VCD 3.0 (MPEG-2)
Capacit : 680 Mo 70 Minutes de vido
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 24
OSI MPEG-1CD-I
Dfinition : Compact Disk InteractiveDvelopp en 1983 par Philips pour le support de la vido qualit
VHS.Abondonn en 1999 pour le DVDCodage MPEG-1 32 fps avec accs interactifCible : Lecture sur TV et non PC (plus simple, dbit unique et peu
coteux)Capacit :
680 Mo 70 Minutes de vido
Lecteur CD-I peut lire VCD, CD Audio, et Photo-CD de kodak
-
13
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 25
OSI MPEG-2
Dfinition: norme de compression dimages animes et du son propose en
1994 par OSI et UIT (H.262). Regroupe 4 normes :
IS-13818-1 (Systme) IS-13818-2 (Vido) IS-13818-3 (Audio) IS-13818-7 (DSM-CC) Digital Storage Media-Command and Control
Norme universelle pour le stockage et les communications vido Qualit TVHD avec dbits variables ou constants jusqu 100Mbps Accepte la vido entrelace (TV) et progressive (Informatique) Compatible avec MPEG1 et B-ISDN/ATM Robuste aux erreurs de communications
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 26
OSI MPEG-2- Multiplexage Audio/Vido -
Horloge
Codeurvido
Codeurvido
Paqutiseur
Paqutiseur
PES
PES
MultiplexeurProgramStream
MultiplexeurTransport
Stream
Vido
Audio
ProgramStream
(paquets delongueur
variable, basede temps
commune)
TransportStream
(paquets delongueur fixe,pas de base de
tempscommune)
-
14
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 27
MPEG-2 - Processus de Compression
PES : Packetized ElementaryStream
ES : Elementary stream
TS : Transport streamPS : Program Stream
AAL PDU
Cellule ATM
Bit
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 28
OSI MPEG-2- Synchronisation -
Synchronisation des Flux audio et vido
Synchronisation des horloges du Codeur et duDcodeur
-
15
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 29
OSI MPEG-2- Synchronisation Audio/Vido -
Au moyen de TimeStamps situs dans les en-ttes despaquets Program Elementary stream (PES) :
le presentation video-conferencing time stamp (PTS) :indique au dcodeur quel moment prsenterlinformation lutilisateur final.
le decoder time stamp (DTS) : indique au dcodeurquand dcoder linformation situe dans ses buffersaudio et vido.
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 30
OSI MPEG-2- Synchronisation des Horloges -
Les horloges du codeur et du dcodeur ont des compteurs cods 42 bits et incrments la frquence de 27 MHz :
Utilisation dune boucle verrouillage de phase (PLL) Codes Program Clock Reference (PCR) : insrs
intervalles rguliers dans les en-ttes des paquetsTransport Stream.
-
16
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 31
OSI MPEG-2- Compression -
3 type dimages (I, P, B) avec compression images B amliore + 6 canaux audio (multilingues) Formats vido accepts en entre :
CIF et SIF 352x288 jusqu 30 fps CCIR 601 720x575 avec 30 fps TVHD 1920 x 1152 avec 60 fps
Dfinition de profils (outils) et de niveaux (qualit) Codage Hierarchique
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 32
OSI MPEG-2- Profiles et Niveaux -
-
17
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 33
OSI MPEG-2- Niveaux -
Les niveaux (Levels) sont associs avec le format de la source etdfinissent un niveau de qualit :
Low Level : un quart du format ITU-R Recommendation BT. 601. Main Level : Plein format ITU-R Recommendation BT. 601. High-1440 Level : Format Haute Definition avec 1440 chant/ligne. High Level : Format Haute Dfinition avec 1920 chant/ligne.
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 34
OSI MPEG-2- Codage Hierarchique -
A quoi a sert ?
Objectif : Economiser les ressources de communication et
de stockage Permettre des terminaux de
puissances/capacits diffrentes derecevoir/visualiser les mmes squences vido enne traitant que les informations utilisables
-
18
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 35
OSI MPEG-2- Codage Hierarchique (2) -
?
Comment a marche ? :
+
+
Flux vido de base
Flux vido d'amlioration 1
Flux vido d'amlioration 2
Qualit 1
Qualit 2
Qualit 3
(2 Mb/s)
(1 Mb/s)
(500 Kb/s)
Total : 3.5 Mb/s au lieu de 7.5 Mb/s (3 Mb/s + 2.5 Mb/s + 2 Mb/s)
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 36
OSI MPEG-2- 4 modes de codage hierarchique -
Codage hirarchique Temporel : variation de la frquence dimages
Codage hirarchique Spatial : variation de la taille dimages
Codage hirarchique SNR : variation de la qualit de limage (taux de
compression)
Partitionnement des Donnes (Data Partitioning) : variation de la qualit de limage (quantit
dinformation)
-
19
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 37
OSI MPEG-2- Data Partitioning -
DCT
Low Frequencies (well perceived by the HVS)Medium FrequenciesHigh Frequencies (not perceived by the HVS)
132 136 138 140 144 145 147 155
136 140 140 147 140 148 155 156
140 143 144 148 150 152 154 155
144 144 146 145 149 150 153 160
150 152 155 156 150 145 144 140
144 145 146 148 143 158 150 140
150 156 157 156 140 146 156 145
148 145 146 148 156 160 140 145
172 -18 15 -8 23 -9 -14 19
21 -34 24 -8 -10 11 14 7
-9 -8 -4 6 -5 4 3 -1
-10 6 -5 4 -4 4 2 1
-8 -2 -3 5 -3 3 4 6
4 -2 -4 6 -4 4 2 -1
4 -3 -4 5 6 3 1 1
0 -8 -4 3 2 1 4 0
Block of 8x8 pixels
Flux de base
Fluxcomplmentaires
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 38
MPEG-1 vs MPEG-2
MPEG1 MPEG2Formats vido en entre SIF CCIR-601, SIF 4:2:0, 4:2:2, 4:4:4
Progressif Progressif / EntrelacDbit binaire constant
( 1.856 Mbps)Constant ou variable ( 100 Mbps)
Latence maximale 150 ms 150 ms
Codage hirarchique non SNR, spatiale, temporelle, datapartitioning
DCT non entrelace Trame (progressive), Image(entrelace)
Mode de balayage zigzag Zigzag et alternatifEstimation de mouvement macrobloc 16x16
non entrelace
Macrobloc 16x16, 16x8Entrelace et non entrelace
Access image Alatoire Alatoire / Channel hoppingVecteurs de mouvement pour P, B seulement Pour P, B et I
Vecteurs de mouvement I pour ErrorConcealment (dissimulation)
-
20
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 39
OSI MPEG-2- Applications -
Applications : norme universelle pour le stockage et les communications vido Haute qualit avec dbits variables ou constants jusqu 150Mbps accepte la vido entrelace (TV) et progressive (Informatique)
DVD (Digital Video Disk) : stockage vido numrique DVB (Digital Video Broadcast) : vido numrique par cble/satellite VOD (Video On Demand) sur B-ISDN / ATM TVHD (ATV USA) D-VHS (JVC)
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 40
OSI MPEG-2- DVD -
Digital Video Disk (Codage MPEG-2 Video).Dvelopp en septembre 1995 par 10 companies (Hitachi, JVC,Matsushita, Mitsubishi, Philips, Pioneer, Sony, Thomson, Time Warner,et Toshiba) pour le support de la vido qualit cinma.Renomm Digital Versatil Disk (vido, donnes, audio, jeux, )Il y avait l'origine deux standards concurrents pour le DVD :
le format MMCD de Sony et Philips, et le format SD de Toshiba et Time Warner
Un consortium men par IBM a insist pour quil ya ai un standardunique, le DVD.
-
21
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 41
DVD- Capacit et fonctions -
Capacit et fonctionnalits : 4.7 Go (une couche) - 2h13 8.5 Go (double couche) - 4h30 heures 17Go (double couche et double face) - 8 heures 6 canaux stro (PCM CD-Audio, Dolby Surround, DTS, .) 8 pistes audio (multilingues) 32 pistes de sous-titres 9 angles de vues Zoom numrique X2 ou X4 dune zone
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 42
DVD- Licences et copyright -
Toutes les socits fabricant des DVD doivent acqurir la licenceappartenant au consortium.
Les royalties sont de : 5% pour un lecteur de DVD-Vido, 6$ pour un lecteur de DVD-ROM et dcodeur et 10 cents pour un disque.
-
22
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 43
DVD- Formats -
Il faut distinguer le : DVD-Audio : support de la musique uniquement DVD-Vido : support audio-video avec lecture sur un TV DVD-Rom : Audio/Video et lecture sur un PC (plus donnes info.)
DVD-R : enregistrable une fois DVD-RAM : reiniscriptible
Un lecteur DVD peut lire les formats CD, VCD, CDI
Supporte MPEG2 video et MPEG1 video Dbit : 3.5 Mbps qualit TV Dbit : 6 Mbps qualit studio
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 44
6 rgions ont t dfinis par le DVD-Consortium pour rendreincompatibles entres eux les lecteurs et les disques DVD :
1: Canada, tats-Unis et territoires rattachs2: Japon, Europe, Afrique du Sud, Moyen Orient (incluant l'gypte)3: Asie du sud-est, Est de l'Asie (incluant Hong Kong)4: Australie, NZ, Ile du Pacifique, Amrique Centrale, Mexico, Amrique
du Sud, Carabes5: CEI, Inde, Afrique, Core du Nord, Mongolie6: Chine
Code 0 : Lecteurs compatibles toutes zones
DVD- Systmes de Protection -
-
23
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 45
DVDSystmes de Protection (2)
4 systmes de protection contre les enregistrements illgaux :
Analog Protection System (APS) Empche la copie dun DVD sur VHS en analogique
Systme CGMS C'est un systme de gestion de niveau de gnration de
copie (CGMS) conu pour empcher les copies numrique ou lescopies de copies.
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 46
Content Scrambling System (CSS) mthode d'encryptage de donnes destine interdire la
lecture des fichiers directement sur le systme de fichier duDVD via un PC.
Digital Transmission Content Protection (DTCP) Pour les lectures la demande et distance sans possibilit
de raliser une copie localement
DVDSystmes de Protection (3)
-
24
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 47
DVD Audio
Le format DVD-Audio require 2 modes de codage audio : Le Linear PCM Le Meridian Lossless Packing
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 48
DVD AudioLinear PCM
Codage non compress/sans pertes (identique aux CD-Audio)offrant jusqu' 6 canaux et un chantillonnage de 48, 96 ou 192kHz (ainsi que 44,1/88,2/176,4 kHz) et une profondeur de codagede 16/20/24 bits.Le dbit maximum est de 6.144 Mbps.La dynamique est de 96 dB avec 16 bits, ou 120 dB avec 20 bits.La frequency response peut aller jusqu' 22 000 Hz partird'un chantillonnage de 48 kHz.Toutefois, davantage de profondeur dans le codage et unefrquence d'chantillonnage plus grande sont utiles pour le travailen studio ainsi que pour des traitements numriques pousss oupour une reproduction spatiale du son.Les lecteurs de DVD doivent tre compatibles avec toutes lesvariations du LPCM
-
25
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 49
DVD AudioMeridian Lossless Packing
Adopt en Aot 1998, il permet un codage sans pertes maiscompress. Les dures d'coutes de deux canaux 192kHz/24 bit seront d'environ 120 140 minutes.
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 50
DVD Vido - Partie Audio
un DVD-Vido peut avoir 8 pistes audio. Chaque piste audio peut trede lun de ces trois formats :
Dolby Digital (anciennement appel AC-3): 1 5.1 canaux MPEG Audio: 1 5.1 ou 7.1 canaux PCM: 1 8 canaux.
Trois autres formats optionnels sont possibles mais tous deuxncessitent des dcodeurs externes et ne sont pas compatibles avectous les lecteurs :
DTS THX et SDDS
Remarque : Le .1 fait rfrence au canal basses frquences (LowFrequency Effects LFE) qui se branche un caisson de basses.
-
26
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 51
DVD Vido - Partie AudioDolby Digital
Dolby Digital est le format utilis sur la majorit des DVD (en Zone 1).Cest un format sonore numrique et mutli-canal, comprim, avec latechnologie de codage AC-3 de la socit Dolby Systems, partir duPCM avec une frquence de 48 kHz sur 16 bits.Le dbit est de 64 kbps 448 kbps, avec 384 kbps tant le dbitnormal des 5.1 canaux et 192 kbps tant le dbit normal de la stro(avec ou sans codage surround).Les combinaisons de canaux sont (front/surround) : 1/0, 1+1/0 (dualmono), 2/0, 3/0, 2/1, 3/1, 2/2, et 3/2.Le canal LFE est optionnel avec tous ces combinaisons.
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 52
DVD Vido - Partie AudioMPEG Audio
MPEG audio est un format sonore numrique et multi-canal, comprim partir du PCM avec une frquence de 48 kHz sur 16 bits. Le DVDsupporte le MPEG Audio layer 1 et 2 uniquement.Le MPEG Audio Layer III (MP3) et le MPEG-2 Audio AAC ne sont passupports par le standard DVD-Vido.Le dbit variable est compris entre 32 912 kbps, 384 kbps tant ledbit moyen. Le MPEG-1 est limit 384 kbps.Les combinaisons de canaux sont (front/surround) : 1/0, 2/0, 2/1, 2/2,3/1, 3/2 et 5/2. Le canal LFE est optionnel.Le 7.1 ajoute les canaux central-gauche et central-droit, mais peu desystme exploiteront tous les canaux.
-
27
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 53
DVD Vido - Partie AudioDTS
DTS (Digital Theater Sound) est un format sonore (optionnel)numrique et multi-canal (5.1), comprim partir du PCM avec unefrquence de 48 kHz et en 20 bits.
Le dbit est de 64 1536 kbps (bien que le DTS Coherent Acousticspuisse aller jusqu' 4096 kbps pour une compression sans perte).Les combinaisons de canaux sont (front/surround) : 1/0, 2/0,3/0, 2/1,2/2, 3/2. Le canal LFE est optionnel.
Le standard DVD inclut un format de flux audio rserv au DTS, maisles lecteurs de premires gnrations ne le reconnaissent pas.
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 54
DVD Vido - Partie AudioTHX
THX (Tomlinson Holman Experiment) de la socit LUCASn'est pas un format sonore.
C'est tout simplement un ensemble de traitement appliqupar les amplificateurs certifis THX.
Le traitement THX 4.0 est ajout au Dolby Pro Logic.Le traitement THX 5.1 est ajout au Dolby Digital.
-
28
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 55
DVD Vido - Partie AudioSDDS
SDDS (Sony Dynamic Digital Sound) est un format sonorenumrique et multi-canal (5.1 7.1), comprim partir duPCM 48 kHz.
Le dbit peut atteindre 1280 kbps.
SDDS est un format sonore pour une diffusion en salle bassur le format de compression ATRAC qui est aussi utilis parle Minidisc.
Sony n'a pas encore annonc son intention de mettre enoeuvre le SDDS sur le DVD.
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 56
MPEG-2 DVB- Digital Video Broadcast -
Consortium de 220 membres de 30 pays tablit enSept. 1993 sous legide de lETSI/ISO pour normaliserla diffusion de la vido MPEG-2 numrique : par cble DVB-C par voix hertzienne DVB-T par satellite DVB-S Interactive DVB-I Multipoint (MMDS - < 10Ghz) DVB-MS
Avec prservation des fonctions des systmes analogiquesexistants (Teletexte, brouillage, accs conditionnel, )
-
29
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 57
DVBCodage Source / Canal
Codage source : Compression et Multiplexage MPEG-2 Video MPEG Audio Layer II (Musicam) (non compatible avec Dolby AC3) TRANSPORT STREAM Multiplex PROGRAM STREAM Multiplex
Codage Canal : Modulation DVB-S (ETSI 300 421) : QPSK Quadrature Phase Shift Keying DVB-C (ETSI 300 429) : QAM Quadrature Amplitude Modulation DVB-T (ETSI 300 744) : COFDM Coded Orthogonal Frequency
Division Multiplexing
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 58
DVB I et DAVIC
DVB coopre avec le consortium DAVIC (Digital Audio VisualCouncil), pour la conception de services multimdia avancsinteractifs (Internet, VOD, etc ).Le Groupe DAVIC favorise lmergence de servicesaudiovisuels numrique en laborant de nouvelles normes enmatire de protocoles, dinterfaces et dinfrastructures afindaccrotre leur interoprabilit.
Les spcifications sont bases sur les travaux de lUIT, lATMForum, lOSI, le DVB, IETF, etc pour combler les lacunes.
-
30
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 59
DVB-S
Norme la plus rpandue et utilis dans les 6 continents.
Mode de transmission QPSK - porteuse de 36 Mhz - 39 Mbps
MPEG2 TS : Audio, Video et Donnes transports par des PaquetsMPEG2 Transport Stream de taille fixe (188 octets)Codage pour protection contre erreurs :
Code Viterbi (2/3 : 33 % doverhead) Code Reed Solomon (204/188 avec 16 octets de FEC : 8%overhead) Entrelacement des octets avant transmission
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 60
DVB-T
Norme approuve par ETSI en Fevrier 1997.
Mode de transmission OFDM robuste aux chos multichemins provoqu par les immeubles
1705 porteuses de 2kHz (receveurs de faible puissance) 6817 porteuses de 8Khz
Codage FEC Reed Solomon pour la protection contre les erreurs
-
31
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 61
DVB-C
Mode de transmission QAM porteuses de 8Khz - 38.5 Mbps (64-QAM) Codage FEC Reed Solomon pour la protection contre les erreurs
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 62
US ATSC DTV
ATSC : Advanced Television Systems Committee fonde en 1987 etregroupant 200 membres internationaux pour la dfinition des normes deDiffusion terrestre de la TV Digitale (DTV) :
basse dfinition : SDTV Haute definition : HDTV (A/53)
Normes bases sur :
MPEG-2 Video Dolby AC.3 pour le Son
Norme HDTV concurrente de DVB-T et DVB-C (Europeenne)En 1996, le FCC (Federal Communications Commission) adopte la norme
ATSC/53 (Sept. 1995) pour les USA. Puis rejoint par le Canada, la Coredu Sud en 1997, Taiwan et lArgentine en 1998.
-
32
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 63
US ATSC A/53HDTV Grand Alliance
Canal de 6 Mhz : 38 Mbps par voie hertzienne (5x la TV classique) 19 Mbps par Cble
Frquence dchantillonage vido: 27 Mhz
Codage des Presentation (PTS) et Decoding Time stamps (DTS) sur 42 bits)Rsolutions :Video standard Active lines Active samples/ line Frame Rate RatioSMPTE 274M 1080 1920 60 Hz (Entrelace) 1:1, 4/3, 16/9
1080 1920 30 Hz (Progressive) 1:1, 4/3, 16/9
Audio : Dolby AC.3 : 48 Khz 16 bit/s = 384 Kbps
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 64
VOD
On peut classer les services de VOD en plusieurs catgories (Niveaudinteractivit):
No-VOD : Les services Broadcast similaire la TV broadcast, pourlequel lutilisateur est passif et na aucun contrle sur la session.
PPV-VOD : Les services Pay-per-view pour lesquels lutilisateur payepour des programmes spcifiques, similaire au CATV PPV services.
Q-VOD : Les services Quasi Video-on-Demand pour lesquels lesutilisateurs sont regroups par profil/intrt, les utilisateurs peuventintervenir en changeant de groupe.
N-VOD : Les services Near Video-on-Demand, pour lesquels lesfonctions davance ou de retour sont rendues par transition dans desintervalles de temps discret.
T-VOD : Les services True Video-on-Demand, pour lequel lutilisateura un contrle complet sur la session (fonctions VCR).
-
33
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 65
VOD- Equipements -
Serveurs de stockage Serveurs de contrle de session Terminalx utilisateur (set-of-box) Infrastructure de communication
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 66
VOD- SERVEURS RAID -
Redundant Array of Inexpensive Disks :Architecture de serveurs de stockage haute tolrance auxfautes, disponibilit et dbits.
-
34
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 67
VOD- SERVEURS RAID (2)-
RAID level 0 : un seul contrleur - un seul canal SCSI - et plusieurs disques Segmentation des fichiers en blocs de 4 Ko avec distribution sur
plusieurs disquesRAID level 1 :
idem level 0 avec en plus disques mirroringRAID level 2 :
un seul contrleur - plusieurs canaux SCSI - accs parallle entrelacement de bits de fichiers diffrents sur un mme disque ajout de codes de Hamming pour le contrle d erreurs
RAID level 3 : idem level 2 ajout de codes de parit sur un disque ddi
RAID level 4 : idem level 3 mais entrelacement au niveau secteur
RAID level 5 : idem level 4 avec retrait/insertion chaud de disques
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 68
VOD- Cluster Fibre channel-
Technologie dvelopp en 1988 pour le raccordement hauts dbits de plus de 128 devices (Rseaux/Canal)
Exemple de Canal : SCSI Exemple de Rseau : Ethernet
Permet de crer des serveurs accs multiples enarchitecture rpartie
-
35
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 69
Standardis en 1994 par ANSI et OSI Architecture en 5 couches de niveaux 1 et 2. Dbit : jusque 1062,5 Mbps
Taux de transfert utile : 800 Mbps Encodage 8/10 : 200 Mbps Correction derreurs : 62.5 Mbps
Multiples Topologies possibles (boucle, point--point) Multiples supports possibles : fibre, coax, UTP Distance : jusque 10 km Indpendant des protocoles suprieurs : ATM, IP, etc ...
VOD- Cluster Fibre channel (2) -
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 70
VOD- SET OF BOX -
Il sagit dun botier install chez labonn et qui lui permet dinteragir avecle serveur de VoD partir de la tlvision ou de lordinateur, parlintermdiaire dune tlcommande et/ou dun clavier
-
36
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 71
SET OF BOX- Fonctions -
Dcompresser en temps rel le flot vido arrivant au botier(MPEG1, MPEG2, ) ;
conversion N/A des flux vido (PAL, SECAM, NTSC) et afficher lebon format lcran ;
Transmettre les requtes clients au serveur ;
Possder une capacit de stockage (mmoire) suffisante pourcontrler la gigue.
Contler les accs aux programmes (SimulCrypt, Possder diffrentes interfaces rseaux (ADSL, FTTC, HFC,
ATM) et utilisateurs;
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 72
VOD- Rseaux -
Solution propose par lATM Forum : protocole ATM protocole AAL5 Codage MPEG-2 CBR Service ATM - CBR
Solutions proposes par IETF (Internet) : sans serveur de streaming (HTTP) avec serveur de streaming (RTP/RSTP) compression H.263 ou codeurs propritaires
Boucle locale : xDSL FTTH Cble ou HFC (Hybrid Coax-Fiber) Hertzien (MMDS)
-
37
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 73
UIT H.263
Dfinition: norme de compression vido base sur H.261 et ddie la
vido trs bas dbits sur Internet, Rseaux locaux etrseaux mobiles.
Dbits entre 5 Kbps 64 Kbps Attendue pour fin 1999. Incorpore dans le standard de terminal multimdia H.323 Applications : VidoConference sur IP, UMTS.
Formats vido en entre accepts : CIF et SIF 352x288 QCIF 176x144 SQCIF 128x96
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 74
UIT H.263+
Dfinition: Norme de compression vido base sur le codage
morphologique Dbits entre 5 Kbps 100 Mbps Incorpore dans la version 1 de MPEG-4 Applications : Vido sur IP, UMTS, .
Formats vido en entre accepts : idem H.263 + 2 fomats de haute qualit :
4CIF 704x576 16 CIF 1408x1152
-
38
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 75
MPEG-3
Dfinition: Norme de compression A/V ddie la TV
numrique haute dfinition. Abondonne car application intgre dans MPEG2
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 76
MPEG-4
Dfinition:
Norme multimdia et non une norme spcifiant une technique deCompression audio et/ou Vido.
MPEG-4 dfinit en ralit un : ensemble doutils (de compression, de correction
derreurs, pour linteractivit et la scalibility) un langage de description des objets multimdia et des
mcanismes pour les coder et les manipuler
Disponibilit : Dbut de la normalisation : 1993 Version 1 - disponible depuis fin 1998 (intgre H.263+) Version 2 - disponible fin 1999 - dbut 2000
-
39
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 77
MPEG-4- Fonctionalits -
MPEG-4 ne cible pas des applications en particulies maispropose un ensemble doutils pour une meilleure :
INTERACTIVITE : Accs aux donnes multimdia par le contenu(Content-based Multimedia Data Access Tools) Manipulation des donnees et des flux multimdia par le contenu(Content-based manipulation and bit-stream editing) Codage de donnes multimdia naturelles et de synthses(Hybrid natural and synthetic data coding)
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 78
MPEG-4- Fonctionalits (2) -
COMPRESSION : Meilleure taux de compression avec meilleure qualit visuelle subjective(Improved coding efficiency) Compression de flux/vues multiples et concurrents(Coding of multiple concurrent data streams) Codage hirarchique par le contenu
(Content-based scalability) Robuste aux bursts derreurs(Robustness in error-prone environments)
-
40
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 79
MPEG-4- Edition/Manipulation -
- Incrustation de logos ou de sous-titres
Avant MPEG4 : dcompresser - diter - recompresser -do dgradation de la qualit
Avec MPEG4 : insertion/limnination/modificationdobjets visuels dans lespace de compression possible
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 80
MPEG-4- Stockage -
Avant MPEG4: mme fond de scne stock plusieurs fois
Avec MPEG4: un seul fond de scne stock
-
41
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 81
MPEG-4- Transmission -
Avant MPEG4 : 3 niveaux de qualits (au niveau scne).
Avec MPEG4: 11 niveaux de qualits diffrentes (au niveauobjet) avec limination adaptative des objets multimdiasinutiles
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 82
MPEG-4- Dcodage -
Avant MPEG4: dcodeur ncessaire avant affichage.Nombreuses mises jours ncessaires
Avec MPEG4: tlchargement dynamique du dcodeuravant la squence vido.
-
42
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 83
MPEG-4- Prsentation -
Avant MPEG4 : rcepteur passif
Avec MPEG4 : rcepteur actif avec possibilit de composerdynamiquement les scnes.
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 84
MPEG-4- AVO-
Audio Visual Object (AVO) :Une scne vido est dcompose en objets multimdiaindpendants,
Object visuel : une personne, un meuble, une carte,... Objets audio : voix dune personne, le bruit de moteur
dune voiture, Object donnes : texte, sous-titre, ...
Ces objets peuvent tre : Naturels ou synthtiques : ils peuvent provenir dune
camra ou dun ordinateur. Un mixage est fait entre dessources relles et des sources synthtiques.
en 2D ou 3D.
-
43
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 85
MPEG-4- Codec Vido -
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 86
MPEG-4- Motion Estimation -
VOP : Video Object Plan
-
44
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 87
MPEG-4- Motion Estimation -
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 88
MPEG-4- System -
Objectifs : La reprsentation/description des objets naturels ou de
synthses (API, C++, JAVA) composition de scnes (BIFS : BInary Format for Scene)
issue de VRML
La gestion des donnes audiovisuelles (multiplexageTransMUX, synchronisation, gestion des tampons mmoires).
La configuration des diffrents composants dun systmeMPEG-4
-
45
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 89
MPEG-4 - Architecture -
Audiovisual InteractiveScene
Composition andRendering
...
Decoding
PrimitiveAV Objects
BIFS
...
ElementaryStreams
FlexMuxNetwork
TransMux
...
Ex: MPEG-2Transport
Object Descriptor
Display andLocal UserInteraction
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 90
MPEG-4- Codage hierarchique -
+
+
Flux vido de base
Flux vido d'amlioration 1
Flux vido d'amlioration 2
Qualit 1
Qualit 2
Qualit 3
.....
Flux vido d'amlioration # N
.....
Qualit N
-
46
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 91
MPEG-4- AUDIO -
Objectifs :Capable dintgrer les toutes dernires et futures technologiesde compression des images (Fractales, Ondellettes) et du sons(TwinVQ, AAC).
Le codage des sons gnriques synthtiques se fait grce un langage de description SAOL (Structured AudioOrchestra Language) qui permet de dfinir un orchestredinstruments pouvant gnrer des sons sortant duninstrument. MPEG4 ne dfinit pas la faon de synthtiserun son mais la faon de dcrire la manire de lesynthtiser. Cela permet de dcrire donc dans le futur desnouvelles mthodes de codage de sons.
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 92
MPEG-4 v1 vs MPEG-4 v2
Possibilit de raliser efficacement du codage multi-vues Amination des corps et objets Amlioration du son (effets spatial, etc ) BIFS amlior (gestion multi-utilisateurs dune mme scne) Dfinition dun nouveau format de stockage dobjets MPEG-4: .M4F
-
47
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 93
Codage Audio- UIT -
Normes Dbits qualit Voix
G.711 64 Kbps (PCM)G.728 16 Kbps (ADPCM)G.722 8 KbpsG.723 5.3 Kbps
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 94
Compression Dbits Dlais Complexit
Layer 1 1:4 192-440 19 ms basseLayer 2 1:6 ..8 96-128 35 ms moyenneLayer 3 1:10..12 8-56-64 59 ms leve
Codage Audio- OSI MPEG-1 et MPEG-2 -
-
48
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 95
Origine Compression Dbits Qualit CD
AAC ATT 1:15 96 KbpsTwinVQ NTT-Yamaha 1:15 80-96 Kbps
Codage Audio- OSI MPEG-4 -
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 96
MPEG-7
Dfinition: Pas une norme de compression Ddie la description smantique des squences vido Attendue pour 2002.
Objectif : Pour linterrogation de bases de donnes multimdia. Exemples de requte : Retouver toutes les squences vido :
comportant une voiture rouge. avec cet chantillon de voix. avec ce visage
-
49
Universit de VersaillesLaboratoire CNRS - PRiSM
Ahmed Mehaoua - 97
Technologies Propritaires
Formats les plus rpandus pour les PC / MAC et sur Internet :- QuickTime (Apple)
- Indo (Intel)- CinPack (Cinpack)- RealVideo (Real Networks)
Problme : non compatibles entre eux - besoin de pr-tlchargerchacun des dcodeurs - volutivit.