Download - Classificazione non supervisionata di immagini digitali per applicazioni di image forensics
Classificazione non supervisionata di
immagini digitali per applicazioni di image
forensicsMatteo Innocenti
Firenze, 07/10/2010
Relatori: Prof. Vito Cappellini Dott. Roberto
Caldelli Ing. Francesco
PicchioniIng. Irene Amerini
Obiettivo
Digital Forensics
Digital Camera Identification
Classificazione
Test e risultati
Conclusioni
Sommario
ObiettivoDate N immagini digitali provenienti da K (ignoto) fotocamere,raggruppare le immagini in gruppi corrispondenti alle fotocamere.
N=5 K=2
Digital ForensicsDagli anni ‘80: forte espansione dei dispositivi di acquisizione e manipolazione digitali, primi interessi circa la risoluzione dei casi giudiziari mediante l’utilizzo di prove digitali.
Digital Forensics Workshop, New York (2001): “Digital Forensics è la scienza che permette attraverso l'uso di specifiche metodologie, la raccolta, l'identificazione e l'analisi di prove digitali, allo scopo di ricostruire eventi collegati ad azioni illegali”.
Prova digitale: qualsiasi informazione, con valore probatorio, memorizzata in formato digitale.
Digital Forensics
Computer Forensics
Multimedia Forensics
Analisi del traffico di rete e dei log di sessione dei dispositivi di rete.Estrazione ed analisi dei dati memorizzati nei calcolatori.
Si occupa dei media digitali.Tampering detection e source identification.
Network Forensics
Multimedia ForensicsTampering detectionHa il compito di rilevare tentativi di contraffazione che compromettono l’integrità del media digitale.
Originale Contraffatta
Multimedia ForensicsSource identificationIdentificazione del particolare dispositivo che ha acquisito un media digitale.
Nel caso di fotografie digitali prende il nome di Digital Camera Identification
Esempi applicativiAcquisizione di materiale pedo-pornografico, copia di opere protette da copyright.
Digital Camera Identification
Componente principale del Pattern Noise
Differente sensibilità alla luce dei pixel del sensore
Caratteristica esclusiva del sensore
PRNU (Photo Response Non-Uniformity)
ObiettivoRisalire alla fotocamera digitale che ha acquisito una certa foto.Funzionamento
Si utilizza una caratteristica impronta (fingerprint) della fotocamera: il PRNU.
Si controlla all’interno dell’immagine sotto esame la presenza della fingerprint attraverso il calcolo della correlazione (J. Fridrich ).
J. Lukas, J. Fridrich, M. Goljan, “Digital camera identification from sensor pattern noise”, TIFS 2006.
Denoising
Filtro di Mihçak
M.K. Mihçak, I. Kozintsev, K. Ramchandran, “Spatially adaptive statistical model of wavelet image coefficients and its application to denoising”, ICASSP 1999.
Filtro di denoising Filtro di
denoising
Lavora nel dominio Wavelet.
-
Lavori precedentiChang-Tsun Li (University of Warwick, Coventry)*
Algoritmo di classificazione basato sui campi randomici di Markov (MRF)
Utilizzo di una funzione di enhancement del rumore
Esalta il rumore estratto, eliminando i dettagli della scena ritratta.
Molto utile per immagini di dimensione piccola.
E’ applicato nel dominio della trasformata Wavelet dopo l’estrazione del PRNU.
C.-T. Li, “Unsupervised classification of digital images using sensor pattern noise”, ISCAS 2010.
Enhancer
Originale No enhancer Con enhancer
Esempio su di un blocco di 512*512 pixels Enhancer proposto
ClassificazioneProcedura iterativa (N-1) di clustering.Si inizia con tanti cluster quante sono (N) le immagini nel training-set.Ad ogni iterazione vengono uniti i due cluster più correlati tra di loro.Gerarchia rappresentabile con un dendogramma.
Clustering gerarchico agglomerativo
Condizione di stopOccorre valutare a quale altezza deve essere tagliato l’albero
per ottenere la miglior partizione delle immagini in gruppi.
Valutazione dei cluster con coefficienti di silhouetteAd ogni iterazione si calcola la qualità della partizione corrente.Al termine della procedura si recupera la partizione migliore.
Coefficienti di silhouette
Combinano gli aspetti di coesione e separazione tra clusters.Si calcola si per ciascun rumore i-esimo, poi si effettua la media.
Coefficienti di silhouette
ai è la correlazione media tra i e gli altri rumori appartenenti allo stesso cluster.
bi è la correlazione media tra i e gli altri rumori non appartenenti allo stesso cluster, prendendo la media tra tutti i cluster considerati.
Coefficienti di silhouetteCondizione di stopL’iterazione che verifica:
294294
Esempio su dataset di 300 immagini provenienti da 6 fotocamere
Test e Risultati
Dimensione dei rumori: da 128x128 a 1536x2048 pixelsUtilizzo o meno dell’enhancerComposizione del dataset di addestramento
Variabili
1200 immagini, 200 per ciascuna delle 6 fotocamere utilizzate.Training-set: 50*6, Test-set: 150*6
Dataset
Procedura sviluppata da Chang-Tsun Li in un lavoro precedente.
Confronto
Intel Quad Core Q6600, 4GB RAM, Linux os, Matlab R2009a-b.
HW-SW
Test enhancerTest enhancer
Test su dataset uniformeDistribuzione uniforme: 50 immagini per fotocamera.
Training-set
Test su dataset non uniformeDistribuzione non uniforme: 300 immagini in totale.Risoluzione fissa 512*512 pixels.
Training-set
Test su dataset non uniformeDistribuzione uniforme: 150 immagini per fotocamera.Risoluzione fissa 512*512 pixels.
Test-set
Centroide dei clusters trovatiCostituiscono la conoscenza del classificatore
Fingerprints
Conclusioni
Algoritmo di clustering
Efficienza migliorata notevolmente
Efficacia nettamente migliorata per dataset non uniformi, scenario realistico (fino al +26%)
A parità di tempo di esecuzione, efficacia migliorata anche per dataset uniformi
Enhancer
Efficacia lievemente migliorata
Articolo WIFS 20102010 IEEE International Workshop on Information
Forensics and Security (WIFS’2010)
“Fast image clustering of unknown source images”di R. Caldelli, I. Amerini, F. Picchioni, M. Innocenti
Tasso di accettazione: 28%