Методы классификации дифракционных изображений для...
DESCRIPTION
Методы классификации дифракционных изображений для эксперимента XFEL. С.А. Бобков , А.Б. Теслюк , О.Ю. Горобцов , О.М. Ефанов , М.В. Голосова , И.А. Вартанянц , В.А. Ильин. Научный семинар « Методы суперкомпьютерного моделирования ». 2014. Introduction. - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: Методы классификации дифракционных изображений для эксперимента XFEL](https://reader036.vdocuments.net/reader036/viewer/2022062304/568137b4550346895d9f559b/html5/thumbnails/1.jpg)
Методы классификации дифракционных XFELизображений для эксперимента
. . , . . , . . , . . ,СА Бобков АБ Теслюк ОЮ Горобцов ОМ Ефанов . . , . . , . . МВ Голосова ИА Вартанянц ВА Ильин
2014
Научный семинар« »Методы суперкомпьютерного моделирования
![Page 2: Методы классификации дифракционных изображений для эксперимента XFEL](https://reader036.vdocuments.net/reader036/viewer/2022062304/568137b4550346895d9f559b/html5/thumbnails/2.jpg)
• Free electron lasers (FELs) - new tools to investigate matter at atomic levels
• New possibilities for nano-world imaging:• structure• dynamics• processes
• Single molecule diffraction
• European XFEL – Hamburg
• Will become operational at 2016
Introduction
![Page 3: Методы классификации дифракционных изображений для эксперимента XFEL](https://reader036.vdocuments.net/reader036/viewer/2022062304/568137b4550346895d9f559b/html5/thumbnails/3.jpg)
• Capture an image before the sample has time to respond
• This principle is not restricted to tiny samples
Diffraction before destruction
Short Pulse(<50 fs)
Long Pulse
![Page 4: Методы классификации дифракционных изображений для эксперимента XFEL](https://reader036.vdocuments.net/reader036/viewer/2022062304/568137b4550346895d9f559b/html5/thumbnails/4.jpg)
X-Ray diffraction from single molecule
• No crystal, no Bragg peak
• Continuous diffraction pattern
• The pattern changes as the sample rotates
• One pulse, one measurement
• Random hits in random orientations
![Page 5: Методы классификации дифракционных изображений для эксперимента XFEL](https://reader036.vdocuments.net/reader036/viewer/2022062304/568137b4550346895d9f559b/html5/thumbnails/5.jpg)
• Electron energy up to 14.3 GeV
• 27 000 FEL pulses per second
• Wavelength ~ 6Å
•Pulse time ~ 10 fs
XFEL Coherent imaging
![Page 6: Методы классификации дифракционных изображений для эксперимента XFEL](https://reader036.vdocuments.net/reader036/viewer/2022062304/568137b4550346895d9f559b/html5/thumbnails/6.jpg)
• IT Infrastructure• 2.3 billions of diffraction images daily
• Big data needs management: storage, transfer, indexing,
publishing
• New data – new analysis methods• images are not reproducible
• particle orientation is random
• molecular dynamics
New experiment – new challenges
![Page 7: Методы классификации дифракционных изображений для эксперимента XFEL](https://reader036.vdocuments.net/reader036/viewer/2022062304/568137b4550346895d9f559b/html5/thumbnails/7.jpg)
• We present a new method for automated diffraction images sorting
• Can be used for:• Uninformative images filtering• To get high quality images for structure
reconstruction• To select diffraction images from a particular
molecule• Images datasets indexing and search
The Task
![Page 8: Методы классификации дифракционных изображений для эксперимента XFEL](https://reader036.vdocuments.net/reader036/viewer/2022062304/568137b4550346895d9f559b/html5/thumbnails/8.jpg)
• A new method for feature extraction is required• Visual descriptors from computer vision
methods doesn’t work• Connect spatial structure with diffraction
images
Images feature extraction
![Page 9: Методы классификации дифракционных изображений для эксперимента XFEL](https://reader036.vdocuments.net/reader036/viewer/2022062304/568137b4550346895d9f559b/html5/thumbnails/9.jpg)
Feature vector – CCF spectrum
Cross correlation function
•
• Autocorrelation, q1 = q2
![Page 10: Методы классификации дифракционных изображений для эксперимента XFEL](https://reader036.vdocuments.net/reader036/viewer/2022062304/568137b4550346895d9f559b/html5/thumbnails/10.jpg)
The Method
• Calculate feature vectors for diffraction patterns
• Use some images as a learning dataset for some machine learning algorithm
• Classify the rest
![Page 11: Методы классификации дифракционных изображений для эксперимента XFEL](https://reader036.vdocuments.net/reader036/viewer/2022062304/568137b4550346895d9f559b/html5/thumbnails/11.jpg)
The Model Data
• Three types of diffraction images
Adenovirus capsid Water 2bwt
![Page 12: Методы классификации дифракционных изображений для эксперимента XFEL](https://reader036.vdocuments.net/reader036/viewer/2022062304/568137b4550346895d9f559b/html5/thumbnails/12.jpg)
Algorithm
Data Matrix
Principle component analysis
Feature vector calculation
![Page 13: Методы классификации дифракционных изображений для эксперимента XFEL](https://reader036.vdocuments.net/reader036/viewer/2022062304/568137b4550346895d9f559b/html5/thumbnails/13.jpg)
Simulated data results
All three image classes can be separated from each other
![Page 14: Методы классификации дифракционных изображений для эксперимента XFEL](https://reader036.vdocuments.net/reader036/viewer/2022062304/568137b4550346895d9f559b/html5/thumbnails/14.jpg)
What about experimental data?
![Page 15: Методы классификации дифракционных изображений для эксперимента XFEL](https://reader036.vdocuments.net/reader036/viewer/2022062304/568137b4550346895d9f559b/html5/thumbnails/15.jpg)
Experimental data
First type Second type Empty pattern
Dataset from LCLS (Stanford), two types of molecules
![Page 16: Методы классификации дифракционных изображений для эксперимента XFEL](https://reader036.vdocuments.net/reader036/viewer/2022062304/568137b4550346895d9f559b/html5/thumbnails/16.jpg)
Algorithm improvements
• Particle position estimation for every pattern• Variable bounds
![Page 17: Методы классификации дифракционных изображений для эксперимента XFEL](https://reader036.vdocuments.net/reader036/viewer/2022062304/568137b4550346895d9f559b/html5/thumbnails/17.jpg)
Algorithm improvements
Support vector machine (SVM) for machine learning
• Provide better results than PCA
Data Matrix
Support vector machine
Feature vector calculation
![Page 18: Методы классификации дифракционных изображений для эксперимента XFEL](https://reader036.vdocuments.net/reader036/viewer/2022062304/568137b4550346895d9f559b/html5/thumbnails/18.jpg)
Experimental data results
• SVM-based method successfully separates two classes of molecules
• Empty patterns were classified and filtered out
• More than 85 percent of images were separated properly
![Page 19: Методы классификации дифракционных изображений для эксперимента XFEL](https://reader036.vdocuments.net/reader036/viewer/2022062304/568137b4550346895d9f559b/html5/thumbnails/19.jpg)
IT Background
• We use Python + Numpy + Intel MKL• OpenMP parallelization• 24 Core server – realtime image processing• Kurchatov Supercomputer Centre (complex
for modeling and data analysis for mega-facilities)
![Page 20: Методы классификации дифракционных изображений для эксперимента XFEL](https://reader036.vdocuments.net/reader036/viewer/2022062304/568137b4550346895d9f559b/html5/thumbnails/20.jpg)
Summary
• We have presented a method for diffraction pattern classification
• Our method was tested on simulated and experimental data and it works!
• The method will be used to develop a software for automatic data clustering, separation, indexing and search
• Special particle database will allow quickly analyze experimental data
![Page 21: Методы классификации дифракционных изображений для эксперимента XFEL](https://reader036.vdocuments.net/reader036/viewer/2022062304/568137b4550346895d9f559b/html5/thumbnails/21.jpg)
Thank you!