rozwiązania informatyczne wspierające prowadzenie operacyjnej analizy kryminalnej
DESCRIPTION
Prezentacja do referatu, który zostanie przedstawiony podczas konferencji organizowanej przez Akademię Marynarki Wojennej, Wydział Dowodzenia i Operacji Morskich oraz Koło Naukowe Bezpieczeństwa Morskiego IV Konferencja Naukowa Bezpieczeństwa i Obronności Security&Defence pt. „Współczesne uwarunkowania bezpieczeństwa europejskiego”, 13-14 maja 2014 r., Gdynia: Referat przygotowany wspólnie z Ł. Krajewskim Referat zawiera wyniki badań ankietowych wśród analityków Policji, Straży Granicznej i Centralnego Biura Antykorupcyjnego.TRANSCRIPT
1
W. Filipkowski
Ł. Krajewski
Rozwiązania informatyczne wspierające prowadzenie
operacyjnej analizy kryminalnej
2
• Założenia badawcze
• Cel badawczy
• Metodologia badań
• Charakterystyka grup badawczych
• Podstawowe wyniki
• Prezentacja system analizy informacji - CLUO
PLAN PREZENTACJI
3
Badanie ankietowe przeprowadzone zostało w ramach realizacji jednego z elementów projektu rozwojowego pt. „Nowoczesne technologie dla/w procesie karnym i ich wykorzystanie – aspekty techniczne, kryminalistyczne, kryminologiczne i prawne” finansowanego przez Narodowe Centrum Badań i Rozwoju (Nr O ROB 0021 01/ID 21/2).
Projekt realizowany jest przez konsorcjum w składzie:
• Uniwersytet w Białymstoku (Lider);
• Wojskowa Akademia Techniczna;
• Akademia Górniczo-Hutnicza;
• PPBW Sp. z o.o.
ZAŁOŻENIA BADAWCZE
4
• Rozwiązania technologiczne są w stanie przyspieszyć oraz podnieść efektywność działania organów ścigania, służb specjalnych oraz wymiaru sprawiedliwości
• Korzystanie z rozwiązań technologicznych jest efektywną formą pracy ze względu automatyzację procesów
• Rozwiązania krajowe mogą wpłynąć na obniżenie kosztów w stosunku do rozwiązań zagranicznych producentów
• Zaangażowanie w proces przygotowywania narzędzia informatycznego odbiorców końcowych może przynieść efekt w postaci przygotowania narzędzia dedykowanego, dostosowanego do indywidualnych potrzeb
ZAŁOŻENIA BADAWCZE
5
Określenie, które z wymienionych w ankiecie rozwiązań technologicznych byłyby przydatne w pracy z otwartymi źródłami informacji (w szczególności z Internetem).
Lista zawierała 20 opisów proponowanych rozwiązań, głównie informatycznych.
Przygotowane opisy wypracowane zostały w ramach projektów, które były lub są realizowane w ramach prac Polskiej Platformy Bezpieczeństwa Wewnętrznego.
W wyniku badań można byłoby ocenić bieżące zapotrzebowanie po stronie funkcjonariuszy wybranych instytucji oraz zaplanować kierunki dalszych badań rozwojowych i wdrożeniowych w tym zakresie.
CEL BADAWCZY
6
Badania metodą sondażu diagnostycznego. Przygotowano narzędzie badawcze w postaci kwestionariusza ankiety składającego się z jednego, rozbudowanego pytania dotyczącego 20 rozwiązań technologicznych oraz metryczki.
Do badań wytypowano trzy instytucje państwowe:
• Policję,
• Straż Graniczną oraz
• Centralne Biuro Antykorupcyjne
Jego treść została przedyskutowana z funkcjonariuszami policji podczas spotkania w dniu 23 maja 2013 r. w ówczesnym Biurze Wywiadu Kryminalnego Komendy Głównej Policji (obecnie Biuro Służby Kryminalnej KGP)
METODOLOGIA PRZEPROWADZONYCH BADAŃ
7
Tabela 1. Struktura respondentów według wieku w trzech grupach badawczych
Źródło: Badania własne
SG CBA Policjado 29 lat 2 0 130 – 39 lat 4 12 1540 – 49 lat 9 3 2350 lat i więcej 12 0 3Brak odpowiedzi: 35 0 3
SUMA: 62 15 45
CHARAKTERYSTYKA GRUP BADAWCZYCH
8
Tabela 2. Struktura respondentów według płci w trzech grupach badawczych
Tabela 3. Struktura wykształcenia respondentów w trzech grupach badawczych
Źródło: Badania własne
SG CBA Policja
Kobieta 2 1 4
Mężczyzna 46 14 37
Brak odpowiedzi: 14 0 4
SUMA: 62 15 45
SG CBA Policjaśrednie 7 0 4wyższe licencjat 12 2 0
wyższe magisterskie42 12 36
Brak odpowiedzi:1 1 5
SUMA: 62 15 45
CHARAKTERYSTYKA GRUP BADAWCZYCH
9
Tabela 4. Struktura respondentów według stażu pracy na stanowisku związanym z analizą informacji w trzech grupach badawczych.
Tabela 5. Struktura respondentów w trzech grupach badawczych według faktu, czy brali udział w szkoleniu z zakresu białego wywiadu
Źródło: Badania własne
SG CBA Policjado 5 lat 31 5 106-10 lat 23 8 2411-15 lat 6 2 615 lat i więcej 0 0 3
Brak odpowiedzi: 2 0 2SUMA: 62 15 45
SG CBA PolicjaTak 6 13 3Nie 54 2 38
Brak odpowiedzi: 2 0 4
SUMA: 6215 45
CHARAKTERYSTYKA GRUP BADAWCZYCH
10
Badanie ankietowe skierowane zostało do funkcjonariuszy Policji, Straży Granicznej oraz Centralnego Biura Antykorupcyjnego będący analitykami kryminalnymi.
W badaniu łącznie wzięło udział 129 funkcjonariuszy w tym:
• 42 funkcjonariuszy Policji,
• 72 funkcjonariuszy Straży Granicznej,
• 15 funkcjonariuszy Centralnego Biura Antykorupcyjnego.
Respondenci poproszeni zostali o wskazanie przydatnych/nieprzydatnych ich zdaniem rozwiązań technologicznych w pracy z otwartymi źródłami informacji. Osoby w udzielanych odpowiedziach miały posłużyć się skalą od 1 do 5, gdzie 1 oznacza najmniejszą, a 5 największą przydatność.
PODSTAWOWE WYNIKI
11
Tabela 6. Najwyżej i najniżej oceniane rozwiązania przez funkcjonariuszy Policji:
L.P. Treść pytania średnia mediana Ilość wskazańNajwyżej ocenione propozycje rozwiązań:
1
Rozpoznawanie informacji o potencjalnym przestępstwie w Internecie (na bieżąco lub w sposób wyprzedzający) np. o sprzedaży/kupnie przedmiotów z kradzieży, organów fałszywych dokumentów, bądź „ustawkach” pseudokibiców, pedofilach, itp.
4.0 4 41
2Poszukiwanie informacji dotyczących tego samego zdarzenia, podmiotu, miejsca, itd. 3,9 4 42
3Wsadowe sprawdzanie numerów IMEI, MSISDN wraz z ustaleniem właściwego operatora telekomunikacyjnego. 3,8 4 41
Najniżej ocenione propozycje rozwiązań:
18Analiza w czasie i przestrzeni pojawiających się nowych wątków, komentarzy, itp. 3,2 3 41
19
Wskazywanie w informacjach danych, które powtarzają się w przekazach – podstawowy korpus informacji o zdarzeniu 3,1 3 40
20
Badanie sentymentu w informacjach czyli nastawienia emocjonalnego autora informacji do opisywanego zdarzenia, podmiotu, miejsca, osoby, itd. 2,6 3 41
PODSTAWOWE WYNIKI
12
Tabela 7. Najwyżej i najniżej oceniane rozwiązania przez funkcjonariuszy CBA:
L.P. Treść pytania średnia mediana Ilość wskazańNajwyżej ocenione propozycje rozwiązań:
1
Rozpoznawanie informacji o potencjalnym przestępstwie w Internecie (na bieżąco lub w sposób wyprzedzający) np. o sprzedaży/kupnie przedmiotów z kradzieży, organów fałszywych dokumentów, bądź „ustawkach” pseudokibiców, pedofilach, itp.
3,75 4 15
2
Monitorowanie różnych źródeł (blogów, newsów, social media) i archiwizowanie danych pod kątem pojawiania się informacji o potencjalnych przestępstwach. 3,75 4 15
3Wsadowe sprawdzanie numerów IMEI, MSISDN wraz z ustaleniem właściwego operatora telekomunikacyjnego. 3,75 4 15
Najniżej ocenione propozycje rozwiązań:
18Poszukiwanie informacji dotyczących tego samego zdarzenia, podmiotu, miejsca, itd. 3,5 4 15
19Analiza w czasie i przestrzeni pojawiających się nowych wątków, komentarzy, itp. 3,5 4 15
20
Badanie sentymentu w informacjach czyli nastawienia emocjonalnego autora informacji do opisywanego zdarzenia, podmiotu, miejsca, osoby, itd. 3,5 4 15
PODSTAWOWE WYNIKI
13
Tabela 8. Najwyżej i najniżej oceniane rozwiązania przez funkcjonariuszy SG:
L.P. Treść pytania średnia mediana Ilość wskazań
Najwyżej ocenione propozycje rozwiązań:
1
Rozpoznawanie informacji o potencjalnym przestępstwie w Internecie (na bieżąco lub w sposób wyprzedzający) np. o sprzedaży/kupnie przedmiotów z kradzieży, organów fałszywych dokumentów, bądź „ustawkach” pseudokibiców, pedofilach, itp.
4,43 4 62
2Poszukiwanie informacji dotyczących tego samego zdarzenia, podmiotu, miejsca, itd. 4,19 4 62
3Wsadowe sprawdzanie numerów IMEI, MSISDN wraz z ustaleniem właściwego operatora telekomunikacyjnego. 4,46 4 62
Najniżej ocenione propozycje rozwiązań:
18
Alerty o rozruchach, zbiegowiskach publicznych, katastrofach na podstawie monitorowania portali lub for dyskusyjnych. 3,11 3 62
19Analiza w czasie i przestrzeni pojawiających się nowych wątków, komentarzy, itp. 3,06 3 62
20
Badanie sentymentu w informacjach czyli nastawienia emocjonalnego autora informacji do opisywanego zdarzenia, podmiotu, miejsca, osoby, itd.
2,46 3 62
PODSTAWOWE WYNIKI
14
System służy do zbierania i analizy informacji dostępnych w Internecie. Stworzony został w architekturze Big Data, składa się z kilku modułów, które podzielić można na:
1. System pobierania (akwizycji danych)
2. System przetwarzania dokumentu
3. Kilka systemów analitycznych
W całości, program jest samodzielnym systemem informatycznym, pozwalającym na zbieranie i przetwarzanie dużych ilości informacji pochodzących z Internetu, odkrywając wiedzę zawartą w analizowanych źródłach danych.
PREZENTACJA SYSTEM ANALIZY INFORMACJI - CLUO
15
System pobierania (akwizycji danych), włącznie ze szczegółowymi informacji o dacie, autorze poszczególnego wpisu, etc.
1. crawlery forów internetowych (obsługujące najbardziej popularne silniki)
2. crawlery serwisów społecznościowych3. uniwersalny crawler stron internetowych, 4. włącznie z dedykowanymi ekstraktorami do kilkudziesięciu
wybranych serwisów blogowych i newsowych
PREZENTACJA SYSTEM ANALIZY INFORMACJI - CLUO
16
System przetwarzania dokumentu, ekstraktujący dane i wzbogacający model dokumentu o dodatkowe cechy - sentyment, wskazane nazwane jednostki (osoby, miejsca, organizacje, adresy email, etc.), kategoria, itd.
PREZENTACJA SYSTEM ANALIZY INFORMACJI - CLUO
17
Kilka systemów analitycznych:1. na podstawie zadanych kryteriów budowany jest raport na
temat trendów, poruszanych tematów, powiązanych terminów, aktywnych użytkowników, etc.
2. znajdowania drogi (cytowań) danej wypowiedzi (włącznie z pierwszym jej wystąpieniem),
3. budowanie mapy połączeń między wskazanymi jednostkami, włącznie z kontekstem, w jakim występują
PREZENTACJA SYSTEM ANALIZY INFORMACJI - CLUO
18
Łukasz Krajewskie-mail: [email protected]
tel. +48 697 – 830 – 228
www.eibw.org
Dziękuję za uwagę!