plnog14: optymalizacja rozwiązywania problemów sieciowych - marcin kuczera

19
PLNOG 14, Warszawa, 2 marca 2015 o mnie dlaczego ten temat ? Optymalizacja rozwiązywania problemów sieciowych Czyli Na czym się skupić w pierwszej kolejności ?

Upload: proidea

Post on 16-Jul-2015

132 views

Category:

Internet


0 download

TRANSCRIPT

Page 1: PLNOG14: Optymalizacja rozwiązywania problemów sieciowych - Marcin Kuczera

PLNOG 14, Warszawa, 2 marca 2015

● o mnie

● dlaczego ten temat ?

Optymalizacja rozwiązywania problemów sieciowych

Czyli Na czym się skupić w pierwszej kolejności ?

Page 2: PLNOG14: Optymalizacja rozwiązywania problemów sieciowych - Marcin Kuczera

PLNOG 14, Warszawa, 2 marca 2015

Co może raportować: ● switch ?

● port down, port up, alarm termiczny, uszkodzenia wentylatorow,

dhcp snooping, poziomy krytyczne DDMI, etc..

● router ? ● port down, port up, bgp neighbour down/up, uszkodzenia

wentylatorow, restarty procesów, etc..

● radiolinia ? ● Loss of Signal, zmiana modulacji (degradacja sygnału), uszkodzenia sprzętu, etc..

SNMP Traps – znany i przydatny mechanizm

Page 3: PLNOG14: Optymalizacja rozwiązywania problemów sieciowych - Marcin Kuczera

PLNOG 14, Warszawa, 2 marca 2015

SNMP Traps – zbieramy informacje DUŻO INFORMACJI !

TRAP Collector

Management

IP Network

Page 4: PLNOG14: Optymalizacja rozwiązywania problemów sieciowych - Marcin Kuczera

PLNOG 14, Warszawa, 2 marca 2015

Co robimy z odebranym TRAPem ?

TRAP MIB Library

Rodzaje

Zdarzeń (db)

Definicje Zdarzeń(db)

Lista/baza

zdarzeń/alarmów

Logowanie

do pliku (raw data)

+ baza zdefiniowanych

urządzeń

Page 5: PLNOG14: Optymalizacja rozwiązywania problemów sieciowych - Marcin Kuczera

PLNOG 14, Warszawa, 2 marca 2015

Typy zdarzeń

Page 6: PLNOG14: Optymalizacja rozwiązywania problemów sieciowych - Marcin Kuczera

PLNOG 14, Warszawa, 2 marca 2015

Typy zdarzeń

Page 7: PLNOG14: Optymalizacja rozwiązywania problemów sieciowych - Marcin Kuczera

PLNOG 14, Warszawa, 2 marca 2015

Definicje zdarzeń

Page 8: PLNOG14: Optymalizacja rozwiązywania problemów sieciowych - Marcin Kuczera

PLNOG 14, Warszawa, 2 marca 2015

Definicje zdarzeń

Page 9: PLNOG14: Optymalizacja rozwiązywania problemów sieciowych - Marcin Kuczera

PLNOG 14, Warszawa, 2 marca 2015

Widok Alarmów

Page 10: PLNOG14: Optymalizacja rozwiązywania problemów sieciowych - Marcin Kuczera

PLNOG 14, Warszawa, 2 marca 2015

Widok alarmów

Page 11: PLNOG14: Optymalizacja rozwiązywania problemów sieciowych - Marcin Kuczera

PLNOG 14, Warszawa, 2 marca 2015

Wady wady wady (czynnik ludzki) - Dużo się dzieje - Zajmuje dużo czasu - Opisywanie, weryfikowanie - Trudne do egzekwowania - Powtarzajace się zdarzenia….. WŁAŚNIE !

Jak to się sprawdza w praktyce ?

Page 12: PLNOG14: Optymalizacja rozwiązywania problemów sieciowych - Marcin Kuczera

PLNOG 14, Warszawa, 2 marca 2015

1. Pojawia się i znika – auto-zamykanie, nie zauważamy

2. Pojawia się i znika, ale dużo się dzieje więc nie zauważamy

3. Pojawia się i znika, zauważyliśmy, ale skoro zniknął (alarm się zamknął) to znaczy że nie ma problemu

Czas życia pojedynczego problemu

Page 13: PLNOG14: Optymalizacja rozwiązywania problemów sieciowych - Marcin Kuczera

PLNOG 14, Warszawa, 2 marca 2015

Jak „samonaprawiające” się awarie wpływają na inne aspekty działalności ?

1. Baza wifi flapuje -> abonenci są rozłączani -> wzywają serwis -> kilometry=koszty -> dużo abonentów=dużo kosztów..

2. Restartuje się switch abonencki – konsekwencje jak wyżej

Efekty: - Serwis nie wyrabia, pracownicy źli - Klienci wściekli, serwis nieskuteczny - Problem nie rozwiązany, bo nie znamy źródła problemu !

Page 14: PLNOG14: Optymalizacja rozwiązywania problemów sieciowych - Marcin Kuczera

PLNOG 14, Warszawa, 2 marca 2015

Mamy bazę problemów - od czego zacząć ?

Page 15: PLNOG14: Optymalizacja rozwiązywania problemów sieciowych - Marcin Kuczera

PLNOG 14, Warszawa, 2 marca 2015

A może by tak zrobić statystyki ?

„top 10” z ostatniego miesiąca - definiujemy czasookres - definiujemy ilość zdarzeń na liście

Page 16: PLNOG14: Optymalizacja rozwiązywania problemów sieciowych - Marcin Kuczera

PLNOG 14, Warszawa, 2 marca 2015

Jak to w praktyce wygląda ?

Page 17: PLNOG14: Optymalizacja rozwiązywania problemów sieciowych - Marcin Kuczera

PLNOG 14, Warszawa, 2 marca 2015

To do !

- Tworzenie tzw „Network Service Request” NSR na podstawie zdarzeń ze statystyk

- „wyłączanie” pewnych zdarzeń ze statystyk

- Informacje – alarmy dla nowych zdarzeń w przypadku rozwiązanych problemów

- Agregacja zdarzeń w jeden zdefiniowany alarm

Page 18: PLNOG14: Optymalizacja rozwiązywania problemów sieciowych - Marcin Kuczera

PLNOG 14, Warszawa, 2 marca 2015

Pytania

?

Page 19: PLNOG14: Optymalizacja rozwiązywania problemów sieciowych - Marcin Kuczera

PLNOG 14, Warszawa, 2 marca 2015

W przypadku pytań: Marcin Kuczera E-mail: [email protected]