sla – это не только время устранения инцидентов

18
SLA – это не только время устранения инцидентов Максим Иванов Технический менеджер Москва, 29.10.2013

Post on 08-Aug-2015

88 views

Category:

Technology


2 download

TRANSCRIPT

Page 1: SLA – это не только время устранения инцидентов

SLA – это не только время устранения инцидентов

Максим Иванов Технический менеджер

Москва, 29.10.2013

Page 2: SLA – это не только время устранения инцидентов

2

СОДЕРЖАНИЕ

• Наши привычные SLA • Чего хотят Бизнес и пользователи? • Развитие SLA • Процесс управления доступностью • Процесс управления мощностями

Page 3: SLA – это не только время устранения инцидентов

1 2 3 4 5

НАШИ ПРИВЫЧНЫЕ SLA

Page 4: SLA – это не только время устранения инцидентов

4 1 2 3 4 5

ПАРАМЕТРЫ SLA

• Описание функционала услуги • Типовые операции • Время решения • Время реакции • Доступность (зачастую не знаем, как измерять) • Часы поддержки и предоставления

Низкое Среднее ВысокоеНизкая 16 8 6

Средняя 8 6 4

Высокая 6 4 2

Влияние

Сроч

ност

ь

Время решения, часов

полное

jjiполное

i T

tTD

∑−=

∏=i

iобщая DD

Niподсистемы DD )1(1 −−=

Page 5: SLA – это не только время устранения инцидентов

5 1 2 3 4 5

ТРЕБОВАНИЯ

Для Бизнеса (заказчика услуги): • Гарантии предоставления услуги в рабочее время • Гарантии корректности функционирования • Гарантии высокой производительности услуги

Для пользователей: • Контроль времени выполнения привычных операций • Однозначное определение производительности с точки

зрения потребителей • Инциденты обнаруживаются проактивно

Page 6: SLA – это не только время устранения инцидентов

1 2 3 4 5

РАЗВИТИЕ SLA

Page 7: SLA – это не только время устранения инцидентов

7 1 2 3 4 5

ПАРАМЕТРЫ ДОСТУПНОСТИ

Суммарная недоступность услуги в месяц (часов или %) • «максимум 4 часа простоя услуги в месяц в рабочее

время» Максимальный разовый простой услуги (часов), MTTR

• «непрерывный простой услуги не более 2 часов в рабочее время»

Минимальное время между простоями услуги (часов), MTBF • «простой услуги не чаще 2 раз в месяц»

Измерение всех параметров должно осуществляться на основе реальных транзакций, а не компонентного мониторинга

Page 8: SLA – это не только время устранения инцидентов

8 1 2 3 4 5

ПАРАМЕТРЫ ПРОИЗВОДИТЕЛЬНОСТИ

• Время выполнения пользовательских транзакций (мониторинг задержек на сетевом уровне)

• Время выполнения синтетических транзакций (по заранее записанному сценарию)

• Время выполнения реальных/технических транзакций (транзакции внутри приложения)

• Привязка соответствующих метрик к бизнес-функциям и бизнес-процессам

• Паттерны поведения системы в пиковые периоды Необходимы системы APM (Application Performance Monitoring)

Page 9: SLA – это не только время устранения инцидентов

9 1 2 3 4 5

ПАРАМЕТРЫ ПРОИЗВОДИТЕЛЬНОСТИ

Page 10: SLA – это не только время устранения инцидентов

10 1 2 3 4 5

ПРЕИМУЩЕСТВА APM

Минимизация рисков потерь, связанных с отказами или отклонениями в работе прикладных систем

Контроль качества работы приложений

Контроль SLA

Быстрое и эффективное определение причин деградации производительности

Встроенные рекомендации для устранения выявленных проблем (на основе лучших практик)

Page 11: SLA – это не только время устранения инцидентов

11 1 2 3 4 5

ПРИМЕРЫ ПРОЕКТОВ

«Газпром Межрегионгаз Санкт-Петербург» • Ключевая бизнес-функция: диспетчерский

контроль и учет поставок природного газа • Решение позволило сократить время выполнения типовых

операций (SLA), выявить и оптимизировать ресурсоемкие функции, сократить количество сбоев, уменьшить сроки восстановления

ОСАО «Ингосстрах» • Ключевая бизнес-функция: страхование

физических и юридических лиц • Решение позволило оптимизировать нагрузку

на центральный сервер БД и систему хранения данных – производительность в SLA

• Проект реализован всего за 2 недели

Page 12: SLA – это не только время устранения инцидентов

1 2 3 4 5

ПРОЦЕСС УПРАВЛЕНИЯ ДОСТУПНОСТЬЮ

Page 13: SLA – это не только время устранения инцидентов

13 1 2 3 4 5

ВИДЫ ДЕЯТЕЛЬНОСТИ

• Определение требований бизнеса к доступности (для новых и существующих услуг)

• Определение ключевых бизнес-функций, транзакций, компонентов ИТ-инфраструктуры

• Разработка способов измерения и отчетности • Мониторинг и анализ тенденций • Оценка ИТ-услуг и компонентов, выявление неприемлемых

уровней • Выяснение корневых причин недоступности • Разработка и поддержка плана доступности

Page 14: SLA – это не только время устранения инцидентов

14 1 2 3 4 5

ПРЕИМУЩЕСТВА

• Единая точка ответственности по вопросам доступности • Разработка ИТ-услуг с учетом требований к доступности • Уровни доступности согласованы и измеряются

для поддержки SLM • Взгляд на доступность с точки зрения заказчиков

и пользователей • Переход от исправления ошибок к улучшению качества услуг

(проактивность) • ИТ-подразделения рассматриваются как «добавленная

ценность» для бизнеса

Page 15: SLA – это не только время устранения инцидентов

1 2 3 4 5

ПРОЦЕСС УПРАВЛЕНИЯ МОЩНОСТЯМИ

Page 16: SLA – это не только время устранения инцидентов

16 1 2 3 4 5

ВИДЫ ДЕЯТЕЛЬНОСТИ

• Управление спросом • Моделирование • Масштабирование приложений • Контроль мощностей и производительности • Разработка и поддержка плана мощностей

Page 17: SLA – это не только время устранения инцидентов

17 1 2 3 4 5

ПРЕИМУЩЕСТВА

• Прогнозирование объемов потребления услуги • Готовность ИТ-инфраструктуры своевременно поддержать

планы по развитию бизнеса • Соответствие затрат требованиям бизнеса • Вклад в обоснование стоимости ИТ-услуг • Удовлетворенность заказчика и пользователей благодаря

контролю производительности

Page 18: SLA – это не только время устранения инцидентов

18 1 2 3 4 5

СПАСИБО ЗА ВНИМАНИЕ!

Максим Иванов Технический менеджер

111033, Москва, ул. Волочаевская, д.5, корп.1 +7 495 974 2274 доб. 6145, +7 495 974 2277 (факс)

[email protected] www.croc.ru