... Новости ... Блог ...

Как восстановить бизнес после ИТ-инцидента?

Как восстановить бизнес после ИТ-инцидента?
DEAC | 03.04.2020

По данным компании Eset, 60% российских ИТ-менеджеров всерьез обеспокоены сохранностью персональных данных, и не зря. Исключить полностью перерывы в работе информационных систем и инфраструктуре практически невозможно. Взять хотя бы на заметку факт, что вместе с развитием облачных технологий увеличивается и количество целенаправленных атак, в том числе кража данных, DDoS-атаки, вредоносное ПО и спам становятся все более утонченными.


Отказ в работе сервера может по-разному повлиять на бизнес. Но недоступность полностью всей ИТ-системы наносит катастрофические последствия практически для половины потерпевших компаний – по данным опроса DEAC, в случае инцидента, 50% средних и крупных предприятий в России могут продолжать свою деятельность не более 1 часа.


Как восстановить бизнес после ИТ-инцидента DEAC

Резервирование элементов системы


Чтобы снизить влияние инцидентов на доступность ИТ-систем, компаниям необходимо следить за принятыми мерами, которые позволяют контролировать бизнес-риски и непрерывность самого бизнеса. Такие меры обычно предусматриваются при составлении в специальных технологических дисциплинах – Business Continuity Management (управление непрерывностью бизнеса), Business Continuity Planning (планирование непрерывности бизнеса) и Disaster Recovery Planning (план аварийного восстановления после сбоев).


План аварийного восстановления предполагает не только резервное копирование, это целая цепочка дублирования критически важной ИТ-инфраструктуры: физические серверы, приложения, хранилища, гипервизоры, базы данных, электроснабжение, коммутаторы и пр. Чем отличается бэкап от аварийного восстановления, мы уже рассказывали в предыдущем блоге.


Создавая аварийное восстановление, чаще всего используют параллельное соединение элементов, предусматривая отказ системы только в том случае, если одновременно отказывают все элементы системы. Такой подход построения системы называется резервированием. Зачастую аварийное восстановление включает в себя резервирование отдельных элементов системы (по стандарту – только ключевых), и в зависимости от задач и требований, можно выделить 3 чаще всего упоминаемых типа резервирования для аварийного восстановления: холодное, тёплое и горячее.



Холодное резервирование

Тёплое резервирование

Горячее резервирование

Передача резервных копий с установленной регулярностью с целью восстановить системы или данные на основной дата-центр в необходимый промежуток времени, с установленным интервалом. Виртуальная среда в резервном дата-центре работает по необходимости. Резервная среда запускается только в случае инцидента.

Резервные копии данных и систем отправляются в географически удаленный дата-центр аварийного восстановления. Резервный дата-центр является уменьшенной версией основного, виртуальные серверы работают на ключевые элементы аварийного восстановления.

Более чем один дата-центр выполняет роль резервной среды. Отдельно построенная среда в точности соответствует рабочей среде бизнеса (зеркальное резервирование), и при возникновении сбоев компания может в любой момент полностью переключиться на дублированную инфраструктуру. Копии всей системы и данных создаются, обновляются и хранятся в онлайн режиме с наиболее минимальной задержкой на восстановление.

Плюс: экономный вариант

Плюс: резервная среда не требует сложных конфигураций, зачастую это более экономный вариант.

Плюс: в случае выхода из строя любого элемента системы, система переключается на другой такой же в течение нескольких секунд, но не дольше оговоренного времени.

Минус: очень медленное восстановление, требующее ручной настройки системы после инцидента.

Минус: дорогостоящее обслуживание.

Минус: дорогостоящее построение и обслуживание.




Интересно: читайте также кейс полного аварийного восстановления для сети ресторанов в России.




Что происходит во время инцидента?


Рассмотрим несколько сценариев развития инцидентов – от небольших до крупных, при условии, что данные подсистемы и их элементы являются частью аварийного восстановления.



Инцидент

Действия для восстановления работоспособности

Превентивные действия до инцидента

Отказал один блок питания системы хранения данных (СХД)

Система мгновенно переключается на другие блоки питания. Работа системы хранения данных не прервана.

Резервирование блоков питания для системы хранения данных позволит увеличить уровень доступности.

Отказал один или два диска СХД

Подключаются механизмы защиты RAID, работа СХД может несколько замедлиться, но работает без перерывов.

При конфигурации RAID группы необходимо предусмотреть дополнительные диски.

Перебой в работе целой СХД

Система мгновенно переключается на зеркальную версию на резервной инфраструктуре. Работа системы не прерывается, лишь на время замедляется её работа.

Резервирование системы хранения данных на резервной инфраструктуре сохраняет рабочий процесс непрерывным. Резервная система хранения может располагаться на отдельной ИТ-инфраструктуре. Для обеспечения максимальной безопасности ее рекомендуется разместить в дата-центре с другим месторасположением.

Перерыв канала связи между основным и резервным дата-центром

Система переключается на резервный канал.

Предусматривается наличие более одного канала связи. Между дата-центрами нужно поддерживать канал для синхронизации данных. Чтобы повысить уровень безопасности, необходимо создать отдельные каналы между каждым дата-центром, а также можно использовать выделенный L2 Uplink канал для доступа к данным, который можно использовать для доступа к данным, в случае если канал прекратил работу в основном дата-центре.

Полная остановка работы одной площадки в результате форс-мажорной ситуации (например, пожар).

Полностью вся работа систем переносится на резервную площадку, с небольшой задержкой. Если форс-мажор случился в резервном дата-центре, то после ликвидации аварии, нужно восстановить синхронизацию данных.

Наличие более чем одной резервной площадки обеспечивает важную бизнесу непрерывность и доступность.

Полная остановка работы основной площадки в результате форс-мажорной ситуации, отказ канала связи до резервной площадки.

Работа систем переключается на третью площадку (третий дата-центр), находящуюся за пределами страны.

Чем дальше размещен резервный дата-центр, тем ниже риск влияния инцидентов на него. Более чем один резервный дата-центр повышает уровень непрерывности и стабильности процессов.



Надеяться на лучшее, но готовиться к худшему


Российский бизнес выше всего оценивает влияние кибер-рисков, утечку или потерю данных на непрерывность бизнеса – по шкале 0-10 присвоило данным рискам оценку в 6.3 баллов. Форс-мажорные ситуации и риски возникновения непредвиденных обстоятельств беспокоят россиян несколько меньше – такие риски оценены 5.7 баллами. Но несмотря на данные опроса, самое «тяжелое» влияние на бизнес оказывают не единичные перерывы (отказы), к которым команда опытных ИТ-специалистов уже готова, а форс-мажорные ситуации, которые приводят к одновременному падению нескольких параллельных систем. К таким рискам можно отнести пожар, потоп, крах финансовой системы страны или падение фондовой биржи, вооруженные конфликты, распространение эпидемий (как в случае с коронавирусом) и пр.


Чтобы предотвратить наступление безвозвратных последствий в таких ситуациях, резервы компании необходимо полностью «изолировать» от влияния форс-мажорных обстоятельств. Резервы послужат и в случае, если необходимо в экстренной ситуации на них запустить ключевые сервисы бизнеса. Как грамотно реагировать в случае ИТ-инцидента, подскажет своевременно разработанный, в нескольких экземплярах распечатанный и детально проработанный на практике план аварийного восстановления компании, который должен быть доступен всем задействованным сторонам. После его внедрения, важно продолжать проводить регулярные тестирования всех задействованных систем на возможные задержки или сбои.


Говорят – на войне все средства хороши, и резервную площадку для аварийного восстановления можно развернуть даже дома у директора. Для компаний, чей бизнес больше чем наполовину находиться онлайн и напрямую зависит от перебоев в работе ИТ-систем, потенциально выгоднее запустить одну или две резервные площадки, которые смогут «смягчить удар» практически любой аварии или форс мажора, чем собственноручно строить комбинированные решения или вовсе полагаться лишь на надежность собственной инфраструктуры.


Как восстановить бизнес после ИТ-инцидента DEAC


Облачная инфраструктура - надежнее и быстрее


Возможность строить в облаке виртуальные машины и целые кластеры серверов, при этом используя только необходимые ресурсы, открыта не только для разработок, но и для размещения аварийного восстановления. С помощью надежного облака, можно построить частные подключения между дата-центрами и инфраструктурой бизнеса. Облако, и в частности хочется подчеркнуть частное облако, отличается быстродействием, более высоким уровнем защиты и надежности, и производительности. Поэтому аварийное восстановление, требующее высокой доступности, чаще всего размещают в виртуальной среде, чтобы передача больших объемов данных, например, восстановление базы данных из производственной среды после инцидента, могло происходить без внеплановых задержек.


Современный трафик пересекает тысячи километров в течение миллисекунд, но все же пропускная способность (latency) может влиять на качество и скорость соединения. Если ваш бизнес выбирает удаленный облачный дата-центр в другой юрисдикции и с другим географическим месторасположением, то лучше рассматривать регионы и страны вблизи, например, в Восточной Европе или Балтии. У потенциального оператора дата-центров также советуется попросить период для тестирования скорости каналов до ваших точек присутствия.






Назад



deac-partners-logo
Этот веб-сайт использует cookie-файлы Информируем, что на этом сайте используются cookie-файлы. Cookie-файлы используются для выполнения идентификации пользователя и накапливания данных о посещении сайта. Продолжая пользоваться этим веб-сайтом, Вы соглашаетесь на сбор и использование данных cookie-файлов на Вашем устройстве. Свое согласие Вы в любой момент можете отозвать, удалив сохраненные cookie-файлы.
Закрыть