PCWeek/UE: В каких индустриях более всего ощущается спрос на катастрофоустойчивые решения?
Ярослав Басий: В телекоммуникационном секторе, на предприятиях энергетики, в финансовых организациях. То есть, в крупных компаниях, где убытки от недоступности информационных сервисов превышают стоимость затрат на построение катастрофоустойчивой системы.
PCWeek/UE: За последние годы изменился спрос на подобные решения?
Сергей Вакуленко: Если раньше большинство компаний надеялось на «авось», то теперь они начинают понимать – такой метод не работает. Особенно, когда катастрофа уже произошла и данные надо восстановить любой ценой. Исследования свидетельствуют, что 70% организаций, которые потеряли критически важные для бизнеса данные и не восстановили их в течение десяти дней, либо вынуждены уйти с рынка, либо несут тяжелые финансовые потери.
Я. Б.: После техногенных катастроф прошлого года в Японии и других странах повысились общие требования к энергогенерирующим и энергораспределящим компаниям. Поэтому в энергетическом секторе растет интерес к различным отказоустойчивым и катастрофоустойчивым системам. Тем более, что сейчас намного больше развиты технологии построения таких систем.
PCWeek/UE: Обычно заказчики обращаются к вам уже после того, как столкнулись с проблемой потери данных, или когда желают предотвратить подобные ЧС?
Я. Б.: И первое, и второе. Некоторые компании уже успели пострадать от различных сбоев и аварий, которые привели к потере данных. Осмотрительные ИТ-менеджеры предпочитают учиться на чужих ошибках.
PCWeek/UE: Что является наиболее распространенной причиной аварий в ЦОДах?
С.В.: Частая причина выхода из строя ИТ-оборудования — срабатывает неправильно спроектированная пожарная сигнализация и система пожаротушения. К аналогичным последствиям приводит затопление ЦОДа сверху или снизу. Нечто похожее произошло недавно в одном украинском банке: над серверным помещением располагалась квартира, в которой лопнула труба. Вся вода просочилась прямо на серверное оборудование, которое вышло из строя. К счастью, специалисты банка своевременно сделали резервную копию, часть информации удалось восстановить. Еще был случай, когда при монтаже оборудования технические сотрудники случайно задели кабель и полностью обесточили одну серверную стойку.
Я. Б.: Украина находится в сейсмоустойчивой зоне и, к счастью, не подвержена таким природным катаклизмам, как цунами, ураган и землетрясение. Поэтому заказчики, как правило, сталкиваются с бытовыми проблемами, связанными с человеческим фактором: отключение питания, затопление, пожары.
Иногда виноват сам заказчик, поскольку допускает ошибки при проектировании ЦОДа. Это приводит к локальным перегревам в серверных помещениях или образованию конденсата, что пагубно сказывается на работе установленного в ЦОДе оборудования. Кстати, в последнем случае оборудование не выходит из строя сразу, а только периодически сбоит. Такие «плавающие» неисправности находить и устранять хуже всего.
PCWeek/UE: Каких рекомендаций должна придерживаться компания при выборе расстояния между основным и резервным ЦОДами?
С.В.: Если заказчик преследует цель защититься от локальной катастрофы, такой как пожар или затопление, достаточно разместить резервную площадку в соседнем здании. Это будет дешевле, чем тянуть коммуникации к ЦОДу в другой район или город.
Если же мы, допустим, хотим застраховаться от наводнения городских масштабов, резервную площадку нужно строить в близлежащем городе или регионе.
Я. Б.: Украинские компании обычно предпочитают вариант соседнего здания в черте города либо в ближайшем пригороде. Такую модель выбрали многие представители энергетического сектора. Дело в том, что каналы связи в Украине пока что обходятся недешево. Поэтому рынок еще не готов к построению катастрофоустойчивых решений высокого уровня — когда основной и резервный ЦОДы разнесены на значительное расстояние. К тому же подобные решения гораздо дороже обслуживать.
Обычно в резервном ЦОДе резервируются не все ИТ-сервисы, а только наиболее критически важные для бизнеса. В случае катастрофы компания докупает или берет в аренду серверное оборудование и переносит на резервную площадку все остальные ИТ-службы. Таким образом, не всегда резервный ЦОД по своей вычислительной мощности повторяет основной. Как правило, он меньше.
PCWeek/UE: Всегда ли используются только две технические площадки?
С. В.: Иногда компании выбирают вариант «одна крупная резервная площадка на несколько небольших основных». Например, банк с множеством отделений в различных регионах может использовать 3-5 небольших основных ЦОДов, для которых построен один мощный резервный.
Я. Б.: Есть и другой вариант, когда несколько небольших организаций подписывают договор с сервис-провайдером, который размещает у себя резервные системы хранения. Такое решение более выгодно для среднего бизнеса, поскольку компании не нужно самостоятельно строить резервную площадку, обеспечивать ее оборудованием, электропитанием, кондиционированием.
PCWeek/UE: Какие еще особенности построения катастрофоустойчивых систем вы можете отметить?
Я. Б.: Для таких решений очень важно регулярно выполнять резервное копирование данных и ротацию резервных копий между основным и резервным ЦОДами. Иначе возможна ситуация, когда утеряна важная информация, а резервной копии для восстановления нет, поскольку миграция ИТ-сервисов с одной площадки на другую по какимлибо причинам не произошла.
Для расчета таких систем применяют два параметра – время восстановления сервисов на первой площадке и допустимое время потери данных. 100% восстановления данных обеспечивают только очень дорогие решения. Как правило, такие системы заказывают лишь крупные банки.
С. В.: Кстати, в некоторых случаях канал связи между основной и резервной площадками может стоить настолько дорого, что проще и дешевле обеспечить физический перенос резервных копий данных с одной точки на другую в конце каждого дня.
PCWeek/UE: Резервный ЦОД, как и основной, также обычно обеспечивают системой бесперебойного питания на базе ИБП и ДГУ?
Я. Б.: Да, но подобную систему необходимо регулярно тестировать. Не исключено, что при пропадании питания в основной электросети и переходе на источник бесперебойного питания дизель-генератор просто не запустится. Обычно таким процедурам уделяют недостаточно внимания даже в основном ЦОДе, что уж говорить про резервный…
С.В.: Прошлой зимой на одном из российских предприятий после пропажи электропитания ИТ-специалисты не смогли запустить дизель-генератор для своего ЦОДа. Как раз были сильные морозы, а сотрудники ИТ-департамента ранее тестировали работу ДГУ только летом, да и то, всего один раз после установки. А ведь такую процедуру надо выполнять регулярно! Также был случай, когда строители случайно перерезали силовой кабель питания, который обеспечивал подключение ДГУ к ЦОДу.
PCWeek/UE: В последние годы в Украине появилось несколько коммерческих ЦОДов достаточно высокого уровня, которые сдают в аренду площадь своих центров. Насколько целесообразно для крупного и среднего бизнеса размещать резервные ЦОДы на арендованных площадках вместо того, чтобы строить свои собственные?
Я. Б.: Далеко не все компании морально готовы отдать оборудование с корпоративными данными в ЦОД, куда теоретически могут иметь доступ чужие сотрудники. И не всегда провайдер в состоянии гарантировать конфиденциальность хранения этой информации. Представьте ситуацию, когда приходит представитель правоохранительных органов и просит предоставить ему доступ к определенному оборудованию...
PCWeek/UE: Но ведь некоторые украинские компании вообще переносят свои ИТ-сервисы в облако, причем нередко — к заокеанским провайдерам?
PCWeek/UE: Сегодня многие компании строят свою ИТ-инфраструктуру на базе технологий виртуализации. Как эволюционировал процесс построения катастрофоустойчивых решений после перехода на виртуальные машины?
С.В.: В целом применение виртуализации заметно упростило задачу построения отказоустойчивых решений. Например, компания VMware, продукты которой чаще всего применяются для создания виртуальной ИТ-инфраструктуры, специально для таких задач выпустила приложение VMware vCenter Site Recovery Manager. Это ПО в случае сигнала об опасности автоматически переносит все защищаемые ИТ-сервисы на резервную площадку.
Если раньше для катастрофоустойчивого решения нужно было подбирать идентичное оборудование, операционную систему, следить за установкой всех последних обновлений ПО, то в виртуальной среде можно переносить сервисы независимо от аппаратного обеспечения. Ведь виртуальная машина способна запускаться на любом сервере, поддерживающем такие технологии.