Начало эксплуатации коммерческого центра обработки данных De Novo стало большим шагом вперед не только для самой компании, но и для украинского ИТ-рынка. Что нового извлекла отечественная ИТ-индустрия из этой весьма амбициозной стройки?
В ушедшем году в ИТ-отрасли сформировались задачи, решение которых для специалистов станет приоритетом на ближайшие несколько лет. Ранее эти вызовы не попадали в поле нашего внимания, но по мере созревания технологий они начали выходить на передний план.
Теперь при создании центров обработки данных и строители, и
заказчики уже не должны особо ломать голову при выборе той или иной архитектуры
или оборудования: ЦОДостроение достигло достаточно высокого уровня зрелости, к
нынешнему дню уже наработаны лучшие практики. Для того чтобы не ошибиться,
достаточно следовать проторенным отраслью путем. Зато возникли новые вопросы,
касающиеся процесса ввода ЦОД в эксплуатацию.
Опираясь на опыт введения в строй центра обработки данных De Novo, могу выделить три момента, являющиеся наиболее важными и интересными.
Первый момент: при
строительстве нашего ЦОД мы впервые применили термальное моделирование. То
есть, мы просчитали движение тепла внутри серверных помещений не «на глаз», а с
помощью специального моделирования. Уже до сдачи объекта мы знали, как в нем
будет распределяться тепло, как будут циркулировать воздушные потоки. Это
позволило нам избежать многих ошибок.
Момент второй: в
прошлом году мы впервые провели нагрузочное тестирование центра обработки
данных. На западе эту процедуру называют shakedown – встряска. Поскольку ЦОД не
с самого начала загружается на полную мощность, очень важно еще до сдачи центра
в эксплуатацию убедиться, что он выдержит полную нагрузку.
Эта задача оказалась не такой простой, как мы предполагали. Хотя
бы потому, что количество энергии, на которое рассчитан ЦОД, нужно
преобразовать в тепло. Сделать это с помощью ИТ-оборудования нельзя – ведь его
в дата-центре еще нет, необходимо найти другой способ. Такой, при котором бы
сохранялась топология воздушных потоков, а системы охлаждения работали бы так,
будто функционирует реальное ИТ-оборудование. К тому же мы нуждались в процедуре
аварийного отключения на случай сбоев. Подобные задачи сегодня решать очень
сложно даже на более развитых рынках.
Для этого нам пришлось разработать специальную технологию,
новые инструменты. В частности – нагрузочные элементы, выполняющие роль
эмуляторов ІТ-нагрузки (они эффективно преобразуют энергию в тепло тем же
образом, как и ІТ-оборудование).
Тестирование должна быть обязательной процедурой
Мы также убедились, что процедура нагрузочного тестирования
должна быть обязательной для любого ЦОД, вводимого в эксплуатацию: будь то скромный
собственный дата-центр или большой коммерческий. В этом году нагрузочное
тестирование ЦОД станет распространенной услугой, одним из важнейших этапов
запуска ЦОД.
Неиспытанный ЦОД подобен концепт-кару, пределы возможностей
которого вы не знаете. Известно только то, что согласно расчетам он должен развивать
скорость 220 км/ч. Это, конечно, хорошо, но вряд ли вы посадите свою семью на
задние сидения и попытаетесь разогнаться до этих 220 км/ч в надежде, что прогноз
соответствует действительности.
При процедуре shakedown вы садитесь за руль один, либо
вообще – сажаете опытного гонщика-испытателя. Он осторожно пытается подобраться
к этой скорости, следя, например, за тем, чтобы при разгоне не отвалились колеса.
И он способен отреагировать правильно, если ситуация станет угрожающей.
Смею утверждать, что подавляющее число ЦОД в стране никогда
не проходили эту процедуру, и многие корпоративные информационные системы
находятся в зоне риска, потому что рост нагрузки на неиспытанный дата-центр
может привести к его внезапному отказу. Да, несколько сотен кВт энергии без
специального оборудования правильно превратить в тепло непросто. Поэтому
нагрузочным тестированием часто пренебрегают. Но одно дело ЦОД, работающий на
10% нагрузки, а совсем другое – нагруженный процентов под 90%. В последнем
варианте инженерные системы, силовые цепи, гидроконтуры подвергаются нагрузкам близким
к предельным и вероятность проявления дефектов проектирования или монтажа
многократно увеличивается. Более того, при работе ЦОД в режиме близком к
предельному, могут проявиться
такие «сюрпризы», о существовании которых служба эксплуатации и не подозревала.
В качестве примера могу привести эффект динамической нестабильности системы
«дизель-генератор – ИБП» в определенном диапазоне нагрузок или эффект
индукционного разогрева силовых магистралей.
С работающими датацентрами ситуация еще сложнее. Хотя я бы все
равно рекомендовал контролируемым образом сделать попытку «догрузки» их до того
максимума, на который они рассчитаны. В большинстве случаев для этого испытания
можно выбрать такое «окно», когда проявившийся отказ можно будет устранить. По
крайней мере, этот отказ произойдет в контролируемых условиях, а не случайно,
во время высокой рабочей нагрузки.
Третий важный момент при
построении ЦОД
Оказалось, что построение полноценных процессов эксплуатации ЦОД – задача, сравнимая по сложности с его проектированием. В то же время, именно качество процессов эксплуатации не менее чем на половину определяет соответствие ЦОД тому или иному уровню стандарта.
Фактически ЦОД корпоративного класса – это некий агрегат,
который, будучи запущенным однажды, будет остановлен только лет через семь-десять
(типичный срок службы). Это похоже на автомобиль, который выезжает на автобан и
должен проехать свои 10 тысяч км без возможности сделать аварийную или
профилактическую остановку. Поэтому он должен быть сконструирован таким
образом, чтобы все, необходимое на протяжении его жизненного цикла, можно было сделать
на ходу.
Мы надеемся уже в первом квартале 2011 года анонсировать
целый ряд услуг в области построения и ввода в эксплуатацию ЦОД. В их основе будет
лежать опыт, который мы накопили за два года построения нашего дата-центра. Мы
попытаемся этот опыт представить в виде коммерческого продукта, чтобы те, кто собирается
строить или эксплуатировать ЦОД, могли минимизировать свои риски. Оно стоит тех
денег.