Если в Украине ресурсо­емкие вычисления развиваются довольно медленно, то в Российской Федерации им уделяют немалое внимание. Государственный сектор совместно с коммерческими предприятиями активно финансирует высшие учебные заведения, и в настоящее время несколько крупных российских университетов оборудованы мощными кластерными вычислителями. Первое место по производительности в регионе СНГ занимает установленный в научно‑исследовательском вычислительном центре МГУ суперкомпьютер «СКИФ МГУ» — совместная разработка Московского государственного университета имени М.В.Ломоносова, Института программных систем РАН и компании «Т‑Платформы», выполненная в рамках суперкомпьютерной Программы «СКИФ‑ГРИД» Союзного государства при поддержке Intel. О задачах и развитии параллельных вычислений в МГУ редакция PCWeek/UE беседует с Владимиром Воеводиным, заместителем директора научно‑исследовательского вычислительного центра МГУ. 

PCWeek/UE: Как развивались ресурсоемкие вычисления в МГУ?

Владимир Воеводин: В МГУ параллельными вычислениями занимаются уже давно — наш коллектив сформировался еще в начале восьмидесятых годов. Начинали мы в качестве теоретиков, позже перешли к программированию. В те времена мы запускали программы собственной разработки в удаленном режиме на зарубежных суперкомпьютерах. Это был бесценный опыт, когда нам довелось работать на мощнейших вычислителях IBM, SGI и Cray. 

А в начале 90‑х годов прошлого столетия развитие параллельных вычислений началось и в России. Связано это было с появлением кластерных систем. Именно в нашем вычислительном центре осуществили первую в стране установку суперкомпьютерной системы коллективного пользования, построенной на основе кластерных технологий. Для этого были взяты стандартные ПК, которые связали обычной сетью. По тем временам это было очень неоднозначное решение, потому что стоимость коммуникационного оборудования на каждый узел превышала стоимость самого узла. Для этого использовался интерфейс SCI. Подобное решение можно считать нестандартным, но перед нами стояла задача создать универсальную установку. Ведь вычислительных задач в МГУ немало, и для одних важна минимальная латентность, для других — высокая пропускная способность. Поэтому первым делом проектная группа начала работу над созданием сбалансированной вычислительной сети. 

С тех пор техника неоднократно обновлялась, и недавно был создан и запущен компьютер, чья пиковая производительность достигает 60 те­ра­флопс. Эта система занимает около 100 кв. метров, а в качестве процессорных модулей в ней задействованы четырехъядерные процессоры Intel Xeon. 

PCWeek/UE: Почему было отдано предпочтение архитектуре открытого, а не закрытого типа, например Intel Itanium?

В. В.: Сейчас я отношусь к закрытой архитектуре несколько настороженно, кроме того, не вижу смысла внедрять столь сложные и дорогие машины. По моему мнению, Xeon предпочтительнее по соотношению цена/производительность, а также с точки зрения активного развития и постоянного обновления этого семейства. 

PCWeek/UE: Проявляют ли интерес к сфере ресурсоемких вычислений российские коммерческие организации и государственный сектор? 

В. В.: Да, сегодня от необходимости решать ресурсоемкие задачи, от применения мощных вычислений крупным промышленным и коммерческим предприятиям никуда не уйти. Перед предприятиями автомобильной и химической промышленности, авиастроительными заводами и другими организациями встает вопрос о подтверждении качества продукции и сертификации на мировом уровне. То есть они нуждаются в моделировании некоторых аспектов своей деятельности и наглядной демонстрации того, что их продукция обладает необходимой надежностью и эффективностью, а также соответствует экологическим нормам. Эти подсчеты должны быть проведены в стандартных программных пакетах, признанных мировым сообществом. Во многих случаях такое ПО приспособлено для работы именно на параллельной вычислительной технике. Оно позволяет использовать данные натурного эксперимента совместно с данными расчетов, которые можно осуществить в самых различных условиях. Условия экспериментов можно менять посредством компьютерного моделирования, и здесь без кластерных систем не обойтись. 

То же касается биоинженерии и биоинформатики. Еще одно весьма бурно развивающееся направление — компьютерный дизайн лекарственных препаратов. Принцип следующий: например, существует белок, ответственный за ту или иную болезнь, определенное количество лигандов, которые могут блокировать вредоносное действие белка, и есть база, центр соединений. Для них необходимо приспособить активное соединение белка — так называемая задача докинга. Чтобы смоделировать действие лекарства на организм, требуется проверить сотни тысяч соединений. Без параллельной вычислительной системы это неосуществимо. А если такую технику используют, то время первой стадии проектирования лекарства сокращается на порядок.

PCWeek/UE: Приведите конкретные примеры коммерческого использования систем HPC? 

В. В.: В качестве примера могу назвать НПО «Сатурн». Это крупнейшее российское объединение по производству турбинных и газотурбинных установок, авиационных двигателей. Они развернули свой первый суперкомпьютер более двух лет назад. Это очень обрадовало ученых, исследующих параллельные вычисления. Но еще большую радость я ощутил тогда, когда из неофициальных источников узнал, что компьютер стоимостью около миллиона долларов окупился буквально за пару месяцев. И объявление в сентябре минувшего года о том, что «Сатурн» планирует внедрить в свою инфраструктуру еще и 8‑терафлопсный компьютер, служит доказательством их убежденности в эффективности использования параллельных вычислений. 

PCWeek/UE: Какова роль вычислительного центра МГУ в распространении НРС? 

В. В.: В первую очередь МГУ является образовательным учреждением, при этом на нас, как на подразделение НИИ МГУ, возложена двойственная задача. Прежде всего, наша миссия заключается в развитии знаний о параллельных вычислениях, донесении информации о том, для чего это нужно. С другой стороны, мы занимаемся разработкой ПО — это невероятно интересная работа, которая, однако, сопряжена с рядом сложностей. Ведь даже стандартная разработка программного обеспечения представляет собой сложный многоуровневый процесс, а в случае параллельных приложений задача многократно усложняется. Появляются прикладные проблемы, для их решения необходимо знать информационную структуру алгоритма, чтобы понять, каким образом его можно адаптировать под векторные машины и кластерные системы. 

PCWeek/UE: Как бы вы оценили вычислительные мощности кластера МГУ?

В. В.: Некоторое время назад мы забили тревогу, поскольку те вычислительные кластеры, которые функционировали, например, 3 года назад, были загружены практически на 100%. Постоянная система мониторинга отслеживает, что происходит на суперкомпьютере, и мы поняли, что существующих процессоров уже недостаточно. Нельзя работать в условиях, когда, запуская рядовую параллельную задачу на выполнение утром, знаешь, что подсчет будет завершен лишь к концу следующего дня. Ведь мы ставили мощную машину именно затем, чтобы избежать подобных ситуаций. Однако я уверен, что очень скоро мы выйдем на нормальный уровень загрузки — 70—80%, потому что всегда должен оставаться некоторый резерв. Тогда приходящие пользователи не будут ожидать результатов в течение нескольких дней. После последнего обновления в 2007 году, пиковая производительность системы составляет 60 терафлопс. В ее состав входит примерно 1200—1300 четырехъядерных процессоров. То есть около 5 тысяч ядер. Исходя из последней редакции рейтинга суперкомпьютерных систем Top500, по производительности кластер МГУ занимает 22‑е место в мире (на момент интервью, согласно 30‑й редакции рейтинга за ноябрь 2007 года; в последней, июньской, редакции кластер МГУ переместился на 37-е место — прим. ред.).

PCWeek/UE: Известно, что научно‑ис­следовательский вычислительный центр МГУ ведет рейтинг суперкомпьютеров в СНГ. Охарактеризуйте основные тенденции развития распределенных вычислений исходя из изменений в данном списке?

В. В.: На протяжении нескольких лет мы ведем рейтинг совместно с межведомственным суперкомпьютерным центром. Большинство современных суперкомпьютеров являются кластерными системами, их число растет, и это общемировая тенденция. Среди главных причин смещения в сторону кластеров — экономическая целесообразность и простота обновления компонентов. 

В России много систем расположено в структурах учебных заведений. Стимулом для этого послужила российская государственная программа, направленная на развитие ИТ‑составляющей университетов. Инновационные университеты, которых сейчас в России насчитывается 57, получили значительное финансирование. Многие из них использовали эти средства для внедрения параллельных вычислений, благодаря таким программам произошел существенный всплеск развития вузовской суперкомпьютерной техники. 

PCWeek/UE: Есть ли в России примеры объединения двух территориально распределенных мощных вычислителей в единую систему? 

В. В.: Объединение вычислителей является сегодня популярной идеей. Многие хотят этим заниматься, но крайне мало команд пытались это сделать на практике. Хотя такие примеры есть — в России это группы физиков из различных университетов и НИИ. Например, в запущенном недавно Большом адронном коллайдере весь поток информации должен обрабатываться с помощью технологий Grid. Создана крупная всемирная коллаборация, в которой от России участвуют 8 физических институтов во главе с НИИ ядерной физики МГУ. Это по‑настоящему профессиональная группа, которая может технологии «пощупать руками» и воспользоваться их преимуществами. Они уже развернули грамотную инфраструктуру пока только на уровне тестов, но я абсолютно уверен, что она будет усовершенствована в практической реализации. 

PCWeek/UE.: Какие векторы развития HPC будут преобладать в России и СНГ? 

В. В.: В России отрасль параллельных вычислений развивается благодаря масштабным инвестициям в рамках государственных инновационных программ. По нашим ожиданиям, довольно скоро будет развернуто множество систем большой мощности. Но непременно возникнет вопрос эффективности их использования, ведь во многих структурах системы устанавливают без понимания их дальнейших задач. В таком случае суперкомпьютер может превратиться в обузу. Это может стать причиной негативного отношения к суперкомпьютерам. Я считаю, что необходимо консультировать потенциальных пользователей, разъяснять, каких результатов можно добиться, используя подобные компьютеры. С этой целью мы развиваем посвященные параллельным вычислениям интер­нет‑ресур­сы, проводим семинары и конференции. Ведь кластеры — это уникальные системы, с помощью которых можно получать фантастические результаты.