Еженедельник
Объединенного института ядерных исследований

(Электронная версия с 1997 года)
Архив Содержание номера О газете На главную Фотогалерея KOI8

№ 24(3963) от 11 июня 2009:

Версия № 24 в формате pdf (~3.6 Mb)

Факт и комментарий

ЛИТ ОИЯИ: завершены два важных проекта

Мы завершили два очень масштабных, сложных этапа, два очень важных проекта (о первом шла речь в предыдущем номере) и пригласили всех, кто принимал участие в их реализации, а также наших коллег по сообществу, потенциальных пользователей - резидентов особой экономической зоны, а также представителей министерства связи, федерального агентства по науке и инновациям на презентацию этих проектов. По предложению директора ОИЯИ А.Н.Сисакяна торжественная презентация состоялась 10 июня во время работы ПКК по физике частиц, поскольку большая часть наших потенциальных пользователей задействована в экспериментах по физике высоких энергий.

(Продолжение. Начало в №23)

Отвечать современным требованиям

Второй не менее важный проект относится к развитию Грид-инфраструктуры, чему мы придаем сейчас приоритетное значение. Это диктуется требованиями к центрам, которые занимаются обработкой, моделированием, хранением и анализом данных с Большого адронного коллайдера (LHC). Разработаны достаточно жесткие критерии на скорость передачи данных, на надежность и доступность в сочетании с высокой загрузкой всех ресурсов. Центры, не отвечающие этим критериям, выпадают из общей мировой системы обработки и анализа информации на LHC. Поскольку Россия и ОИЯИ внесли колоссальный интеллектуальный и материальный вклад в развитие установок на LHC, то нам необходимо сейчас объединить усилия для эффективного анализа и обработки данных с целью получения физических результатов. Поэтому так важно развивать и поддерживать Грид-инфраструктуру, которая является главным инструментом для выполнения этих задач.

В этом году мы провели очень серьезную модернизацию нашей Грид-инфраструктуры, приобрели большое количество новых вычислительных узлов и дисковых серверов для хранения данных. Это привело к существенной модернизации всех инфраструктурных элементов - системы бесперебойного питания, оборудования локальной сети, обеспечивающей соединение серверов, системы хранения и системы вычисления, которые перестали удовлетворять возросшим потокам данных. В результате этого нам пришлось коренным образом перестроить систему бесперебойного питания, приобрести более совершенное оборудование для развития локальной сети, провести большую работу по подключению и монтированию новых серверов, новых систем хранения и вычислений. Всю техническую реконструкцию квалифицированно выполнила группа во главе с Н.С.Астаховым. Но наиболее трудной задачей была настройка всего программного комплекса, всех компонент и сервисов для эффективного функционирования Грид-инфраструктуры ОИЯИ. Эта сложнейшая задача была выполнена на высоком уровне системными администраторами комплекса, несомненным лидером которого многие годы остается В.В.Мицын.

Будучи недавно в ЦЕРН, мы убедились, что там закупили аналогичное оборудование, и это радует, поскольку анализ возможных технических решений мы делали независимо друг от друга. Это еще одно подтверждение того, что мы выбрали правильное направление развития. Монтажные, а затем очень кропотливые работы по настройке Грид-инфраструктуры недавно были завершены, и наш модернизированный комплекс уже начал полноценно функционировать и загружен задачами пользователей. После этой модернизации слабым звеном в нашей инфраструктуре машинного зала остается устаревшая система охлаждения, большая часть оборудования которой за 30 лет эксплуатации выработала свой ресурс. В нашей Грид-инфраструктуре мы используем самые современные технические решения в очень плотном конструктиве (суперблейды, спаренные серверы, дисковые массивы), которые выделяют много тепла. Это требует новых подходов к организации системы охлаждения. Мы сейчас активно работаем в этом направлении. Для решения этой проблемы потребуются серьезные, в том числе и финансовые, усилия, чтобы переоснастить и модернизировать систему поддержания климата. По остальным параметрам в ОИЯИ практически нет ограничений по наращиванию вычислительных ресурсов и систем хранения информации. Сетевая инфраструктура развивается, и мы сейчас обсуждаем вопрос о переходе с технологии гигабитного Ethernet, на 10-гигабитный.

Первые в России и не последние в мире

Сейчас вычислительная мощность нашего комплекса составляет 960 узлов (node). Раньше эту величину измеряли количеством процессоров, а когда они стали многоядерные, перешли на новую единицу измерения. Среди мировых грид-сайтов по количеству узлов мы теперь занимаем место во второй двадцатке, и стали первыми в России. "Курчатовский институт" по этому параметру нам уступает. Если сравнивать дисковые ресурсы, то здесь мы немного проигрываем "Курчатовскому". Собственно, в России сейчас два базовых центра, составляющих основу структуры российского Грида - проекта RDIG, в который входят больше десяти российских физических центров и университетов, - ОИЯИ и "Курчатовский институт". Если же сравнивать по показателям эффективности использования и надежности, то у нас не только самые лучшие результаты среди российских грид-сайтов, но и среди всех центров глобальной Грид-инфраструктуры мы находимся в первой десятке.

В настоящее время мы готовимся к запуску LHC, и все грид-сайты должны пройти сертификацию, которая состоит из нескольких этапов.

Первый этап - сертификация систем передачи данных. Для этого из каждого центра хранения данных (так называемых Tier1-центров, их всего 11 в мире) на наш непрерывно в течение 24 часов идет передача данных, при этом средняя скорость передачи должна быть не ниже 20 Мбайт/сек. Если этот порог не превзойден - центр не будет сертифицирован. Сейчас в России очень немногие центры могут себе позволить такую сертификацию.

Второй серьезный этап сертификации состоит в успешном выполнении большого количества заданий, работающих с этими данными, которые запускаются каждый час. И если в системе хранения данных и в системе вычисления есть узкие места, то они просто "захлебнутся" этими заданиями. Третий критерий: для каждой физической группы, занимающейся определенным направлением исследований, должно быть предоставлено серьезное количество дискового пространства - примерно 100 Тбайт.

И только при выполнении всех трех условий это направление исследований закрепляется за данным центром. Эти формальные требования по сертификации пока используются в одном из экспериментов на LHC - CMS, но неформально поддерживаются всеми.

В июне мы готовимся к участию в комплексных стресс-тестах на LHC (так называемые STEP09), когда проверяется готовность к приему данных одновременно со всех(!) экспериментов на коллайдере. Примерно две недели в начале июня будет проводиться такое массированное тестирование всей мировой Грид-инфраструктуры, а потом еще недели две проводится анализ результатов - кто успешно справился с этим испытанием, а кто оказался не готов...

(Окончание следует.)

Беседовала Ольга ТАРАНТИНА


Редакция Веб-мастер