| ||||||
Конференции Темп развития стремительныйС 10 по 14 сентября в Лаборатории информационных технологий ОИЯИ работала VIII Международная конференция "Распределенные вычисления и грид-технологии в науке и образовании". В пленарных и секционных докладах конференции рассматривались вопросы использования распределенных вычислений в различных областях науки, образования, производства и бизнеса, текущего состояния грид-систем и будущей роли распределенных и облачных вычислений, суперкомпьютеров, больших данных в России и мире. В рамках конференции работала Международная школа "Научные вычисления, анализ больших данных и технологии машинного обучения для мегасайенс проектов", в которой участвовали студенты, аспиранты и молодые ученые.Открыл конференцию директор ОИЯИ академик В.А.Матвеев, который познакомил ее участников с современным статусом и стратегией развития Объединенного института до 2030 года. С первым пленарным докладом "Многофункциональный информационно-вычислительный комплекс ОИЯИ: статус и перспективы" выступил директор ЛИТ В.В.Кореньков, который дал комментарий для дубненских журналистов: - Первая конференция "Грид в науке и образовании" состоялась в 2008 году. Тогда только зарождалось понятие грид-технологий, стали говорить о компьютерной инфраструктуре Большого адронного коллайдера, которая была ориентирована на грид-технологии. Ту первую конференцию мы задумывали как мост между технологиями, развивающимися на Западе, и широким распространением их в России. В больших конференциях по грид-технологиям, на которых мы бываем, никто из России практически не участвует. Они были не сильно распространены в России. Чтобы быть проводниками этих технологий, мы приглашаем сюда специалистов из ведущих западных центров и как можно больше научной и образовательной общественности России. Таким образом эта конференция выполняет все эти годы свою роль. За это время много чего изменилось. Появились облачные вычисления, которые мы стали активно использовать, очень активно применяются гетерогенные суперкомпьютерные приложения, аналитика больших данных и интеграция разных направлений в области построения крупнейших инфраструктур, особенно для крупных мегапроектов, для цифровой экономики и других социально значимых задач. Ныне это направление широко представлено: использование самых современных систем распределенных вычислений и аналитика больших данных в социально-экономическом разрезе. Конечно, мы ядерно-физический центр и ядерно-физические технологии пока преобладают, но те технологии, о которых здесь пойдет речь, применимы для очень широкого числа приложений. Это и машинное обучение, и аналитика больших данных, которые сейчас очень активно развиваются во всем мире и в России, а мы пытаемся эти технологии пропагандировать и смотреть, что делается в других центрах. Как всегда, мы в рамках конференции проводим школу. В этом году пригласили 40 студентов не только из университетов России, но и нескольких стран-участниц. Лучшие IT-специалисты будут читать обзорные лекции, проведут мастер-классы, практические занятия. Я думаю, что студенты после школы вдохновятся теми знаниями, тем общением, которое их ожидает в течение недели. Программа очень разнообразная, собралось очень много наших друзей, поэтому мы всегда с радостью и большой ответственностью готовимся к этой конференции, нашей ведущей конференции. Мы проводим еще две большие конференции, выездные, - там есть свои особенности, а эта наша родная. Ее "отцы-основатели" - Московский государственный университет, Санкт-Петербургский университет и ОИЯИ. Когда мы собрались в 2003 году: один из представителей МГУ Владимир Валентинович Воеводин, Вячеслав Анатольевич Ильин из НИИЯФ МГУ и Валерий Иванович Золотарев, руководитель компьютерного центра Санкт-Петербургского университета, - и обсудили концепцию этой конференции, как она должна развиваться, так с тех пор и идем той дорогой, которую наметили. Одна из важных черт конференции - хорошее сочетание опытных экспертов и творческой молодежи. Это наше кредо, поэтому мы приглашаем очень много молодых участников, которые делают доклады, и студентов, которые слушают лекции и набираются опыта. Вторым докладом конференции стал доклад "Вычисления на основе облаков для эксперимента LHAASO IHEP", с которым выступила Чилан Хуан (Институт физики высоких энергий, Пекин, Китай): - Я занимаюсь подготовкой компьютерного обеспечения для лазерного эксперимента, потому мой доклад посвящен новым решениям. Наш компьютерный центр не справляется с огромными требованиями обработки и хранения данных. Поэтому нам нужно искать новые идеи и источники улучшения нашей работы в других местах. В моем докладе я рассказала о способах решения таких вопросов, о разработке технологий и управлении такими источниками. Также я рассказала о том, как мы обеспечиваем сертификацию и анализ данных для заинтересованных лиц и ученых. Мы сотрудничаем с ОИЯИ в сетевом моделировании, эта работа идет сейчас, сотрудничество развивается. У нас хорошие связи с ОИЯИ, и мы надеемся, что будем продолжать наше сотрудничество. Своим мнением поделился активный участник конференции и ветеран лаборатории Г.А.Ососков (ЛИТ ОИЯИ): - Это не первая конференция, в которой я участвую, и хотя я по образования математик, работаю в Институте более 50 лет и уже сжился со всеми реалиями, характерными для нашего Института, а именно: обработка данных физического эксперимента и организация компьютерных вычислений, отвечающих требованиям нашего Института. Очень здорово, что появился новый суперкомпьютер "Говорун", и мы были одними из первых пользователей, пока нас не "прогнали" теоретики. Эта конференция очень важна для того, чтобы организовать людей, занимающихся компьютингом, - а это сейчас одна из главных возможностей правильно обрабатывать данные физического эксперимента и обмениваться с помощью компьютерных сетей с другими центрами всеми новыми идеями. Меня здесь привлекают не только вопросы обработки, хотя в последнее время они стали особенно активными и интересными благодаря появлению так называемых глубоких нейронных сетей, которые мы используем для того, чтобы находить треки элементарных частиц. Хотя моя кандидатская диссертация на тему теории массового обслуживания была защищена еще в 1957 году, оказалось, что организация компьютерных сетей тоже выглядит как некая большая система массового обслуживания. И можно было бы применить эту теорию для того, чтобы предварительно моделировать системы, прежде чем тратить деньги на их сооружение. Это очень важный аспект, моделирование - один из самых главных подходов перед тем, как начать что-то строить: можно все просчитать, увидеть, какие оптимальные конструкции сетей должны быть созданы, какие затраты необходимы, чтобы этого достичь. На этой конференции у меня в соавторстве получилось четыре доклада плюс лекция на школе для молодых ученых - как раз по поводу глубоких нейронных сетей, так что я вовлечен в работу конференции и очень доволен, что она проходит в Дубне уже не первый раз. Мне в моем возрасте самому приходится быть активным, чтобы не закисать, следить за новым и предлагать новые идеи. Для меня очень важно все новое передавать молодым, их нужно обучать и вовлекать, и слава богу, вокруг меня есть хорошая команда молодых людей, с которыми работать крайне интересно.
Один из основателей этой конференции В.В.Воеводин (НИВЦ МГУ): - Эта конференция проводится в месте, где люди реально занимаются грид-технологиями. Когда мне нужно что-то узнать относительно текущего мирового статуса, я обращаюсь к Владимиру Васильевичу Коренькову, либо к его коллегам, поскольку то, что они делают здесь, - самое передовое, такое, каким должно быть. Когда у нас начинаются дела по большим данным, я опять смотрю сюда, потому что это то место, где работают специалисты. У вас сейчас есть совместные с ЛИТ ОИЯИ проекты? Совместные проекты - вещь условная, мы знаем, что можем многое сделать вместе. Наверное, важнее то, что я уверен: здесь есть экспертиза, которой я всегда могу воспользоваться, и я ей пользуюсь, а Владимир Васильевич прекрасно понимает, что за всем, что касается суперкомпьютерных технологий, он всегда может приехать в суперкомпьютерный центр Московского университета, и общий язык мы найдем. Иногда, а на самом деле часто, мы находим общий язык на общих площадках, например в совете, который создан по приоритетному стратегическому направлению, а еще мы входим в разные советы, он по грид-технологиям, я по суперкомпьютерным. Встречаемся и в Плехановском институте, который решил серьезно двигаться в эту сторону. И опять-таки мы удачно подпираем друг друга, потому что наши технологии дополняют друг друга, создавая то самое целое, без чего компьютерный мир сложно себе представить. А на школе для молодых вы будете читать лекции? Знаете, я так часто у Владимира Васильевича что-то читаю, что не знаю - это в рамках школы или нет. Он каждое лето что-то проводит по вычислительной математике, я там лекции читал, здесь регулярно выступаю, на конференции по математическому моделированию, у нас настолько тесно все переплетено - где провести эту грань, ее даже проводить не хочется, мы все равно едины. Как всегда не просто участвует в конференции, а попутно решает текущие вопросы в совместных проектах Алексей Климентов (НИЦ "Курчатовский институт" - ЦЕРН): - Мы все Дубну любим и по разным причинам любим сюда приезжать, в том числе нас связывает много совместных работ. Сейчас заканчивается второй этап (Run-2) на Большом адронном коллайдере, Run-3 будет проводиться для тяжелоионного эксперимента, мы его не рассматриваем, а при Run-4, когда будет суперБАК и количество данных возрастет в 100 раз, потребуются новые подходы. Один из таких подходов - создание озера научных данных, это совершенно новая вещь и новая технология. Этот вопрос не решен, его пытается решить Google, пытается решить Amazon, пытаемся решить мы. Вся идея состоит в следующем: от идеи грид, когда есть более-менее равноценные по функционалу центры, переходим к ситуации, когда есть очень большое хранилище, которое географически распределено. Единственный созданный на сегодня прототип был разработан группой из ЛИТ и "Курчатовского института". Это хранилище объединяет Дубну, Москву ("КИ"), Гатчину и ЦЕРН. Этот прототип может стать будущим озером данных, если это будет поддержано министерством или российским научным фондом. Это очень хорошая вещь, не говоря уже о том, что эта технология, если она будет реализована для физических данных, применима потом для таких структур, как, например, Сбербанк, у которого много распределенных ячеек и им надо обмениваться информацией. Она применима для тех IT-компаний, которые занимаются интернетом вещей, она применима для медицины, когда необходимо обмениваться статистикой по операциям и сложностям, связанным с этими операциями. Для конечного пользователя это выглядит как некое огромное хранилище, куда вы кладете свои данные и где они "всплывают", вы не знаете. Парная к этому задача - то, что разные данные из этого озера могут быть по-разному востребованы в разных регионах. Задача перемещения данных, чтобы уменьшить время доступа к ним, тоже не решена, в том числе, Google. Мы думаем, что будем это делать с помощью алгоритмов машинного обучения, а для этого нужны мощные графические процессоры, в том числе суперкомпьютер "Говорун", где это все надо отлаживать. Пожалуй, это самое главное, из того, что мы сейчас обсуждаем. А когда начнется Run-4? Run-4 начнется в 2024-25 году, так что времени, на самом деле, нет, нам надо очень быстро пройти первый этап, связанный с созданием прототипа, к тому, чтобы показать, что это работает. Андрей Царегородцев (Центр физики частиц, Марсель, Франция): - Здесь, я смотрю, много молодых лиц - в этот раз я впервые поучаствую в работе школы, которая проводится параллельно с конференцией. Мне действительно интересно посмотреть на молодых ребят, студентов, какой блеск в их глазах, как они все это видят для себя - перспективным, не перспективным, потому что они - люди заинтересованные, им нужно решать, куда дальше идти, а нам нужно показать им, где могут реализовать свои интересы молодые специалисты, какие есть тренды. Им нужно приходить с сумасшедшими идеями, а нам, экспертам, нужно консервативно на это смотреть. В этом смысле очень интересно участие молодых. Конечно, сама область развивается очень быстро: появляются новые вопросы в том, что называется машинным обучением, большими данными - тут, конечно, очень много, скажем так, сиюминутной моды, но когда все лишнее отсеется, останутся интересные зерна, появятся именно те приложения, которые зависят от этих технологий. Очень много предлагается решений, и это не означает, что все они одинаково хороши. Это очень конкурирующая область, и в этой конкуренции было бы интересно посмотреть на решения, предлагаемые отечественными инженерами, организациями. У нас до сих пор сохранился некий не всегда оправданный пиетет перед решениями, которые приходят из-за границы. Это не безусловный эталон, на это надо смотреть критически и развивать собственные решения, я уже не говорю о собственных школах, направлениях. Мне кажется, потихоньку появляются организации, которые начинают работать на уровне школ, - Дубна, ИТМО в Санкт-Петербурге, сибирские университеты, с ними здесь тоже интересно познакомиться. Школа - это немного больше, чем просто информация, которая передается молодым. Построение долгоиграющих проектов, а не модные сейчас гранты, сиюминутные программы. Вроде на уровне правительства есть понимание, что этой отрасли нужно уделять внимание, что это будущее, это сильно поможет стране в целом, но от этой констатации до конкретной реализации расстояние достаточно большого размера. Вот как раз и хотелось посмотреть, а происходит ли что-то в плане реализации этих благих пожеланий. Если эти благие пожелания поддержаны существенным финансированием, то надежда есть. По крайней мере, в России специалистов в этих областях много, и если хорошо организовать какие-то форумы вроде этой конференции, которые позволяют обмениваться информацией, чтобы не повторять известные ошибки, чтобы обмениваться идеями, - это очень хорошо. Я не ищу здесь революций, с революциями всегда все сложно, нужна нормальная поступательная работа, когда есть понимание, что это всерьез и надолго, не сиюминутная кампания. Все эти облачные технологии, большие данные и так далее, они уже входят постепенно в повседневный быт научных учреждений, научных сообществ. За этим всем сюда и приезжаем. А чем вы занимаетесь во Франции? В нашем центре Академии наук Франции в Марселе все те же задачи стоят в полный рост. Те решения, которые мы там разрабатываем, уже применяем здесь, и, я надеюсь, разработанное здесь мы сможем применить и для европейских проектов. Потенциал для этого есть, есть заинтересованность. Молодые ребята, которые здесь работают, успели поработать и там, знают, что это такое. Главное, мне кажется, они уже ощутили, что могут это делать, могут создавать конкурентоспособные разработки. Раньше имелась не совсем оправданная скромность, но в какой-то момент нужно иметь и мужество, и в хорошем смысле наглость, чтобы выходить со своими решениями, отстаивать их и конкурировать на равных. Вперед, победа будет за нами! Среди выступавших на конференции было немало молодых сотрудников ЛИТ. Один из них И.А.Кашунин: - В своем докладе я буду рассказывать о системе мониторинга Центрального информационно-вычислительного комплекса ЛИТ, а мой интерес - узнать о новых технологиях, которые здесь будут представлять наши коллеги и спонсоры, а также другие участники конференции. Я расскажу об оценке производительности кластерного подхода в применении к системе мониторинга. Дело в том, что со временем в нашем ЦИВК набралось большое количество оборудования и возникла необходимость отслеживать все его параметры, чтобы не произошел сбой или какой-то другой отказ. В этом деле хорошо помогают системы мониторинга, они позволяют делать оценку состояния всего оборудования и своевременно реагировать на отказ. Сначала мы выбрали систему мониторинга, базирующуюся на Nagios, но поскольку оборудования становилось все больше, то производительности этой системы уже не хватало. Я выдвинул идею применять для мониторинга не единственный сервер, а несколько серверов, чтобы снизить нагрузку на центральный сервер и перевести систему мониторинга на Isinga 2. Применение этого подхода я буду освещать в своем докладе и надеюсь, мой опыт будет полезен другим участникам. Что касается суперкомпьютера "Говорун", то нами развернут дополнительный сервер, который будет обеспечивать мониторинг "железной" части суперкомпьютера. Сейчас активно обсуждается, какие параметры нужно отслеживать, я думаю, в течение этого года большая часть оборудования уже будет отслеживаться и мониториться в полном объеме. Кроме нашего мониторинга есть еще мониторинг фирмы-поставщика РСК, отслеживающий энергоснабжение, системы климат-контроля, а у меня ведется мониторинг непосредственно данных операционной системы, жестких дисков, некоторых сервисов и так далее.
Как всегда на конференции представляют свои новые технологические решения и программные продукты IT-компании - спонсоры и коллеги. С докладом "Новые архитектуры и технологии Intel для суперкомпьютеров и облаков" выступил директор по развитию корпоративных проектов Intel Н.С.Местер: - Конференция посвящена очень интересной теме - теме грида. Это то, из чего, по сути, выросли облачные технологии, все наши облачные провайдеры - Яндекс, Мейл и прочие, по сути дела, последовательно используют те идеи, которые родились в научных кругах. На текущий момент "Грид-технологии в науке и образовании" больше продолжает быть научной конференцией, здесь много интересных докладов, посвященных тому, каким образом развиваются научные проекты, связанные с обработкой больших и сверхбольших данных. Здесь мы, Intel, выступаем в нескольких ипостасях: мы являемся, по сути дела, компонентами для таких крупных систем, как Tier1 и Tier2 для Большого адронного коллайдера в ЦЕРН, а также мы представлены в виде очень интересной совместной с компанией РСК суперкомпьютерной установки имени Николая Николаевича Говоруна. На этой конференции мы планируем выступить с очень интересными докладами по теме использования этой установки в вычислениях прототипирования будущих систем для проекта NICA и хотим представить технологию гиперконвергентных сред для больших и сверхбольших данных и высокопроизводительных вычислений. Также как Intel мы здесь присутствуем в третьем сегменте - облаков, то есть научное сообщество так же использует технологию облаков для своей работы, как и коммерческие компании, и соответственно, та облачная инфраструктура, которая здесь существует, нами поддерживается в виде тех компонент, тех решений, которые делаются на основе Intel.
Постоянный участник конференций А.П.Крюков (НИИЯФ МГУ): - Здесь были очень интересные доклады, естественно, я все не слышал, ряд пленарных докладов - по достижениям ОИЯИ, по суперкомпьютеру "Говорун", по его мониторингу был интересный доклад, другие участники тоже интересные вещи представили. На секциях, которые меня интересовали, мне очень понравился доклад китайских коллег про распределенную систему хранения, которую они делают, - это близко к тому, чем занимается моя группа. В целом от конференции очень хорошие впечатления. Участник конференции и школы Здравко Донев (Новый болгарский университет, София, Болгария): - Мне кажется, я узнал здесь много нового, потому что секции объединяют небольшие группы людей, это наиболее удобно для общения. Пленарные доклады были больше посвящены физике, чем компьютерным наукам, но студенческая школа была по компьютерным наукам, так что мне здесь понравилось. Мы с другом, который тоже приехал на конференцию, специализируемся в нашем университете по компьютерным наукам, получили дипломы бакалавров, будем учиться на магистров. Мы впервые в России и в ОИЯИ. Мне понравилась Дубна, это очень зеленый город. Ольга ТАРАНТИНА, |
|