| ||||||
|
Их имена в истории Института В.В.Мицын: "Мы в ЛВТА были пионерами в гриде..."В середине декабря прошлого года мы записали воспоминания старшего научного сотрудника лаборатории Валерия Валентиновича Мицына. К огромному сожалению и скорби его коллег Валерий Валентинович не дожил до дня публикации этих строк. ЛИТ ОИЯИ и всё мировое сообщество компьютерщиков, работающих в области грид-технологий, потеряли уникального специалиста высочайшей квалификации в различных областях современных информационных и сетевых технологий. А мы сегодня публикуем воспоминания Валерия Валентиновича о своем жизненном пути и коллегах.
В 1975 году я окончил факультет Вычислительной математики и кибернетики МГУ и решил уехать подальше - на Южный Урал. Места там были красивые - горы, озера, но, к сожалению, практически не было работы, поскольку поставку новых БЭСМ-6 еще только ждали. Мы занимались изучением документации, ездили в командировки в разные институты. Я побывал и в ОИЯИ, у Г.Л.Мазного и его коллег, чтобы понять, что такое БЭСМ-6 для системного программирования. Проработав два года на Урале, я вернулся в Дубну: сначала поступил в только что открывшийся НИИ "Атолл", но там были ЭВМ не такие, как в Объединенном институте, а потом перевелся в Отдел радиоэлектроники, размещавшийся на площадке ЛЯП, но не входивший в структуру ОИЯИ. Там были более серьезные машины - СМ-4, аналог американской PDP-11, на которых мне уже удалось поработать программистом, системным программистом, администратором. Благодаря Евгению Мазепе у нас появился удаленный терминал ОИЯИ - это был большой прогресс, и большое спасибо Евгению за это. Через этот терминал я подружился с сотрудниками ЛВТА - инженерами и сетевиками, которые меня и "перетащили" в лабораторию. В ЛВТА работал мой однокурсник Сергей Каданцев. Здесь была более серьезная техника и более напряженная работа. Сначала у нас были ЕС ЭВМ, а потом появились машины VAX, они были ближе мне, потому что я ими уже занимался. Мы вместе с Володей Субботиным обслуживали операционную систему (ОС), позже к нам подключились Михаил Попов и Анатолий Ломов. Возникла команда, которая интересовалась более передовыми ОС. На VAX стояла система VAX VMS, которая больше нигде не применялась, также, впрочем, было и на машинах IBM и ЕС ЭВМ. А в это время начали появляться ОС, которые могли работать на разных типах машин. Это ОС типа UNIX, не совсем свободно распространяемая, но установить и работать на ней было можно. Чуть позже появилась машина CONVEX. По тем временам это был монстр: у нее был один обычный процессор, как у современных машин, и восемь процессоров, выполнявших параллельные задачи. Это, кстати, заинтересовало физиков, они использовали этот параллелизм. Процессоры были такие секретные с точки зрения американцев, что раз в три месяца из посольства приезжал сотрудник и проверял, все ли они на месте. В конце 1980-х - начале 1990-х началось какое-то сближение с нашими американскими, как их тогда называли, партнерами, и у нас начали появляться машины фирмы Digital. Еще нам приходилось постоянно контактировать с инженерами, потому что машины часто ломались, иногда ночью, и мы вместе с ними выходили на работу, чтобы восстановить системы. CONVEX стал практически основной машиной для пользователей - сначала в ЛВТА, потом и в других лабораториях ОИЯИ. Машины с ОС UNIX стали завоевывать популярность и у администраторов систем, и у пользователей. На ее основе позже появилась связь с интернетом: сначала как бы не совсем легальная, через закрытую телефонную систему "Искра", и с нашими IP-адресами мы не могли выходить за пределы страны. А когда сетевую службу взял в свои руки Евгений Мазепа, появились IP-адреса, которыми ОИЯИ до сих пор пользуется. А мы образовали команду, правда Володя Субботин уже ушел из Института в коммерческую организацию, а вместе с Михаилом Поповым и Анатолием Ломовым стали заниматься ОС UNIX на машинах типа ПЭВМ. Достали, по-моему, 20 дискет с первой установочной версией UNIX. В ОИЯИ появились персональные ЭВМ. Конечно, на них играли в разные игры, но можно было заниматься и серьезными вещами. Потом в ЛВТА наступило затишье, и я съездил в полугодовую командировку в Германию, работал в DESY. Занимался в основном помощью пользователям в переносе программ с одной версии ОС на другую. И Анатолий Ломов тоже там работал, но он был специалист по Windows. В DESY начали организовывать кластеры из персональных машин на основе UNIX, то есть соединять их для работы вместе. Десяток машин мог обеспечивать примерно такую же мощность, как машина VAX. Это начинание почему-то не получило в DESY распространения. Через полгода я вернулся в Дубну, и в начале 2000-х начался еще не грид, сначала это был проект "Монарх", по объединению вычислительных центров в единую распределенную систему запуска задач и хранения данных. Поначалу идеи были совершенно сумасшедшие: поскольку IP-сети между этими центрами были не быстрыми, то хотели данные из одного центра в другой перевозить на кассетах. Но достаточно быстро сети начали удовлетворять требованиям распределенной обработки и хранения данных, и вычислительные центры тоже стали близки к этой идее участия в распределенных вычислениях. И тогда Владимир Васильевич Кореньков, руководивший нашим отделом, начал выдавать идеи одна безумнее другой. Тогда у нас канал связи был до Москвы с пропускной способностью, кажется, 10 Мбит в секунду, потом стал 50 Мбит в секунду, и он предложил участвовать в гриде, в проекте LCG (комплекс программ, обеспечивающих работу на десятках тысяч машин коллабораций экспериментов на LHC - О.Т.). Мы взбодрились, попытались что-то сделать, и у нас сразу получилось. Хотя идея поначалу казалась безумной. Мы в ЛВТА ОИЯИ были пионерами в гриде наравне с ЦЕРН и некоторыми другими крупными центрами и первыми в России. США поначалу в этом не очень участвовали, там были теоретики. Потом к нам подтянулись Курчатовский институт, НИИЯФ МГУ. Идея оказалась не только заманчивой, но и перспективной, хотя поначалу техники было не очень много, а сеть не очень быстрой. Постепенно ресурсы наращивались. У нас на втором этаже стояли жалкие 15 "персоналок", объединенных в локальную сеть и включенных в грид. Кроме этого, они использовались математиками и физиками ОИЯИ, то есть система была комплексной. Потом появился ленточный робот, но работал он исключительно плохо. Записать информацию в него еще получалось, но считать из него - практически невозможно. Это была идея В.В.Коренькова и он ее всячески поддерживал и развивал. В результате дирекция ЛВТА, потом ЛИТ, прониклась ею, и центральная дирекция начала ее поддерживать. У нас появились кое-какие ресурсы: одна стойка с серверами Hewlett-Packard, потом несколько. Нашли фирму, которая нам поставляла американское оборудование. Сейчас, к сожалению, это напрямую невозможно, но что-то до нас доходит, и что интересно: некоторое оборудование, поставленное 12-15 лет назад, работает до сих пор, купленное 10 лет назад - наполовину вышло из строя, а то, что получили пять лет назад - хорошо, если по гарантии отремонтируем.
За настройкой первых кластеров. За терминалом И.М.Ткачев. Постепенно мы развивались как часть грида - сайт уровня Tier-2. В основном у нас проводились вычисления, объемы хранения данных были небольшие. Но возникла еще одна сумасшедшая коллективная идея вместе с НИЦ "Курчатовский институт" - создать сайт уровня Tier-1. Тогда их в мире было восемь, сейчас - четырнадцать. Эту идею одобрили, и мы задумали сделать сайт распределенным. Мы обеспечивали поддержку эксперимента CMS на LHC, а КИ - остальных трех экспериментов. Работы финансировались из федеральной целевой программы, в которой мы с КИ были равными партнерами, поскольку выяснилось, что у нас и счетные ресурсы, и ресурсы хранения данных больше, чем у них. Когда В.В.Кореньков убедил центральную дирекцию, что этот проект даст ОИЯИ и славу, и престиж, и опыт, он много значит для будущих экспериментов Института, то средства в ЛИТ стали поступать в большем объеме, и закупки оборудования увеличились. Мы даже не всегда успевали вовремя устанавливать аппаратуру, поскольку силы инженеров и системных администраторов всегда были ограничены. Достаточно быстро мы обогнали КИ по ресурсам и оказались в эксперименте CMS одним из лучших центров Tier-1. Появилась хорошая связь с Москвой и хорошая сеть с КИ, потом "пробили" канал связи до Амстердама, а затем и до ЦЕРН. Так и работаем до сих пор. Сначала у нас в ЛИТ было одно подразделение для вычислительных ресурсов и ресурсов хранения - собственно наша команда. Потом возникла облачная инфраструктура, которую мы уже не могли охватить, зато появилась молодежь, взявшая ее в свои руки. Потом появились гибридные вычисления, ими тоже занялись молодые. В HybriLIT сейчас сосредоточены достаточно большие ресурсы - материальные и человеческие. И та и другая команды работают интенсивно и хорошо. Затем ОИЯИ стал участвовать не только в экспериментах LHC, но и в китайских, и американских. Данные хранились на нашей инфраструктуре. Возник проект NICA, сначала на уровне моделирования, но требовавший больших счетных ресурсов - наших, Tier-1, Tier-2, облачной инфраструктуры и суперкомпьютера "Говорун".
В комнате мониторинга и управления МИВК. 2021 г. Надо думать, что существующие ресурсы, особенно те, которые еще увеличим, удовлетворят потребностям старых экспериментов и вновь возникающих. Возникла проблема с установкой новых ресурсов - зал второго этажа оказался не безразмерным. Оборудование систем охлаждения и вентиляции тоже уже не могло обеспечить новые вычислительные мощности и мощности хранения данных. Практически на ходу проводился ремонт, это был подвиг инженерных служб - были обновлены многие составные части инфраструктуры. Сейчас дело дошло до зала на четвертом этаже, где когда-то стояли ЕС ЭВМ. Есть проект, начинаются работы по оборудованию зала и есть надежда, что в следующем году появится новое место для установки новых ресурсов. Были два основных проекта - LCG и WLCG, один переходил в другой, они обеспечивали и вычисления, и хранение данных, остальные грид-проекты - полуадминистративные или административные. А проект RDIG был создан для того, чтобы шло финансирование разработок грида не только со стороны ОИЯИ, но и от России, и, действительно, получилось закупить партию унифицированного оборудования, которое поставили в российские центры, участвующие в WLCG. Благодаря чему, кстати, бозон Хиггса оказался явью, а не остался теорией. Как ни странно, за последние 15-20 лет практически ничего не менялось - тот же самый Фортран, те же программные продукты. Физиков тяжело сдвинуть, но лет 5-8 назад появилась молодежь, индийские программисты, исповедующие другие подходы, использующие другое программное обеспечение. Пользователи пишут на простейших языках, но это требует больше оперативной памяти, нужны более быстродействующие машины, но остались программы и на Фортране. Наши люди, которые 40 лет назад работали на Фортране на БЭСМ-6, вполне могут в WLCG что-то запрограммировать. Победила ОС типа UNIX - LINUX, она и на смартфонах устанавливается, на суперкомпьютерах работает, - сейчас это основная ОС, а Windows теряет свои позиции. Что-то меняется - авторизация для безопасного доступа к удаленным ресурсам, меняются версии операционных систем, и приходится раз в несколько лет переходить на новую версию, потому что старая перестает поддерживаться. Не дремлют и хакеры, пытаются найти новые ошибки. Правда, в последнее время я вижу, что они пытаются взломать именно новые версии, до старых руки не доходят, что ли? В распределенных вычислениях в последние годы стали подключать такие установки, как СК "Говорун", хотя сделать это не всегда просто. Сомневаюсь, что от этого получают большой выигрыш, потому что распределенные вычисления - это по-другому организованная система. Одним словом, эволюция идет. Если сравнивать рабочую атмосферу, то раньше коллективы были маленькие и сплоченные. Сейчас группа, которая занимается вычислительными ресурсами и ресурсами хранения, уже не единый коллектив: кто-то занимается гридом, другая часть - облачным сервисом, третья - СК "Говорун". Мы стали меньше друг с другом общаться, меньше общих праздников, но, по большому счету, атмосфера в нашем коллективе всегда была доброжелательной, и администрация к нам хорошо относится. Раньше регулярно проводились собрания, на которых "выпускался пар", от начальства иногда получали тычки и подзатыльники, и это тоже сплачивало. Может быть, электронная почта сегодня их заменила. Тем не менее всегда пытаемся решить проблемы сообща, я делюсь опытом с молодежью, когда вижу, что у них какие-то затруднения. Было в нашей работе достаточно много удивительных моментов: когда кажется, что до решения проблемы далеко, и будет она решаться с трудом, вдруг быстро находится выход. Наверное, это закономерно, особенно с годами, поскольку приобретается опыт, особенно работы на разных платформах. Не растерять его - тоже проблема. Я говорю молодежи: "Ребята, учитесь, будете много знать". Им не надо бояться, казалось бы, нерешаемых проблем, не надо замыкаться в узкой области, стараться "копать" и по сторонам. Как правило, если не 90 процентов, то 70 процентов этих знаний когда-нибудь пригодятся. Системному администратору нужно иметь большой объем знаний, уметь решать маленькие и большие проблемы, иногда требуются нестандартные решения. Хочу пожелать молодым не останавливаться в своем развитии, не зацикливаться на одной задаче, если даже ты по ней можешь диссертацию защитить, смотреть по сторонам, ухватывать куски того, что потом может пригодиться, и скорее всего пригодится. Еще один принцип надо запомнить, что главное - не сама цель, а путь к ней. И не надо никогда опускать руки, то, что не получается, обязательно получится. Надеюсь, большинство моих коллег тоже работает по этим принципам, последовательно достигая поставленных целей. Хочу пожелать всем только хорошего в Новом году, чтобы все были счастливы! Записала Ольга ТАРАНТИНА, | ||||||
|