200 тысяч лет человеческой работы за секунду: как суперкомпьютер Вышки помогает ученым
Исследовать работу человеческого мозга, вычислить источник COVID-19, провести комплексные расчеты и проверить научную гипотезу — в решении самых сложных задач людям помогают суперкомпьютеры. Один из лучших в СНГ — cHARISMa — третий год работает «плечом к плечу» с исследователями Вышки. Как он устроен и какие проекты выполняет, рассказал Павел Костенецкий, начальник отдела суперкомпьютерного моделирования НИУ ВШЭ.
Инструмент исследователя
Современным ученым нужно все больше высокопроизводительных вычислительных систем. Крупные научные центры и университеты отвечают на данный запрос созданием новых и увеличением мощности существующих компьютеров.
«Задачи, которые можно было посчитать на калькуляторах или на персональных компьютерах, ученые уже давно решили», — отмечает Павел Костенецкий. Сейчас в мире идет гонка за высокорейтинговыми публикациями, а результат в них, как правило, уже нельзя получить без суперкомпьютера.
Ученый, изучающий карту звездного неба, пытается найти закономерности в движении отдаленных космических тел или, например, вычислить местоположение планет, которые еще не были обнаружены. Это можно делать эмпирическим путем, как раньше: наблюдать за звездным небом, делать снимки, вручную чертить и рассчитывать траектории. Такая работа требует десятки лет, а может, и больше, и не факт, что ученому повезет и он сделает свое открытие.
Современным исследователям на помощь приходит суперкомпьютер: он может за секунды обработать огромные объемы данных многолетнего обзора неба, полученные с телескопов, находить импульсные явления и аномалии в движении объектов. Правда, для каждого исследования нужно разработать свою параллельную программу, которая будет эффективно проводить эти операции над данными. Многие ученые самостоятельно пишут программы, многие находят готовые научные программы с открытым исходным кодом и адаптируют их для своих целей. При установке таких программ на помощь приходят сотрудники отдела суперкомпьютерного моделирования.
«Почти каждый день к нам идут запросы от пользователей по отладке, настройке или обновлению программ», — рассказывает Павел Костенецкий. По его словам, на выходе ученые часто хотят увидеть не красивую диаграмму или график, а одно число! Суперкомпьютер прекрасно фильтрует и уменьшает количество данных. «Задача из необъятного объема данных становится лаконичной… Чем меньше данных на выходе, тем понятнее результат и дальнейшая работа», — заключает он.
Теоретически исследовательскую работу можно проводить и на персональном компьютере, однако ему не хватает памяти и вычислительной мощности. Исследования могут выполняться годы на ПК вместо нескольких дней на суперкомпьютере. «Через несколько лет решаемая на ПК задача будет уже никому не нужна, потому что другие ученые, скорее всего, уже ее решили», — объясняет Павел Костенецкий. Суперкомпьютер выполняет 2 квадриллиона операций с плавающей точкой за секунду, что равносильно 200 тысячам лет человеческой работы.
Попадание в десятку
Высокопроизводительный вычислительный кластер cHARISMa (Computer of HSE for Artificial Intelligence and Supercomputer Modelling) появился в Вышке в 2019 году. Это один из наиболее современных суперкомпьютеров России. Он представляет собой 46 вычислительных узлов, объединенных в одну мощную систему. В нем установлены 146 графических процессоров NVIDIA A100 и V100, 92 мультиядерных процессора от Intel и AMD (2584 ядра), а также 47 терабайт оперативной и более петабайта дисковой памяти.
Для сравнения: сегодня самый мощный стационарный персональный компьютер Apple Mac Pro в максимальной комплектации имеет всего 4 графических процессора, один центральный процессор, 1,5 терабайта оперативной памяти и диск 8 терабайт. Такая система справляется с монтированием видеороликов, математическими задачами и 3D-моделированием, но на научные открытия она не способна.
«Хотя наш суперкомпьютер с точки зрения сухих цифр не самый мощный в стране, однако он максимально заточен под специфику ресурсоемких исследовательских задач Вышки: искусственный интеллект, математическое моделирование, исследования в области физики и химии, нейрокогнитивные технологии, экономика и лингвистика», — отмечает Павел Костенецкий. Суперкомпьютер Вышки входит в топ-10 мощнейших в СНГ, а среди университетских вычислителей мощнее только суперкомпьютеры «Ломоносов-2» МГУ и «Политехник» СПбПУ.
Суперкомпьютер Вышки функционирует круглосуточно, одновременно решая задачи для 98 исследовательских проектов. Особенности программной настройки позволяют ему эффективно распределять нагрузку: небольшие задачи быстро решаются на свободных узлах, а для крупных задач предусмотрена система автоматического планирования и резервирования вычислительных мощностей через очередь.
Пандемия и склонность к риску
Суперкомпьютером cHARISMa пользуется 61 подразделение вуза. Больше всего пользователей с факультета компьютерных наук, из Московского института электроники и математики им. А.Н. Тихонова и из Санкт-Петербургской школы экономики и менеджмента.
Суперкомпьютер помогает проводить исследования в разных областях. Например, исследовательская группа из ВШЭ и Сколтеха совместно со специалистами НИИ гриппа им. А.А. Смородинцева и ИППИ им. А.А. Харкевича РАН изучили штаммы коронавируса и выяснили, что в 2020 году примерно в одно время COVID‑19 попал в Россию 67 раз, причем лишь единожды — из Китая. С помощью суперкомпьютера cHARISMa исследователи сравнили мутации более 200 геномов коронавируса от пациентов из 25 регионов России. Проанализировав объем данных, ученые выяснили, что практически все выявленные в России штаммы коронавируса зародились в европейских странах.
Центр нейроэкономики и когнитивных исследований Института когнитивных нейронаук НИУ ВШЭ с помощью суперкомпьютера исследовал роль префронтальной и теменной коры мозга в принятии решений. Было показано, что на поведенческом уровне магнитная стимуляция повышает чувствительность к риску, в результате вероятность выбора рискованной опции уменьшается. Моделирование предпочтений с помощью байесовского подхода показало, что магнитная стимуляция снизила предельную полезность вознаграждения, но не повлияла на искажение вероятностей.
Многие проекты, выполняемые на суперкомпьютере cHARISMa, связаны с созданием искусственного интеллекта и его применением в самых разных областях. Например, ученые департамента больших данных и информационного поиска ФКН создают модели искусственных нейронных сетей, позволяющие не только сгенерировать изображение на основе введенного текста, но и текстом же отредактировать существующие картинки.
Ученые из департамента компьютерной инженерии МИЭМ разрабатывают искусственный интеллект для генерации и анализа исходных текстов компьютерных программ. ИИ позволит генерировать исходный код программы из текстового описания на естественном языке. Кроме того, разрабатывается технология автоматического поиска и устранения ошибок в программах, написанных человеком.
Конечно, суперкомпьютер — не панацея, а инструмент. Интерпретация полученного результата, дальнейшая работа и подготовка новых данных — все это ложится на плечи исследователя. Тем не менее благодаря суперкомпьютеру ученые Вышки уже опубликовали более 110 научных статей, в том числе 25 работ в журналах с высшим рейтингом Q1 Scopus.
Самый продвинутый
Как ученые не останавливаются на достигнутом и продолжают свои исследования и наблюдения, так и суперкомпьютер все время нуждается в усовершенствованиях. Без постоянной доработки, оптимизации и обновлений сегодняшний суперкомпьютер через 10 лет будет сравним по производительности с новым персональным компьютером. Поэтому Суперкомпьютерный комплекс НИУ ВШЭ регулярно расширяется. Так, в 2020 году в систему добавилось 14 вычислительных узлов и 12 GPU NVIDIA Tesla V100, а в 2021 году cHARISMa получил 48 новейших графических процессоров NVIDIA A100, позволяющих решать любые задачи в области искусственного интеллекта.
«Мы делаем большое количество работ по обслуживанию, развитию и оптимизации суперкомпьютера. В результате сегодня вычислительный комплекс Вышки технологически один из самых продвинутых в России», — уверен Павел Костенецкий.
Отдел суперкомпьютерного моделирования разработал программную систему мониторинга эффективности HPC TaskMaster, которая увеличила производительность суперкомпьютера на 7% без каких-либо вложений в покупку нового оборудования.
Дмитрий Бондарь, старший директор по цифровой трансформации НИУ ВШЭ
Суперкомпьютер нужен любому современному университету: без него невозможна цифровая трансформация университета и работа над исследованиями мирового уровня. Поэтому мы стараемся развивать cHARISMa всеми силами. В цифровом блоке Вышки не только работают лучшие специалисты со всей страны, но мы еще и активно развиваем компетенции команды в области методологии Agile и управления проектами. В результате растет эффективность работы специалистов цифрового блока, и нам удается обеспечивать высокий уровень доступности и производительности всех систем и сервисов университета.
Стажер-исследователь Лаборатории экономической журналистики специально для HSE.Daily
Стажер-исследователь Лаборатории экономической журналистики специально для HSE.Daily
Бондарь Дмитрий Павлович
Старший директор по цифровой трансформации
Костенецкий Павел Сергеевич
Начальник Отдела суперкомпьютерного моделирования