• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Использование вычислительных узлов с ОС Rocky Linux 9

На вычислительных узлах суперкомпьютера cHARISMa проводится постепенная установка новой операционной системы Rocky Linux 9. Эта процедура необходима для поддержки современного ПО, которое требует наличия свежей версии библиотеки glibc - одного из ключевых компонентов ОС.
Переход на новую ОС потребует перекомпиляции ПО, ранее собранного на старой версии ОС. В настоящее время проводится подготовка отдельного логин-сервера для удобного процесса проверки и сборки ПО на новой версии ОС.

На текущий момент в ограниченном режиме поддерживаются следующие сценарии использования узлов с новой версией ОС:

  • Создание и использование персональных окружений Anaconda с новыми версиями пакетов (например, torch 2.10.0).
  • Использование персональных окружений Anaconda, созданных на старой версии ОС.
  • Запуск ограниченного набора ПО, подключаемого с помощью модулей.

Legacy-модули из ОС Centos 7, совместимые с новой ОС Rocky Linux 9, отображаются командой module avail в каталоге /opt/el9/hse/legacy
На вычислительных узлах с ОС Rocky Linux 9 установлен тулкит CUDA версий 12.9.1 и 13.1.1.

Подключение к вычислительному узлу с ОС Rocky Linux 9
Вычислительные узлы с новой ОС выделены в отдельную очередь Slurm с названием rocky.
Очередь доступна всем пользователям для тестирования и запуска расчётов (доступ к узлам типа H и G ограничен для пользователей-студентов по решению Научно-технического совете суперкомпьютерного комплекса НИУ ВШЭ).

Для постановки задачи на узле с ОС Rocky Linux 9 укажите в sbatch-скрипте параметр --partition rocky
Для запуска Jupyter-ноутбука выберите очередь rocky в соответствующем поле на странице запуска.

Пример создания окружения Anaconda с новыми версиями Python-пакетов

  1. Запустите Jupyter-ноутбук, указав название резервации rocky в соответствующем поле
  2. Откройте в лаунчере новый терминал, либо выберите в меню File -> New -> Terminal
  3. Выполните команду module purge && module load Python
  4. Создайте новое окружение, укажите необходимую версию Python, например: conda create -y -n rocky_env python=3.13.* && conda activate rocky_env

  5. Установите новую версию PyTorch: pip3 install torch torchvision
    Первоначальная загрузка пакетов происходит на кэширующий прокси-сервер. Если интернет-соединение до pypi.org в настоящий момент медленное, то могут возникать ошибки вида ERROR: Could not install packages due to an OSError: HTTPConnectionPool(host='nexus.charisma', port=5080): Max retries exceeded with url. В этом случае повторите установку пакетов через 5 минут, пока прокси-сервер загружает в кэш запрошенный пакет.
  6. Установите ядро ipykernel: pip3 install ipykernel
  7. В Jupyter-ноутбуке появится новое ядро .conda-rocky_env, с помощью которого можно проверить корректность работы установленного torch:

  8. Внимание: ПО и Python-пакеты, установленные на новой ОС, не будут работать на вычислительных узлах со старой ОС!

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.