Использование вычислительных узлов с ОС Rocky Linux 9
На вычислительных узлах суперкомпьютера cHARISMa проводится постепенная установка новой операционной системы Rocky Linux 9. Эта процедура необходима для поддержки современного ПО, которое требует наличия свежей версии библиотеки glibc - одного из ключевых компонентов ОС.
Переход на новую ОС потребует перекомпиляции ПО, ранее собранного на старой версии ОС. В настоящее время проводится подготовка отдельного логин-сервера для удобного процесса проверки и сборки ПО на новой версии ОС.
На текущий момент в ограниченном режиме поддерживаются следующие сценарии использования узлов с новой версией ОС:
- Создание и использование персональных окружений Anaconda с новыми версиями пакетов (например, torch 2.10.0).
- Использование персональных окружений Anaconda, созданных на старой версии ОС.
- Запуск ограниченного набора ПО, подключаемого с помощью модулей.
Legacy-модули из ОС Centos 7, совместимые с новой ОС Rocky Linux 9, отображаются командой module avail в каталоге /opt/el9/hse/legacy
На вычислительных узлах с ОС Rocky Linux 9 установлен тулкит CUDA версий 12.9.1 и 13.1.1.
Подключение к вычислительному узлу с ОС Rocky Linux 9
Вычислительные узлы с новой ОС выделены в отдельную очередь Slurm с названием rocky.
Очередь доступна всем пользователям для тестирования и запуска расчётов (доступ к узлам типа H и G ограничен для пользователей-студентов по решению Научно-технического совете суперкомпьютерного комплекса НИУ ВШЭ).
Для постановки задачи на узле с ОС Rocky Linux 9 укажите в sbatch-скрипте параметр --partition rocky
Для запуска Jupyter-ноутбука выберите очередь rocky в соответствующем поле на странице запуска.
Пример создания окружения Anaconda с новыми версиями Python-пакетов
- Запустите Jupyter-ноутбук, указав название резервации rocky в соответствующем поле
- Откройте в лаунчере новый терминал, либо выберите в меню File -> New -> Terminal
- Выполните команду module purge && module load Python
- Создайте новое окружение, укажите необходимую версию Python, например: conda create -y -n rocky_env python=3.13.* && conda activate rocky_env
- Установите новую версию PyTorch: pip3 install torch torchvision
Первоначальная загрузка пакетов происходит на кэширующий прокси-сервер. Если интернет-соединение до pypi.org в настоящий момент медленное, то могут возникать ошибки вида ERROR: Could not install packages due to an OSError: HTTPConnectionPool(host='nexus.charisma', port=5080): Max retries exceeded with url. В этом случае повторите установку пакетов через 5 минут, пока прокси-сервер загружает в кэш запрошенный пакет. - Установите ядро ipykernel: pip3 install ipykernel
- В Jupyter-ноутбуке появится новое ядро .conda-rocky_env, с помощью которого можно проверить корректность работы установленного torch:
- Внимание: ПО и Python-пакеты, установленные на новой ОС, не будут работать на вычислительных узлах со старой ОС!
Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.