• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

R

👉Вернуться к списку инструкций

R – язык программирования для статистической обработки данных и работы с графикой, а также свободная программная среда вычислений с открытым исходным кодом в рамках проекта GNU. Широко используется как статистическое программное обеспечение для анализа данных и фактически стал стандартом для статистических программ.
Официальный сайт: https://www.r-project.org/
Руководство пользователя: https://cran.r-project.org/doc/manuals/r-release/R-intro.html

На вычислительном кластере НИУ ВШЭ установлены версии R 3 и 4 (рекомендуется использовать версию 4.1.2). Для использования окружения R подключите модуль необходимой версии.
ВерсияДата выходаПодключаемый модуль
R 4.1.2
01 ноября 2021module load R/v4.1.2
R 4.0.312 октября 2020module load R/v4.0.3
R 4.0.225 июня 2020module load R/v4.0.2
R 3.6.12 июля 2019module load R/v3.6.1

R - интерпретируемый язык программирования, основным способом работы с которым является командный интерпретатор.
На суперкомпьютере не установлены IDE для R (в т.ч. RStudio) - исходный код необходимо писать на локальном ПК, а суперкомпьютер использовать только для выполнения подготовленных расчётов.
Запуск интерактивной версии (только для отладки, не для выполнения вычислений) производится командой R:

(r_env_4.0.2) [user@sms ~]$ R

R version 4.0.2 (2020-06-22) -- "Taking Off Again"
Copyright (C) 2020 The R Foundation for Statistical Computing
Platform: x86_64-conda_cos6-linux-gnu (64-bit)

R is free software and comes with ABSOLUTELY NO WARRANTY.
You are welcome to redistribute it under certain conditions.
Type 'license()' or 'licence()' for distribution details.

  Natural language support but running in an English locale

R is a collaborative project with many contributors.
Type 'contributors()' for more information and
'citation()' on how to cite R or R packages in publications.

Type 'demo()' for some demos, 'help()' for on-line help, or
'help.start()' for an HTML browser interface to help.
Type 'q()' to quit R.

>

Выполнение расчётов рекомендуется производить через Rscript, используя пакетный режим с sbatch (см. ниже).

Установка дополнительных пакетов

Дополнительные пакеты для R устанавливаются пользователями в домашний каталог. Установка должна производиться на логин-сервере (sms), т.к. вычислительные узлы не имеют доступа в Интернет. Некоторые пакеты могут требовать предварительной подготовки окружения - изучите документацию перед выполнением установки.
Общий синтаксис команды установки дополнительных пакетов в R: install.packages("package_name")
При первой установке R запросит и создаст каталог для хранения установленных модулей, а также попросит выбрать сервер, с которого будут заружены установочные файлы.
Проверить корректность установки можно с помощью команды загрузки пакета library("package_name")
Посмотреть все установленные пакеты в окружении можно с помощью команды installed.packages()

Запуск расчетов R на суперкомпьютере

Для выполнения R-файлов в пакетном режиме необходимо подготовить скрипт-файл (например, r.sbatch) для очереди задач:

#!/bin/bash
#SBATCH --job-name=test-r               # Название задачи
#SBATCH --error=test-r-%j.err           # Файл для вывода ошибок
#SBATCH --output=test-r-%j.log          # Файл для вывода результатов
#SBATCH --ntasks 1                      # Количество MPI процессов
#SBATCH --cpus-per-task 4               # Количество CPU на одну задачу
 
module load R/v4.1.2                    # Загрузка модуля R
srun Rscript test.r                     # Запуск Rscript с файлом test.r

Для постановки задачи в очередь выполните команду sbatch r.sbatch
Не забудьте скорректировать параметры в скрипте для своих расчетов!
Посмотреть состояние своих задач можно с помощью команды mj

Пример результата расчёта стоимости бриллиантов в зависимости от количества карат

library("ggplot2")
library("hexbin")
dim(diamonds)
ggplot(diamonds) + 
  geom_hex(aes(x = carat, y = price), bins = 30) +
  facet_wrap(~ cut) +
  scale_x_log10() +
  scale_y_log10() +
  annotation_logticks(side = "bl") +
  scale_fill_viridis_c() +
  theme_minimal(14)
ggsave(file = "diamonds.pdf", last_plot(), width = 8, height = 4)

Подключение ядра R в Jupyter Notebook

Для подключения ядра R в Jupyter Notebook, запущенный через очередь задач на вычислительном узле, необходимо в интерфейсе JupyterLab перейти в раздел Software на левой боковой панели и загрузить модуль R/v4.1.2. Ядра R появятся на главной странице лаунчера через 1-2 минуты.


Jupyter-ноутбуки с ядром R можно сконвертировать в .r-файл для запуска в пакетном режиме через sbatch. Конвертация ноутбука в .r-файл возможна несколькими способами:

  1. В консоли суперкомпьютера загрузить модуль R: module load R и выполнить команду jupyter nbconvert --to script notebook_name.ipynb (сконвертированный файл будет сохранён в том же каталоге с названием notebook_name.r).
  2. В интерфейсе JupyterLab перейти в меню File -> Save and Export Notebook As... -> Executable script. После чего загрузить полученный файл на суперкомпьютер.
  3. В классическом интерфейсе Jupyter Notebook выбрать пункт File -> Download as -> R (.r). После чего загрузить полученный файл на суперкомпьютер.

Дополнительная информация


 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.