From 2178ca5e4af37e4dc36728ec0a303c3f8d2c1d35 Mon Sep 17 00:00:00 2001 From: lmoncla <ludovic.moncla@insa-lyon.fr> Date: Fri, 17 Sep 2021 11:58:46 +0200 Subject: [PATCH] add slurm script for jean zay execution --- run_train_bert.slurm | 26 ++++++++++++++++++++++++++ 1 file changed, 26 insertions(+) create mode 100644 run_train_bert.slurm diff --git a/run_train_bert.slurm b/run_train_bert.slurm new file mode 100644 index 0000000..21863c2 --- /dev/null +++ b/run_train_bert.slurm @@ -0,0 +1,26 @@ +#!/bin/bash +#SBATCH --job-name="train_bert" # nom du job +#SBATCH --ntasks=1 # nombre de taches a reserver (=nombre de GPU ici) +#SBATCH --gres=gpu:1 # nombre de GPU a reserver +#SBATCH --cpus-per-task=10 # nombre de coeurs CPU par tache (un quart du noeud ici) +##SBATCH --qos=qos_gpu-t4 +#SBATCH -C v100-32g +#SBATCH --hint=nomultithread # hyperthreading desactive +#SBATCH --time=20:00:00 # temps maximum d'execution demande (HH:MM:SS) +#SBATCH --output=train_bert%j.out # nom du fichier de sortie +#SBATCH --error=train_bert%j.out # nom du fichier d'erreur (ici commun avec la sortie) + +# nettoyage des modules charges en interactif et herites par defaut +module purge + +# chargement des modules +module load pytorch-gpu/py3/1.7.1 + +# echo des commandes lancees +set -x + +# execution du code +python training_bertFineTuning.py /gpfswork/rech/mqs/ugy94pd/data/train_dataframe.tsv /gpfswork/rech/mqs/ugy94pd/bert_settings.conf /gpfswork/rech/mqs/ugy94pd/models/bert/ + + + -- GitLab