@@ -12,9 +12,9 @@ Ce dépôt contient le code développée pour une étude comparative de diffé
Nos expérimentations concernent l’étude de différentes approches de classification com- prenant deux étapes principales : la vectorisation et la classification supervisée. Nous avons testé et comparé les différentes combinaisons suivantes :
1. vectorisation en sac de mots et apprentissage automatique classique (Naive Bayes, Lo- gistic regression, Random Forest, SVM et SGD) ;
2. vectorisationenplongementdemotsstatiques(Doc2Vec)etapprentissageautomatique classique (Logistic regression, Random Forest, SVM et SGD) ;
3. vectorisationenplongementdemotsstatiques(FastText)etapprentissageprofond(CNN et LSTM) ;
4. approche*end-to-end*utilisantunmodèledelanguepré-entraîné(BERT,CamemBERT) et une technique de *fine-tuning* pour adapter le modèle sur notre tâche de classification.
2. vectorisationenplongementdemotsstatiques(Doc2Vec)etapprentissageautomatique classique (Logistic regression, Random Forest, SVM et SGD) ;
3. vectorisationenplongementdemotsstatiques(FastText)etapprentissageprofond(CNN et LSTM) ;
4. approche*end-to-end*utilisantunmodèledelanguepré-entraîné(BERT,CamemBERT) et une technique de *fine-tuning* pour adapter le modèle sur notre tâche de classification.