diff --git a/.DS_Store b/.DS_Store index 801dbbfe341b8be3c7a21024f642288b612c928d..7a8a4977784e4786f1a1052904ea7b41b7d2b53f 100644 Binary files a/.DS_Store and b/.DS_Store differ diff --git a/README.md b/README.md index 454568775d8c964d6618b418b016d0254121f94e..a3d8afbc1fbde4e27983c3a539104eae7210db92 100644 --- a/README.md +++ b/README.md @@ -76,6 +76,14 @@ Nos expeÌrimentations concernent l’eÌtude de diffeÌrentes approches de clas +### Matrice de confusion obtenue avec l’approche SGD+TF-IDF sur le jeu de test + + + +Cette figure preÌsente la matrice de confusion obtenue avec la meÌthode SGD+TF-IDF sur le jeu de test. On peut voir qu’un grand nombre d’articles des classes *Arts et meÌtiers* et *Economie domestique* a eÌteÌ classeÌ dans la classe *MeÌtiers*, de la meÌ‚me manieÌ€re les classes *Mesure*, *MineÌ- ralogie*, *Pharmacie* et *Politique* sont souvent confondues avec les classes *Commerce*, *Histoire naturelle*, *MeÌdecine - Chirurgie* et *Droit - Jurisprudence*, respectivement. Les proximiteÌs seÌ- mantiques entre ces classes montrent bien la difficulteÌ pour les modeÌ€les de choisir entre l’une ou l’autre et les reÌsultats confirment qu’en cas de trop grande proximiteÌ les modeÌ€les choisissent la classe la plus repreÌsenteÌe dans le jeu de donneÌes. + + + ## Citation Moncla, L., Chabane, K., et Brenon, A. (2022). Classification automatique d’articles encyclopédiques. *Conférence francophone sur l’Extraction et la Gestion des Connaissances (EGC)*. Blois, France. diff --git a/img/sgd_tf_idf_s10000.png b/img/sgd_tf_idf_s10000.png new file mode 100644 index 0000000000000000000000000000000000000000..adadaafc52a7231edba43b6129312cf5e201bab9 Binary files /dev/null and b/img/sgd_tf_idf_s10000.png differ