Architecture pour le TAL
Pour pouvoir travailler sur l'analyse automatique. Il faut qu'on sache quelle ressources on peut mobiliser (et comment).
Stratégies possibles
Il va falloir choisir entre deux stratégies :
- Pyodide
- Voir si on peut déclencher pyodide au moment où on lance les statistiques
- Regarder les mécanismes d'inclusion de module de pyodide
- Dans ce cas demander à l'utilisateur de sélectionner les langues (ou aller les chercher dans son profil BaLex) et ne charger QUE les modules des langues sélectionnées
- Worker
- Faire communiquer un worker python avec l'extension ;
-
Comment structurer le python :
- est-il possible de le faire tourner avec un environnement virtuel ?
- Est-ce que dans la procédure d'installation on peut aller chercher les librairies python ou faut-il tout mettre directement dans les sources ?
- Est-ce qu'on peut créer un exécutable ligne de commande (avec pyinstaller ou cxfreeze qu'il suffit de mettre sur l'ordi et indiquer à l'extension où cette appli est située ? cf. video DownloadHelper
- Pure JS
- https://github.com/stdlib-js/nlp-porter-stemmer
- https://github.com/spencermountain/compromise
- autre ?
TODO
- Tester les deux stratégies
-
en choisir une en fonction de
- Difficulté d'installation
- Efficacité