From 37085a490eabc08060492d9eb517c701ffdd6ed5 Mon Sep 17 00:00:00 2001 From: Mathieu Loiseau <mathieu.loiseau@liris.cnrs.fr> Date: Wed, 14 Jun 2023 17:55:27 +0200 Subject: [PATCH] =?UTF-8?q?Doc=20avec=20fusion=20de=20donn=C3=A9es?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- README.md | 12 ++++++++---- wikstraktor.py | 7 ++++--- 2 files changed, 12 insertions(+), 7 deletions(-) diff --git a/README.md b/README.md index f542093..1f80c7c 100644 --- a/README.md +++ b/README.md @@ -3,6 +3,8 @@ wikstraktor A python tool to query the [wiktionary](https://wiktionary.org) and extract [structured lexical data](https://gitlab.liris.cnrs.fr/lex-game/wikstraktor/-/wikis/Entry-structure). +This experimentally identifies every structured info and merges info from different sources. + ## Dependencies This project does depend on python packages. * [``pywikibot``](https://github.com/wikimedia/pywikibot) allows to use the mediawiki API @@ -49,25 +51,27 @@ str(f) #convert content to json #### Bash ``` usage: wikstraktor.py [-h] [-l LANGUAGE] [-w WIKI_LANGUAGE] [-m MOT] - [-f DESTINATION_FILE] [-A] [-C] + [-f DESTINATION_FILE] [-A] [-C] [-n] Interroger un wiktionnaire ex : ‣./wikstraktor.py -m blue ‣./wikstraktor.py -m blue -f blue.json -A -C - ‣./wikstraktor.py -l en -w fr -m blue -f blue.json -A -C + ‣./wikstraktor.py -l en -w fr -m blue -f blue.json -n -A -C + ‣./wikstraktor.py -l en -w fr+en -m particular -f particular.json options: -h, --help show this help message and exit -l LANGUAGE, --language LANGUAGE - la langue du mot + la ou les langue(s) du mot (séparées par des “+â€) -w WIKI_LANGUAGE, --wiki_language WIKI_LANGUAGE - la langue du wiki + la ou les langue(s) du wiki (séparées par des “+â€) -m MOT, --mot MOT le mot à chercher -f DESTINATION_FILE, --destination_file DESTINATION_FILE le fichier dans lequel stocker le résultat -A, --force_ascii json avec que des caractères ascii -C, --compact json sans indentation + -n, --no_id json sans id ``` ### Wikstraktor Server diff --git a/wikstraktor.py b/wikstraktor.py index 279623c..a7cd883 100755 --- a/wikstraktor.py +++ b/wikstraktor.py @@ -835,9 +835,10 @@ if __name__ == "__main__": \033[1m\033[32mex :\033[0m ‣\033[0m\033[32m./wikstraktor.py -m blue\033[0m ‣\033[0m\033[32m./wikstraktor.py -m blue -f blue.json -A -C\033[0m - ‣\033[0m\033[32m./wikstraktor.py -l en -w fr -m blue -f blue.json -n -A -C\033[0m""") - parser.add_argument("-l", "--language", help="la langue du mot", type=str, default = "en") - parser.add_argument("-w", "--wiki_language", help="la langue du wiki", type=str, default = "en") + ‣\033[0m\033[32m./wikstraktor.py -l en -w fr -m blue -f blue.json -n -A -C\033[0m + ‣\033[0m\033[32m./wikstraktor.py -l en -w fr+en -m particular -f particular.json\033[0m""") + parser.add_argument("-l", "--language", help="la ou les langue(s) du mot (séparées par des “+â€)", type=str, default = "en") + parser.add_argument("-w", "--wiki_language", help="la ou les langue(s) du wiki (séparées par des “+â€)", type=str, default = "en") parser.add_argument("-m", "--mot", help="le mot à chercher", type=str, default=None) parser.add_argument("-f", "--destination_file", help="le fichier dans lequel stocker le résultat", type=str, default=None) parser.add_argument("-A", "--force_ascii", help="json avec que des caractères ascii", action="store_true") -- GitLab