L'exploitation de l'environnement lexical dans le traitement automatique du ka possessif en bamanankan
exploitat_environ_lexical_traitement_automatique_ka_possessif_bamanan.pdf
Résumé
Pour traiter le bamanankan (bambara) dans un programme d’intelligence artificielle, il faudra résoudre au préalable le problème des unités homographes de catégorie lexicale distincte. Le ka illustre bien ce phénomène de recoupement d’orthographe : ka (marqueur de l’adjectif qualificatif), ka (infinitif), ka (possession), ka (impératif). Il faut donc des indices matériels pour distinguer les ka entre eux dans un texte. À ce titre, la présente étude cherche à démasquer les indicateurs lexico-syntaxiques capables de désambiguïser les ka de la possession des autres ka se situant dans d’autres catégories. Les usages pratiques relevant du traitement artificiel du ka de la possession sont nombreux, étant entendu que ces techniques interviennent au moins dans la traduction automatique. Le présent travail formule des hypothèses sur les indicateurs lexicaux qui désambiguïsent le ka. Les hypothèses sont vérifiées à travers des termes de recherche appropriés qui extraient les occurrences respectives d’un corpus à l’aide du logiciel Bosolan. Les occurrences sont étudiées pour distinguer les cas de confirmation et d’infirmation de l’hypothèse. En effet, des indicateurs matériels pouvant guider un programme informatique ont été trouvés à travers l’exploitation de l’environnement lexical. Sur les 6 hypothèses formulées, plus de la moitié des occurrences a été confirmé.
Mots-clés : catégorie, corpus, environnement lexical, intelligence artificielle, occurrence
Blàdon : 2023-11-19 Yɛlɛmako laban : 2023-11-19