Revue de l'Information Scientifique et Technique
Volume 21, Numéro 1, Pages 63-71
2013-03-05
Auteurs : Sakr Ali . Hasegawa-johnson Mark .
: Nous présenterons un système de collecte et d’analyse de données éventuellement utilisé pour analyser les contributions relatives des variations dépendantes au dialecte dans la sphère lexicale d’un texte semblable à l’écriture arabe. De ce fait, nous aurons recours à l’allocation de Dirichlet latente (LDA), une méthode de modélisation générative probabiliste afin d’analyser la phonétique des termes arabes écrits en caractère latin extraits d’un corpus de discussion en ligne. Ce corpus produit différents choix de mots et différentes relations conceptuelles basée sur le dialecte et qui par conséquent contribue à la reproduction graphique des termes arabes issus du dialecte malgré la large distinction existante entre l’arabe écrit standard et les nombreux dialectes arabes.
Modélisation thématique, phonétique des termes arabes écrits en caractère latin, LDA, analyse d’un corpus de discussion en ligne.
بوسالم أحلام
.
عابد يوسف
.
ص 117-132.
Yahia Zeghoudi
.
pages 74-88.
Said Houari Amel
.
pages 257-268.
Hadj Mahi
.
Zohra Labed
.
pages 293-308.