Revue d'économie et de statistique appliquée
Volume 17, Numéro 3, Pages 84-100
2020-12-31

Apprentissage Statistique Pour L’extraction De Connaissances A Partir De Donnees Sanitaires : Essai Sur Donnees Du Cancer Colorectal

Auteurs : Atif Dalia . Benamirouche Rachid .

Résumé

Les systèmes d’information hospitaliers (SIH) stockent des volumes de données de plus en plus importants et hétérogènes, parmi ces derniers figure le SI clinique du cancer colorectal (CCR) qui est centré sur le dossier du malade ; nous nous sommes intéressés dans ce travail à l’extraction de connaissances (ECD) de cet environnement informationnel, sous forme de facteurs pronostiques agissant réellement sur la récidive de la maladie, nous avons travaillé pour cela sur un échantillon de patients avec un CCR histologiquement prouvé. Plusieurs étapes furent alors nécessaires au processus ECD, selon les caractéristiques spécifiques aux données biomédicales à savoir : le traitement des valeurs manquantes, la discrétisation des variables continues, la présélection des variables et le rééquilibrage des classes. Le modèle construit a présenté d’excellentes performances en validation avec une sensibilité supérieure à la spécificité.

Mots clés

donnée ; connaissance ; CCR ; récidive ; SI