RIST

Revue d'Information Scientifique et Technique

Utilisation des méthodes d’apprentissage Ensembliste dans le Datamining distribué

Le datamining distribué est né du besoin de traiter des données qui peuvent être d’une part très volumineuses, et/ou éventuellement distribuées géographiquement à travers plusieurs sites. Les méthodes d’apprentissage ensembliste en tant que techniques prometteuses en terme de précision, et offrant aussi un aspect ‘distribué’, peuvent être adaptées aux contraintes du datamining distribué. Nous présentons dans cet article les différentes approches permettant d’appliquer les méthodes ensemblistes dans le datamining distribué. Nous nous intéressons plus particulièrement aux travaux utilisant les arbres de décision. Nous montrons que l’adaptation des méthodes ensemblistes à des sous ensembles de données disjoints, dans la perspective de fouiller des données intrinsèquement distribuées, et le parallélisme des méthodes ensemblistes, dans une perspective du passage à l’échelle, pourraient être complémentaires.

Document joint:

pdf4

Un Outil d’extraction de connaissances à partir des données : DataMiner 1.0

Les organismes accumulent jours une quantité importante de données, qui contiennent des informations utiles et stratégiques .Les mécanismes de Data Minig (DM)exploitent ces données dans le but d’extraire l’information pertinente et appropriées qui dissimulées à l’intérieur de cet article décrit un prototype développé, appelé  » Data Miner 1.0  » qui a deux principes :· L’extraction des dépendances fonctionnelles valides et invalides, utilisées dans les structures de bases de données ou dans le domaine du reverse engineering.· L’extraction des règles et classifications de nouveaux exemples en utilisant les machines d’apprentissage qui sont les arbres de décisions et les réseaux de neurones utilisées dans la prévention d’événements.

Document joint:

pdf6