RIST

Revue d'Information Scientifique et Technique

Traitement des mots inconnus par les systèmes d’étiquetage morpho-syntaxiques des textes arabes basés sur le modèle de Markov caché

L’étiquetage morpho-syntaxique des textes est un outil très important pour diverses applications dans le traitement du langage naturel, à savoir l’analyse morphologique et syntaxique des textes, et l’indexation et la recherche d’information, et la « vocalisation » des textes arabe et le modèle probabiliste des langues (modèle n-classe).
Ces systèmes, qui sont basés sur des lexiques de taille limitée, sont incapables de traiter les mots inconnus.

Document joint:

pdf6

Un Outil d’extraction de connaissances à partir des données : DataMiner 1.0

Les organismes accumulent jours une quantité importante de données, qui contiennent des informations utiles et stratégiques .Les mécanismes de Data Minig (DM)exploitent ces données dans le but d’extraire l’information pertinente et appropriées qui dissimulées à l’intérieur de cet article décrit un prototype développé, appelé  » Data Miner 1.0  » qui a deux principes :· L’extraction des dépendances fonctionnelles valides et invalides, utilisées dans les structures de bases de données ou dans le domaine du reverse engineering.· L’extraction des règles et classifications de nouveaux exemples en utilisant les machines d’apprentissage qui sont les arbres de décisions et les réseaux de neurones utilisées dans la prévention d’événements.

Document joint:

pdf6