RIST

Revue d'Information Scientifique et Technique

Utilisation Du Service Web Google Dans La Reformulation Requête Par Les Algorithmes Génétiques

Avec l’immense volume de données existant sur le web, 84 % des Webnautes utilisent des moteurs de recherche d’ordre général pour trouver les données qu’ils exigent. Mais ces derniers n’adaptent pas leurs stratégies de recherche aux différents utilisateurs, la requête en entrée étant le plus souvent ambiguë. Ces moteurs de recherche retournent donc, des milliers de pages, chacune pertinente dans son contexte. Ce travail vise l’utilisation des services web google pour implémenter une technique automatique de reformulation requêtes utilisateurs, avec les algorithmes génétiques.

Document joint:

pdf1

XSearcher : Un Système de Stockage et d’Interrogation de documents structurés en XML

Aujourd’hui, la nature des sources d’information évolue et les documents traditionnels ”plats” ne contenant que du texte s’enrichissent d’information structurelle. Cette évolution est accélérée par l’expansion du Web. De ce fait, les documents structurés ou semi-structurés de type HTML (HyperText Markup Language) ou XML (eXtensible Markup Language) tendent à former la majorité des documents numériques mis à disposition des utilisateurs. La connaissance de la structure des documents est une ressource additionnelle qui devrait être exploitée pendant la recherche d’information du moment que la sémantique des différents composants textuels peut être employé pour spécifier un besoin d’information beaucoup plus précis. Cependant, les modèles de recherche d’information traditionnels ne sont pas capables de manipuler l’information structurée ce qui a incité l’intérêt de la recherche d’information à basculer vers la création de nouveaux systèmes de recherche d’information, appelés systèmes de recherche d’informations structurées, qui exploitent la structure des documents.Le présent papier présente la conception et la réalisation d’un système de stockage et d’interrogation de documents au format XML basé sur le langage XQuery et ce, à travers une interface graphique et ergonomique. L’intérêt de ce travail est de montrer l’avantage des systèmes de recherche d’informations structurées à augmenter la puissance d’expression en spécifiant avec précision le besoin d’information ce qui devient d’une extrême importance vu l’abondance d’information et spécialement les millions de sources de données disponibles sur le Web.

Document joint:

pdf8

ProfilDoc, un Système de Recherche d’Information scientifique

Cet article se place dans le cadre de la recherche d’information numérique.
Actuellement, dans un contexte de surabondance ’information, l’individu qui utilise un Système de Recherche d’Information (SRI) reçoit fréquemment plusieurs milliers de documents en réponse à sa requête. La consultation d’une telle quantité de ’réponses est difficile et l’utilisateur est insatisfait. Les SRI actuels utilisent, pour sélectionner les documents réponses, des mots clés (formant la requête) proposés par l’utilisateur. Cependant, nous pensons que l’expression du besoin d’information de l’utilisateur par une simple requête est insuffisante. Nous avons choisi de prendre en compte le contexte de la requête de l’utilisateur (l’activité pour laquelle l’utilisateur recherche de l’information, l’usage de l’information, l’utilisateur luimême) et le contexte de production et de diffusion du document (l’auteur du document, le type de document produit) pour améliorer la recherche d’information. Cet article propose l’utilisation de variables décrivant ces contextes dans une recherche d’information. Il propose ensuite une évaluation de cette utilisation dans un SRI prototype et une amélioration des performances du SRI.

Document joint:

pdf8

Un Système de reformulation de requêtes pour la recherche d’information

Les performances d’un système de recherche d’information (SRI) se mesurent par la qualité des réponses fournies à l’utilisateur. Or la qualité de ces réponses dépend étroitement de la capacité du système à représenter les documents et les requêtes d’une part et de la puissance des algorithmes de recherche d’autre part.
L’adaptation d’un SRI aux besoins de l’utilisateur par le biais du traitement de sa requête s’avère être une approche prometteuse pour faire converger le processus de recherche bien que relativement peu de travaux aient été effectués dans ce domaine.
Nous présentons dans cet article un système de reformulation de requêtes basé sur une approche interactive pour l’expansion de la requête de l’utilisateur.

Document joint:

pdf8

Bibliothèques numériques et travail collaboratif

Après une introduction générale, nous présentons ici les besoins et les attentes des différents utilisateurs des documents numériques, et ce au travers des enquêtes menées pendant la période de mars à juin 2002 auprès d’un public varié de bibliothèques spécialisées, municipales, universitaires et de centres de documentations. Nous présentons également les principaux projets et les différentes activités de collaboration effectuées par ces bibliothèques et par les utilisateurs lors de leurs recherches documentaires. Enfin, nous analysons les résultats et nous avançons les perspectives de ce travail.

Document joint:

pdf5

De l’exploitation des liens hypertexte en recherche d’information

Ce papier présente différentes approches de recherche d’informations exploitant la structure hypertexte des documents d’une collection (pages web par exemple) en plus de l’analyse de leur contenu textuel. Notre objectif est de tester les effets de l’utilisation des liens hypertexte sur les performances de la recherche d’informations et la pertinence des informations restituées dans des collections telle que le web. Nos expérimentations ont été effectuées sur la collection WT2g de TREC-8 (collection de 250000 documents extraits du web).

Document joint:

pdf3

Le Project DEBORA (Digital access to Books of the renAissance )

Le concept de bibliothèque numérique dans ce qu`il représente de mise à disposition auprès du plus grand nombre, dans le monde entier, des richesses patrimoniales des bibliothèques est très attrayant. Le projet DEBORA ( Digital accEss to Books of the renAissance) a été présenté dans le cadre d`un appel d`offre de l`union européenne  » Télematique et Bibliothèque ». Son objectif est de développer des outils permettant l`accès à des collections numérisées du XVIéme siècle. Dans cet article, nous présenterons les principes objectifs et aux fonctions du démonstrateur DEBORA. Nous présenterons les six aspects qui font l`originalité de DEBORA : le choix d`un mode de description élaborée ; la chaîne de numérisation ; l`emploi des techniques de reconnaissance de forme ; les possibilités de recherche et de lecture savante ; l`étude des usages de ce fonds numérique et enfin une analyse économique du coût de la numérisation.

Document joint:

pdf9