cours n°3ue 304b (s. sidhom) ue 304 b cours_l2.documentation_n° 3 gestion des documents :...
TRANSCRIPT
Cours n°3 UE 304b (S. Sidhom)
UE 304 b Cours_L2.documentation_n° 3
Gestion des documents : Technologies de l’Information et de la Communication
Par :Sahbi SIDHOM
MCF. Université Nancy 2
Équipe de recherche SITE – LORIA
Cours n°3 UE 304b (S. Sidhom) 2
1. Langages documentaires :
Quelques définitions
Cours n°3 UE 304b (S. Sidhom) 3
Définition 1
Les langages documentaires ont été définis par plusieurs spécialistes et organismes de normalisation.
La définition de l’AFNOR, précise pour les langages documentaires qu’il s’agit : « des langages artificiels constitués de représentation des notions et de relations entre ces notions, et qui sont destinés aux systèmes documentaires, pour formaliser les données contenues dans les documents et dans les demandes des utilisateurs ».
Référence :C. Guinchat et Y. Skouri .- Guide pratique des techniques documentaires .- Paris : OPELF, 1989.- vol 2, p.113
Cours n°3 UE 304b (S. Sidhom) 4
Définition 2
J. Chaumier, définie dans son lexique des termes spécialisés en documentation, que :
« le langage documentaire, est un ensemble organisé de termes normalisés utilisés pour représenter le contenu des documents à des fins de mémorisation pour une recherche ultérieure. On distingue essentiellement dans les langages documentaires : les classifications et les thesauri ».Référence :J. Chaumier. Travail et méthodes du Documentaliste. Paris : Entreprise Moderne d’édition, 1984. p.87
Cours n°3 UE 304b (S. Sidhom) 5
Définition 3 : Synthèse
On définie les langages documentaires, selon deux aspects: aspect fonctionnel et aspect structurel.D'un point de vue fonctionnel, un langage documentaire est un outil terminologique conventionnel (ou normalisé) dont les fonctionnalités servent : 1. en amont de la chaîne documentaire, pour l’analyse des
contenus et 2. en aval de cette chaîne, pour la recherche et l'accès à
l'information.Dans ce cadre, la fonction d'un langage documentaire se résume donc, « à la représentation intellectuelle du document » à des fins de mémorisation et de diffusion de l'information documentaire
Cours n°3 UE 304b (S. Sidhom) 6
D'un point de vue structurel, un langage documentaire – et particulièrement les langages à structure combinatoire (liste d’autorité et thesauri…) – se présente comme une liste contrôlée de termes (simples ou composés). Ici le terme “ contrôlé ” veut dire que les éléments sémantiques constituants le langage, sont réduits à des formes grammaticales uniques et invariables ( généralement le substantif / singulier).Par ailleurs, ces termes appelés descripteurs, sont reliés entre eux par des relations sémantiques de trois types :- Relation d’ équivalence,- Relation hiérarchique,- Relation associative ou de voisinage.
Ces relations ont pour objet de regrouper les notions sous un seul terme générique, d'élargir ou de préciser une recherche.
Cours n°3 UE 304b (S. Sidhom) 7
Compatibilité
La notion de “ Compatibilité " est définie, en général, autour des systèmes d’information et, en particulier, autour des produits documentaires, qui peuvent être exploités indépendamment de leurs caractéristiques (codification, structure des données, support physique… etc.) et ceci sans la nécessité d’un traitement au préalable, ni d’une restructuration des donnéesd'origines.
Cours n°3 UE 304b (S. Sidhom) 8
… et convertibilité
Le terme “ Convertibilité ” , à l’opposition du terme compatibilité, a été définie comme un processus de traitement ou de transformation obligatoire de l'information en fonction :
1. des différentes structures (source, cible) et 2. des différents modes de transcription des
données du système récepteur.
Ces opérations permettent en finalité de rendre des produits documentaires interchangeables entre plusieurs systèmes d'information hétérogènes.
Cours n°3 UE 304b (S. Sidhom) 9
Définition 4 : Synthèse
Au cours des années, l’usage fréquent de l'expression "Compatibilité des langages" par plusieurs spécialistes et par l'Unesco, a fait que celle ci a été assimilée à plusieurs synonymes : Intégration, harmonisation, concordance, conciliation…etc,termes qui ont tous en commun l'idée de convergence.la compatibilité des langages documentaires comme étant la qualité d'un langage X, permettant à ses éléments sémantiques de fusionner ou d'être convertis avec d'autres éléments équivalents d'un langage Y.
Cours n°3 UE 304b (S. Sidhom) 10
2.
Evolution des langages documentaires et origine de leursincompatibilités
Cours n°3 UE 304b (S. Sidhom) 11
Evolution
Les langages documentaires ont considérablement évolué dans le temps. Cherchant à perfectionner la recherche documentaire pour plus d’efficacité, de précision et de convivialité, ces outils ont tous connus de véritables développement, que ce soit sur le plan sémantique, thématique que structurel.
Cette évolution a été en partie à l’origine de leur dispersion et donc de leur hétérogénéité. Ce qui revient à dire que lorsque ces derniers sont en relation, le phénomène de leurs incompatibilités apparaît.
Cours n°3 UE 304b (S. Sidhom) 12
1. Le modèle des classifications hiérarchiques
Evolution sur le plan structurel :Partant de l’intérêt de mise en ordre générale des connaissances, c’est-à-dire du besoin de passer d’une mémoire scientifique non structurée de l’humanité à l’ organisation structurée du savoir ne s’est faite véritablement sentir qu’à la fin du 19eme siècle. A cette époque les bibliothèques constituaient les principaux gisements du savoir.
Les documents étaient regroupés physiquement en fonction de leurs contenus. C’est pour répondre à ce besoin d’organisation, qu’ont été inventées les classifications universelles.
Cours n°3 UE 304b (S. Sidhom) 13
Tous les grands systèmes de classifications encyclopédiques (Dewey, CDU, LCC, …) aussi bien que spécialisées selon leurs auteurs (S. Von Frauendorfer, Vickery, Barnard, … ) sont des langages documentaires entièrement codifiés, qui imbriquent deux sous-systèmes : 1. une liste hiérarchisée de tous les sujets prévisibles et 2. un codage significatif (un indice qui peut être fait de
chiffres, de lettres, ou d’une combinaison des deux) de chaque sujet .
Ce modèle se base sur la précoordination des concepts, et adopte une organisation hiérarchique allant du général au particulier.
Cours n°3 UE 304b (S. Sidhom) 14
Avantages
Ces langages documentaires, présentent des avantages. Nous nous
contenterons d’en citer quelques uns :
- Système universel pouvant couvrir toutes les notions du savoir,- Le système de codification des classifications est avantageux pourl’informatisation de celles-ci. Ce système est utile dans le cadre d’unéchange documentaire, où les bibliothèques utilisant la mêmeclassification, indexent leurs documents une seule fois.- Regroupement des notions sous un indice précis- Classement des documents sur des rayonnages suivant le classement des fiches- …
Cours n°3 UE 304b (S. Sidhom) 15
Inconvénients
Par ailleurs, ces classifications présentent également des inconvénients, en voici quelques uns :- Les classifications universelles doivent couvrir toutes les disciplines et sont donc extrêmement volumineuses, donc difficiles à manipuler.- Leur tenue à jour pose des problèmes énormes : elle repose, notamment pour la CDU, sur le travail des commissions permanentes par pays, par discipline et par langue. Il faut une procédure longue et laborieuse pour y introduire des modifications.- Les classifications universelles, étudiées pour l’ensemble des usagers ne sont pas adaptées à chaque service de documentation. Elles s’appliquent bien à un domaine limité et stable.
Cours n°3 UE 304b (S. Sidhom) 16
Bien que l’on puisse laisser des “ cases ” vides, il est assez difficile de les mettre à jour ou de les transformer pour tenir compte des changements importants dans la discipline ou dans le domaine d’activité (le plus souvent pour décrire le sujet principal d’un document et de façon unique).
- Elles se prêtent mal à la description des sujets précis, car les indices deviennent alors très complexes / longueur.
- Manque de rationalité et de rigueur dans leurs syntaxes. Par exemple la CDU, bien qu’elle permet de décrire des sujets complexes avec précision, elle reste une classification hiérarchisée et énumérative qui ne permet pas de faire apparaître les relations entre les sujets.
Cours n°3 UE 304b (S. Sidhom) 17
2. Le modèle des Classifications à facettes
Evolution :Après 1945, les insuffisances des classifications traditionnelles hiérarchiques deviennent de plus en plus évidentes. Même s’il n’est pas encore question d’ordinateurs, une gestion plus rationnelle de fonds documentaires croissants s’impose dans les pays industrialisés. - La classification n’est plus considérée seulement comme un outil de rangement des livres sur des rayons, mais comme un authentique langage dont le but est la recherche documentaire.- C’est ainsi, qu’a été développé un autre modèle de classification basé sur le principe de la structuration à facettes.
Principe :“ Les classifications à facettes ordonnent les concepts et objets en classes mais elles sont multidimentionnelles, c’est à dire que les concepts sont ordonnés à l’intérieur de chaque classe en fonction de différents points de vue ”.
Cours n°3 UE 304b (S. Sidhom) 18
Historique :- Ce système de classification a été développé par le bibliothécaire indien
ShiyaliRamanrita Ranganathan à la suite des travaux de l’Américain Bliss.Ranganathan a produit en 1933 une classification universelle appelée la ColonClassification (CC), qui a été fondée sur le principe de la structuration àfacettes.- Pour cette classification les facettes relèvent de cinq catégories
fondamentales: *Personnalité, *Matière, *Energie, *Espace, *Temps
Ces divisions ou traits à cinq aspects de la réalité : la Personnalité (sujet ou objet), la Matière (moyen ou manière), l'Énergie (action), l'Espace (lieu), le Temps (chrono.),
- Elle se base donc sur une méthode analyticosynthétique qui consiste à analyser le sujet en différents points de vue ou facettes, puis à le resynthétiser par l’arrangement des facettes obtenues.
L’arrangement se fait selon une séquence canonique appelée PMEST, formule représentant les initiales des facettes (P)ersonality, (M)atter, (E)nergy, (S)pace et (T)ime.
Cours n°3 UE 304b (S. Sidhom) 19
Avantages :Les classifications, quelles soient de type énumératives ou à facettes restent utiles là où l’indexation ne demande pas à être opérée enprofondeur . C’est le cas des bibliothèques encyclopédiques, universitaires,publiques…etc.
Cependant, le monde de l’information et de la documentation a connu vers le milieu du 19eme siècle de véritables mutations que ce soit par rapport à:- L’accroissement des fonds documentaires causé par une prolifération massive des publications et notamment les articles de périodiques.- La ramification des sciences et des technologies- Aux exigences des interrogateurs/utilisateurs devenant encore plus exigeants avec des profils de plus en plus spécialisés.
Cours n°3 UE 304b (S. Sidhom) 20
3. Les langages d’indexation analytique
Face aux changements, les langages classificatoires ont perdu de leur intérêt en faveur d’une autre génération de langages documentaire basée sur le principe de l’indexation coordonnée. Il s’agit bien évidemment des langages analytiques ou langages à structure combinatoire.Dans cette grande catégorie se range une typologie très variée d’outils.A cette nouvelle situation correspond un nouveau modèle d’indexation, dit “ indexation coordonnée ” .
Cours n°3 UE 304b (S. Sidhom) 21
Principes :- Le langage documentaire « idéal » devient alors un répertoire de concepts, dits“ descripteurs ” , une sorte de dictionnaire conceptuel appliqué à un domaine particulier du savoir et assorti, le cas échéant, de règles de syntaxe .- Le sujet n’est plus formulé globalement mais par une suite de termes élémentaires. Ici l’élément de base n’est plus le sujet mais le concept. Les avantages de ces langages sont considérables :- A partir d’un nombre limité de concepts on pourra combiner tous les aspects du sujet.- La formule d’indexation peut comporter autant de concepts que l’indexeur le juge nécessaire.- Il n’est plus indispensable d’affecter à chaque descripteur un codage artificiel, les langages analytiques étant proche du langage naturel (utilisables par l’interrogateur et par l’indexeur).- Pour la recherche, la comparaison de la formule d’indexation et de la formule d’interrogation devient beaucoup plus souple (non nécessaire que les deux formules soient rigoureusement identiques). il suffit que les descripteurs de la question se retrouvent dans la formule d’indexation pour que le document soit réputé pertinent : c’est le principe de la postcoordination.
Cours n°3 UE 304b (S. Sidhom) 22
3.1. Les Listes d’autorités
Dans la catégorie des listes d’autorités, sont apparues la “ List of subject headings for use in dictionnary catalog ” de l’American Library Association en 1895, et la “ List of subject headings ” de la Library of Congress en 1911.En France “ Dés août 1978, la norme : principes généraux pour l’indexation des documents – NF Z 47 – 102 – recommandait de disposer d’outils d’indexation permettant de représenter l’information selon un certain nombre de règles ”.Principe :- Les listes d’autorités sont des outils documentaires qui assurent l’uniformité des éléments d’entrée à une notice bibliographique.- Autrement dit, ils contrôlent les points d’accès aux notices bibliographiques. - Ces points d’accès doivent être normalisés et uniformes, respectant ainsi, la même orthographe et les mêmes formes grammaticales.
Cours n°3 UE 304b (S. Sidhom) 23
Exemple :“ Langage documentaire ” voir aussi“ Classification ”“ Documentation ”“ Linguistique ”
On peut utiliser une ou plusieurs vedettes-matières pour décrire un document.L’ordre des mots dans les vedettes est souvent inversé par rapport au langage naturel. Cette façon de structurer les vedettes matières a pour but de faciliter leur regroupement alphabétique.
Par rapport au thesauri, les listes d’autorités se caractérisent par une structuration sémantique pas très développée.
Cours n°3 UE 304b (S. Sidhom) 24
3.2. Les Thesauri
Les thesauri ont introduit dans les techniques documentaires un concept nouveau : celui des langages à post coordination .Le thésaurus représente un mode d’organisation d’un langage documentaire combinatoire très utilisé : plus de 70% des systèmes documentaires fonctionnent actuellement en utilisant ce type d’outil linguistique.
Principe :C’est un ensemble contrôlé de termes entre lesquels les relations hiérarchiques et de voisinage ont été établies. Et pour lesquels les relations de synonymie avec les mots du langage naturel sont réalisés le cas échéant.
Les thesauri s’appliquent dans la plupart des cas à un domaine particulier de la connaissance.
Cours n°3 UE 304b (S. Sidhom) 25
4. Liste de quelques classifications
Dewey (DC) La classification Dewey (DC) est l'oeuvre de l'Américain Melvil Dewey qui la mit sur pied à la fin du XIXe siècle. L'originalité de la DC tient, d'une part, dans l'utilisation du système décimal pour subdiviser chacune des classes établies en sous-classes et pour la notation; elle tient, d'autre part, dans l'adjonction, aux tables de classification, d'un index alphabétique très développé.
Library of Congress (LC)La classification de la Bibliothèque du Congrès (LC) est une autre classification qui est apparue aux États-Unis à la fin du XIXe siècle. Elle a été conçue, comme son nom l'indique, pour satisfaire seulement aux besoins du fonds documentaire considérable, d'un million de documents à l'époque, de cette immense bibliothèque nationale qui est celle du Congrès américain.
Classification décimale universelle (CDU)Mise sur pied, en Europe, également à la fin du XIXe siècle, par l'Institut international de bibliographie, la Classification décimale universelle (CDU) se voulait un catalogue classificatoire pouvant recenser le contenu des documents du monde entier. S'inspirant de la DC, elle reprend ses classes principales et sa notation décimale. Elle y apporte, toutefois, les modifications suivantes : un système de subdivisions beaucoup plus poussé permettant une analyse en profondeur des sujets, une importance accrue de la syntaxe, des innovations dans la subdivision et la notation.
Cours n°3 UE 304b (S. Sidhom) 26
Colon (CC)L'apport le plus original des années 30, au XXe siècle, est celui de l'Indien S.R. Ranganathan qui repose sur une classification d'un type particulier, celui de la classification à facettes appelée «Colon Classification». Contrairement aux autres classifications qui sont monohiérarchiques, la classification à facettes s'appuie sur des principes de division applicables à l'ensemble des objets à classer. On parle alors de «divisions analytiques», de «divisions communes» ou de «traits universels». Ranganathan a ramené ces divisions ou traits à cinq aspects de la réalité d'où la formule anglaise PMEST.
Bliss (BC)La Classification bibliographique de Bliss (BC) est apparue à New York en 1936. Elle se fonde sur les principes suivants : 1) le consensus des spécialistes (savants/savantes et universitaires) qui doit être à la base d'une classification du savoir adaptée à son époque; 2) l'ordre des disciplines qui respecte une savante gradation telle que chaque nouvelle discipline dérive, par subordination, de la précédente; 3) les localisations alternatives qui permettent à un sujet, ex. l'Histoire économique, de se rattacher soit à l'Histoire, soit à l'Économie; 4) la brièveté de la notation par lettres; 5) la structure à facettes.
Cours n°3 UE 304b (S. Sidhom) 27
Classification des LD
Cours n°3 UE 304b (S. Sidhom) 28
Partage de documents
Voisinage réseau
Réseau Microsoft
= fichiers (dossier non partageable)
/users/dess/istie/ = pot (dossier partagé par tt la promo)
Cours n°3 UE 304b (S. Sidhom) 29
2. Langages d’indexation :
Quelques classifications
Cours n°3 UE 304b (S. Sidhom) 30
Un langage documentaire
Unités Linguistiques Documents
S’appuie sur
Décrit
Diapo. 31
stocker, repérer, RI
Cours n°3 UE 304b (S. Sidhom) 31
Unités Linguistiques
Vocabulaire
utilise
Contrôlé Libre ou NON contrôlé
Ensemble fini de termes
Termes expurgés des contraintes du LN:
{ ambiguïtés, polysémies, synonymies,…}
Répertoires terminologiques
Collecte et traitement des termes d'un domaine spécialisé: (normalisation,
systématisation)
Le plus souvent
Diapo. 32
Diapo. 35
Cours n°3 UE 304b (S. Sidhom) 32
Ensemble fini de termes
indexer
repérer
Faciliter l’activité documentairecontrôlé
Langage doc. à vocabulaire contrôlé
Termes postcoordonnés
Termes précoordonnés
Modèles
classifications
Répertoires de vedettes-matière
thesauri
thésaurus
classaurus
Diapo. 33
Diapo. 33
Diapo. 34
Diapo. 34
Cours n°3 UE 304b (S. Sidhom) 33
Termes postcoordonnés
thesauri
thésaurus
classaurus
concepts
Termes d’indexation
Termes
de recherche
caractéristiques
Système
de classification
thésaurus
Type de langage contrôlé qui réunit des traduire
Cours n°3 UE 304b (S. Sidhom) 34
Termes précoordonnés
Modèles
classifications
Répertoires de vedettes-matière
Organiser le savoir et le monde physique en classes (établir des relations entres les unités)
Listes structurées de mots-clés précoordonnés
Cours n°3 UE 304b (S. Sidhom) 35
Libre ou
Non contrôlé
Répertoires terminologiques
Terminologies
Vocabulaires
Ensemble de termes propres à un domaine et à un groupe de personnes
Générique du répertoire Propre au répertoire
Types de représentation
voc. alphabétique
voc. systématique
unilingue multilingue
Termes d’une langue donnée
Termes accompagnés de leur équivalence dans d’autres langues
Diapo. 36
Cours n°3 UE 304b (S. Sidhom) 36
Répertoire :
- qui inventorie les termes d’un domaine
- qui décrit les notions désignées par ces termes
Vocabulaires
Répertoires terminologiques
au moyen de
illustrations définitions
- Lexiques
- Glossaires
- Nomenclatures
- Dico. techniques
Cours n°3 UE 304b (S. Sidhom) 37
Les langages d’indexation coordonnés
Ils sont de deux types : Langage d’indexation post-coordonné :La combinaison des descripteurs se fait au moment de la recherche documentaire, au même titre que les thésaurus. Langage d’indexation pré-coordonné :La combinaison des termes est fixée au moment de l’indexation, tout comme les classifications et les langages en chaîne.
Cours n°3 UE 304b (S. Sidhom) 38
Les langages d’indexation contrôlés
Les langages d’indexation contrôlés se rapprochent des langages naturels : Un langage d’indexation peu contrôlé (libre) correspond
aux descripteurs choisis librement pour représenter le contenu d’un document.
Les langages d’indexation plus contrôlés (contrôlés) se différencient nettement de la langue naturelle.
Il s’agit des langages d’indexation post-coordonnés et pré-coordonnés.
Cours n°3 UE 304b (S. Sidhom) 39
URLs
www.upco.es/terminologia/IntroFrances.htmwww.chu-rouen.fr
Cours n°3 UE 304b (S. Sidhom) 40
3. Recherche d’information :
Quelques schémas fonctionnels
Cours n°3 UE 304b (S. Sidhom) 41
Schéma fonctionnel d’un Système de Recherche d’Information
DOCS
Procédure de Traitement de l’Information (PTI)
INDEX
MASTER
Procédure de Recherche d’Information (PRI)
REQSLangage
d’Indexation
Réponses (REPS)
Base de Données
1
2
3
3
4
56
78
Indexation
Recherche
Cours n°3 UE 304b (S. Sidhom) 42
Modules majeurs d’un SRI
Les composants fonctionnels d’un SRI, pour distinguer ses principales fonctions, peuvent se regrouper en des modules majeurs : a) d'un ensemble d'information (DOCS) ; b) d’une Procédure de Traitement d’Information
(PTI) ; c) d’un ensemble de requêtes (REQS) ; d) d'un mécanisme qui détermine quelles
informations répondent aux requêtes : (Procédures de Recherche d’Information (PRI) )
Cours n°3 UE 304b (S. Sidhom) 43
PTI: Procédure de Traitement d’Information
La PTI est la procédure responsable par le traitement, par l’indexation et par le stockage des documents. Comme résultat, elle génère deux structures de données ou deux groupes de fichiers :
1) INDEX où sont stockés les descripteurs dans une structure construite de manière à faciliter l’accès à l’information ;
2) MASTER où les contenus de documents sont stockés.
L’extraction des descripteurs est faite en ayant comme base un Langage d’Indexation.
Cours n°3 UE 304b (S. Sidhom) 44
Schéma de fonctionnement d’une Procédure de Traitement d’Information
LEXIQUE
Segmentation et Identification des Unités Lexicales
(SIDUL)
Reconnaissance, Extraction et Indexation des Termes (syntagmes nominaux)
(REIS)
Procédure de Traitement d’Information
TEXTES
Base de Données textuelles
Cours n°3 UE 304b (S. Sidhom) 45
PRI: Procédure de Recherche d’Information
La PRI est la procédure chargée de : recevoir la requête de l’usager (REQS), l’interpréter, déterminer la similitude des items
d'information selon ce que demandent ces requêtes,
donner les réponses à l’usager (REPS).
Cours n°3 UE 304b (S. Sidhom) 46
CATALOGAGE DOCUMENTAIREINFORMATISE : Architecture générale
Utilisateur
Demandeen
Langagenaturel
For
mu
lati
onF
orm
ula
tion
Requête« documentaire »
Ref
orm
ula
tion
Ref
orm
ula
tion
Fiches
RésultatRésultat
Mise en correspondanceMise en correspondance+ thésaurus+ thésaurus
Basedocumentaire
Sai
sie
Sai
sie
Fiches
Inde
xati
onIn
dexa
tion
+ th
esau
rus
+ th
esau
rus
Interrogation enInterrogation enlangage naturellangage naturel
IndexationIndexationautomatiqueautomatique
InformatiqueInformatiquedocumentairedocumentaire
BasedocumentairePage Web
Information à valeur
ajoutée (IVA)
Page Web
Cours n°3 UE 304b (S. Sidhom) 47
SRI et les Systèmes d’Information (documentaire)
Il y a plusieurs types de systèmes d’information sur le marché, lesquels sont classés par G. SALTON & M. J. MCGILL en cinq grands groupes :
les systèmes de recherche d’information, les systèmes de gestion d'information, les systèmes de gestion de bases de données, les systèmes de support/ d’aide à la prise de décision, les systèmes de question-réponse.
---------------Gerald SALTON & Michael J. McGILL. Introduction to modern
information retrieval. New York : Mcgraw-Hill Book Company, 1983.
Cours n°3 UE 304b (S. Sidhom) 48
Superposition entre les quatre modules d’un système d'information
Recherche d’Information
Question Réponse
Gestion de Bases de Données
Gestion d’Information
• Récupère des documents et références.
• Stocke des textes en langage naturel.
• Traite les requêtes et en donne un résultat approximatif.
• Récupère les éléments de données (numériques).• Stocke les éléments de données (tables de données).
• Traite les requêtes et en donne un résultat exact.
• Ajoute aux systèmes de gestion de base de données des procédures d’analyse et de synthèse (résumés, synthèses, projections).
• Récupère des faits spécifiques
• Stocke des faits sur des domaines spécifiques et représente les connaissances générales• Traite les requêtes sans restrictions
Cours n°3 UE 304b (S. Sidhom) 49
Position d’un système d’aide à la prise de décision par rapport aux
autres
Recherche d’Information
Question Réponse
Gestion de Bases de Données
Gestion d’Information
SIAD
Référence : http://bdd.univ-lyon2.fr/~boussaid/chap1.pdf (Page 2)
Cours n°3 UE 304b (S. Sidhom) 50
INDEX = Fichier inverse
descripteurs documents
information D1, D2, D3
connaissanceD5, D6, D2
stratégie D2, D3, D6
connaissancerequêteBase docs :
Cours n°3 UE 304b (S. Sidhom) 51
Fichier Direct
documents descripteurs
informationD1
documentsLDDoc DES
D2
D3
stratégieinformation
information
connaissance
stratégieD5 connaissanceD6 connaissance stratégie
Cours n°3 UE 304b (S. Sidhom) 52
Schéma de fonctionnement d’une Procédure de Traitement d’Information
LEXIQUE+
REGLES
Segmentation et Identification des Unités Lexicales
schémas morpho-syntaxique
Reconnaissance, Extraction et Indexation des Termes
(groupes nominaux GN)
thésaurus
Conception du thésaurus
Document
Fichier inverse(GN, DOCs)
production résumé
Texte source
Cours n°3 UE 304b (S. Sidhom) 53
4.
Projet : par groupe de travail
Cours n°3 UE 304b (S. Sidhom) 54
Travail demandé
Faites une recherche sur une des classifications (LD)Identifiez ses fonctionnalitésCommentez par des exemples sur un catalogue en ligneIdentifiez les fonctionnalités de recherche d’information par ce LDBibliographie et URLs
Merci.