cours n°3ue 304b (s. sidhom) ue 304 b cours_l2.documentation_n° 3 gestion des documents :...

54
Cours n°3 UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de l’Information et de la Communication Par : Sahbi SIDHOM MCF. Université Nancy 2 Équipe de recherche SITE – LORIA [email protected]

Upload: madeline-maurice

Post on 03-Apr-2015

108 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom)

UE 304 b Cours_L2.documentation_n° 3

Gestion des documents : Technologies de l’Information et de la Communication

Par :Sahbi SIDHOM

MCF. Université Nancy 2

Équipe de recherche SITE – LORIA

[email protected]

Page 2: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 2

1. Langages documentaires :

Quelques définitions

Page 3: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 3

Définition 1

Les langages documentaires ont été définis par plusieurs spécialistes et organismes de normalisation.

La définition de l’AFNOR, précise pour les langages documentaires qu’il s’agit : « des langages artificiels constitués de représentation des notions et de relations entre ces notions, et qui sont destinés aux systèmes documentaires, pour formaliser les données contenues dans les documents et dans les demandes des utilisateurs ».

Référence :C. Guinchat et Y. Skouri .- Guide pratique des techniques documentaires .- Paris : OPELF, 1989.- vol 2, p.113

Page 4: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 4

Définition 2

J. Chaumier, définie dans son lexique des termes spécialisés en documentation, que :

« le langage documentaire, est un ensemble organisé de termes normalisés utilisés pour représenter le contenu des documents à des fins de mémorisation pour une recherche ultérieure. On distingue essentiellement dans les langages documentaires : les classifications et les thesauri ».Référence :J. Chaumier. Travail et méthodes du Documentaliste. Paris : Entreprise Moderne d’édition, 1984. p.87

Page 5: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 5

Définition 3 : Synthèse

On définie les langages documentaires, selon deux aspects: aspect fonctionnel et aspect structurel.D'un point de vue fonctionnel, un langage documentaire est un outil terminologique conventionnel (ou normalisé) dont les fonctionnalités servent : 1. en amont de la chaîne documentaire, pour l’analyse des

contenus et 2. en aval de cette chaîne, pour la recherche et l'accès à

l'information.Dans ce cadre, la fonction d'un langage documentaire se résume donc, « à la représentation intellectuelle du document » à des fins de mémorisation et de diffusion de l'information documentaire

Page 6: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 6

D'un point de vue structurel, un langage documentaire – et particulièrement les langages à structure combinatoire (liste d’autorité et thesauri…) – se présente comme une liste contrôlée de termes (simples ou composés). Ici le terme “ contrôlé ” veut dire que les éléments sémantiques constituants le langage, sont réduits à des formes grammaticales uniques et invariables ( généralement le substantif / singulier).Par ailleurs, ces termes appelés descripteurs, sont reliés entre eux par des relations sémantiques de trois types :- Relation d’ équivalence,- Relation hiérarchique,- Relation associative ou de voisinage.

Ces relations ont pour objet de regrouper les notions sous un seul terme générique, d'élargir ou de préciser une recherche.

Page 7: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 7

Compatibilité

La notion de “ Compatibilité " est définie, en général, autour des systèmes d’information et, en particulier, autour des produits documentaires, qui peuvent être exploités indépendamment de leurs caractéristiques (codification, structure des données, support physique… etc.) et ceci sans la nécessité d’un traitement au préalable, ni d’une restructuration des donnéesd'origines.

Page 8: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 8

… et convertibilité

Le terme “ Convertibilité ” , à l’opposition du terme compatibilité, a été définie comme un processus de traitement ou de transformation obligatoire de l'information en fonction :

1. des différentes structures (source, cible) et 2. des différents modes de transcription des

données du système récepteur.

Ces opérations permettent en finalité de rendre des produits documentaires interchangeables entre plusieurs systèmes d'information hétérogènes.

Page 9: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 9

Définition 4 : Synthèse

Au cours des années, l’usage fréquent de l'expression "Compatibilité des langages" par plusieurs spécialistes et par l'Unesco, a fait que celle ci a été assimilée à plusieurs synonymes : Intégration, harmonisation, concordance, conciliation…etc,termes qui ont tous en commun l'idée de convergence.la compatibilité des langages documentaires comme étant la qualité d'un langage X, permettant à ses éléments sémantiques de fusionner ou d'être convertis avec d'autres éléments équivalents d'un langage Y.

Page 10: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 10

2.

Evolution des langages documentaires et origine de leursincompatibilités

Page 11: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 11

Evolution

Les langages documentaires ont considérablement évolué dans le temps. Cherchant à perfectionner la recherche documentaire pour plus d’efficacité, de précision et de convivialité, ces outils ont tous connus de véritables développement, que ce soit sur le plan sémantique, thématique que structurel.

Cette évolution a été en partie à l’origine de leur dispersion et donc de leur hétérogénéité. Ce qui revient à dire que lorsque ces derniers sont en relation, le phénomène de leurs incompatibilités apparaît.

Page 12: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 12

1. Le modèle des classifications hiérarchiques

Evolution sur le plan structurel :Partant de l’intérêt de mise en ordre générale des connaissances, c’est-à-dire du besoin de passer d’une mémoire scientifique non structurée de l’humanité à l’ organisation structurée du savoir ne s’est faite véritablement sentir qu’à la fin du 19eme siècle. A cette époque les bibliothèques constituaient les principaux gisements du savoir.

Les documents étaient regroupés physiquement en fonction de leurs contenus. C’est pour répondre à ce besoin d’organisation, qu’ont été inventées les classifications universelles.

Page 13: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 13

Tous les grands systèmes de classifications encyclopédiques (Dewey, CDU, LCC, …) aussi bien que spécialisées selon leurs auteurs (S. Von Frauendorfer, Vickery, Barnard, … ) sont des langages documentaires entièrement codifiés, qui imbriquent deux sous-systèmes : 1. une liste hiérarchisée de tous les sujets prévisibles et 2. un codage significatif (un indice qui peut être fait de

chiffres, de lettres, ou d’une combinaison des deux) de chaque sujet .

Ce modèle se base sur la précoordination des concepts, et adopte une organisation hiérarchique allant du général au particulier.

Page 14: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 14

Avantages

Ces langages documentaires, présentent des avantages. Nous nous

contenterons d’en citer quelques uns :

- Système universel pouvant couvrir toutes les notions du savoir,- Le système de codification des classifications est avantageux pourl’informatisation de celles-ci. Ce système est utile dans le cadre d’unéchange documentaire, où les bibliothèques utilisant la mêmeclassification, indexent leurs documents une seule fois.- Regroupement des notions sous un indice précis- Classement des documents sur des rayonnages suivant le classement des fiches- …

Page 15: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 15

Inconvénients

Par ailleurs, ces classifications présentent également des inconvénients, en voici quelques uns :- Les classifications universelles doivent couvrir toutes les disciplines et sont donc extrêmement volumineuses, donc difficiles à manipuler.- Leur tenue à jour pose des problèmes énormes : elle repose, notamment pour la CDU, sur le travail des commissions permanentes par pays, par discipline et par langue. Il faut une procédure longue et laborieuse pour y introduire des modifications.- Les classifications universelles, étudiées pour l’ensemble des usagers ne sont pas adaptées à chaque service de documentation. Elles s’appliquent bien à un domaine limité et stable.

Page 16: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 16

Bien que l’on puisse laisser des “ cases ” vides, il est assez difficile de les mettre à jour ou de les transformer pour tenir compte des changements importants dans la discipline ou dans le domaine d’activité (le plus souvent pour décrire le sujet principal d’un document et de façon unique).

- Elles se prêtent mal à la description des sujets précis, car les indices deviennent alors très complexes / longueur.

- Manque de rationalité et de rigueur dans leurs syntaxes. Par exemple la CDU, bien qu’elle permet de décrire des sujets complexes avec précision, elle reste une classification hiérarchisée et énumérative qui ne permet pas de faire apparaître les relations entre les sujets.

Page 17: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 17

2. Le modèle des Classifications à facettes

Evolution :Après 1945, les insuffisances des classifications traditionnelles hiérarchiques deviennent de plus en plus évidentes. Même s’il n’est pas encore question d’ordinateurs, une gestion plus rationnelle de fonds documentaires croissants s’impose dans les pays industrialisés. - La classification n’est plus considérée seulement comme un outil de rangement des livres sur des rayons, mais comme un authentique langage dont le but est la recherche documentaire.- C’est ainsi, qu’a été développé un autre modèle de classification basé sur le principe de la structuration à facettes.

Principe :“ Les classifications à facettes ordonnent les concepts et objets en classes mais elles sont multidimentionnelles, c’est à dire que les concepts sont ordonnés à l’intérieur de chaque classe en fonction de différents points de vue ”.

Page 18: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 18

Historique :- Ce système de classification a été développé par le bibliothécaire indien

ShiyaliRamanrita Ranganathan à la suite des travaux de l’Américain Bliss.Ranganathan a produit en 1933 une classification universelle appelée la ColonClassification (CC), qui a été fondée sur le principe de la structuration àfacettes.- Pour cette classification les facettes relèvent de cinq catégories

fondamentales: *Personnalité, *Matière, *Energie, *Espace, *Temps

Ces divisions ou traits à cinq aspects de la réalité : la Personnalité (sujet ou objet), la Matière (moyen ou manière), l'Énergie (action), l'Espace (lieu), le Temps (chrono.),

- Elle se base donc sur une méthode analyticosynthétique qui consiste à analyser le sujet en différents points de vue ou facettes, puis à le resynthétiser par l’arrangement des facettes obtenues.

L’arrangement se fait selon une séquence canonique appelée PMEST, formule représentant les initiales des facettes (P)ersonality, (M)atter, (E)nergy, (S)pace et (T)ime.

Page 19: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 19

Avantages :Les classifications, quelles soient de type énumératives ou à facettes restent utiles là où l’indexation ne demande pas à être opérée enprofondeur . C’est le cas des bibliothèques encyclopédiques, universitaires,publiques…etc.

Cependant, le monde de l’information et de la documentation a connu vers le milieu du 19eme siècle de véritables mutations que ce soit par rapport à:- L’accroissement des fonds documentaires causé par une prolifération massive des publications et notamment les articles de périodiques.- La ramification des sciences et des technologies- Aux exigences des interrogateurs/utilisateurs devenant encore plus exigeants avec des profils de plus en plus spécialisés.

Page 20: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 20

3. Les langages d’indexation analytique

Face aux changements, les langages classificatoires ont perdu de leur intérêt en faveur d’une autre génération de langages documentaire basée sur le principe de l’indexation coordonnée. Il s’agit bien évidemment des langages analytiques ou langages à structure combinatoire.Dans cette grande catégorie se range une typologie très variée d’outils.A cette nouvelle situation correspond un nouveau modèle d’indexation, dit “ indexation coordonnée ” .

Page 21: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 21

Principes :- Le langage documentaire « idéal » devient alors un répertoire de concepts, dits“ descripteurs ” , une sorte de dictionnaire conceptuel appliqué à un domaine particulier du savoir et assorti, le cas échéant, de règles de syntaxe .- Le sujet n’est plus formulé globalement mais par une suite de termes élémentaires. Ici l’élément de base n’est plus le sujet mais le concept. Les avantages de ces langages sont considérables :- A partir d’un nombre limité de concepts on pourra combiner tous les aspects du sujet.- La formule d’indexation peut comporter autant de concepts que l’indexeur le juge nécessaire.- Il n’est plus indispensable d’affecter à chaque descripteur un codage artificiel, les langages analytiques étant proche du langage naturel (utilisables par l’interrogateur et par l’indexeur).- Pour la recherche, la comparaison de la formule d’indexation et de la formule d’interrogation devient beaucoup plus souple (non nécessaire que les deux formules soient rigoureusement identiques). il suffit que les descripteurs de la question se retrouvent dans la formule d’indexation pour que le document soit réputé pertinent : c’est le principe de la postcoordination.

Page 22: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 22

3.1. Les Listes d’autorités

Dans la catégorie des listes d’autorités, sont apparues la “ List of subject headings for use in dictionnary catalog ” de l’American Library Association en 1895, et la “ List of subject headings ” de la Library of Congress en 1911.En France “ Dés août 1978, la norme : principes généraux pour l’indexation des documents – NF Z 47 – 102 – recommandait de disposer d’outils d’indexation permettant de représenter l’information selon un certain nombre de règles ”.Principe :- Les listes d’autorités sont des outils documentaires qui assurent l’uniformité des éléments d’entrée à une notice bibliographique.- Autrement dit, ils contrôlent les points d’accès aux notices bibliographiques. - Ces points d’accès doivent être normalisés et uniformes, respectant ainsi, la même orthographe et les mêmes formes grammaticales.

Page 23: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 23

Exemple :“ Langage documentaire ” voir aussi“ Classification ”“ Documentation ”“ Linguistique ”

On peut utiliser une ou plusieurs vedettes-matières pour décrire un document.L’ordre des mots dans les vedettes est souvent inversé par rapport au langage naturel. Cette façon de structurer les vedettes matières a pour but de faciliter leur regroupement alphabétique.

Par rapport au thesauri, les listes d’autorités se caractérisent par une structuration sémantique pas très développée.

Page 24: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 24

3.2. Les Thesauri

Les thesauri ont introduit dans les techniques documentaires un concept nouveau : celui des langages à post coordination .Le thésaurus représente un mode d’organisation d’un langage documentaire combinatoire très utilisé : plus de 70% des systèmes documentaires fonctionnent actuellement en utilisant ce type d’outil linguistique.

Principe :C’est un ensemble contrôlé de termes entre lesquels les relations hiérarchiques et de voisinage ont été établies. Et pour lesquels les relations de synonymie avec les mots du langage naturel sont réalisés le cas échéant.

Les thesauri s’appliquent dans la plupart des cas à un domaine particulier de la connaissance.

Page 25: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 25

4. Liste de quelques classifications

Dewey (DC) La classification Dewey (DC) est l'oeuvre de l'Américain Melvil Dewey qui la mit sur pied à la fin du XIXe siècle. L'originalité de la DC tient, d'une part, dans l'utilisation du système décimal pour subdiviser chacune des classes établies en sous-classes et pour la notation; elle tient, d'autre part, dans l'adjonction, aux tables de classification, d'un index alphabétique très développé.

Library of Congress (LC)La classification de la Bibliothèque du Congrès (LC) est une autre classification qui est apparue aux États-Unis à la fin du XIXe siècle. Elle a été conçue, comme son nom l'indique, pour satisfaire seulement aux besoins du fonds documentaire considérable, d'un million de documents à l'époque, de cette immense bibliothèque nationale qui est celle du Congrès américain.

Classification décimale universelle (CDU)Mise sur pied, en Europe, également à la fin du XIXe siècle, par l'Institut international de bibliographie, la Classification décimale universelle (CDU) se voulait un catalogue classificatoire pouvant recenser le contenu des documents du monde entier. S'inspirant de la DC, elle reprend ses classes principales et sa notation décimale. Elle y apporte, toutefois, les modifications suivantes : un système de subdivisions beaucoup plus poussé permettant une analyse en profondeur des sujets, une importance accrue de la syntaxe, des innovations dans la subdivision et la notation.

Page 26: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 26

Colon (CC)L'apport le plus original des années 30, au XXe siècle, est celui de l'Indien S.R. Ranganathan qui repose sur une classification d'un type particulier, celui de la classification à facettes appelée «Colon Classification». Contrairement aux autres classifications qui sont monohiérarchiques, la classification à facettes s'appuie sur des principes de division applicables à l'ensemble des objets à classer. On parle alors de «divisions analytiques», de «divisions communes» ou de «traits universels». Ranganathan a ramené ces divisions ou traits à cinq aspects de la réalité d'où la formule anglaise PMEST.

Bliss (BC)La Classification bibliographique de Bliss (BC) est apparue à New York en 1936. Elle se fonde sur les principes suivants : 1) le consensus des spécialistes (savants/savantes et universitaires) qui doit être à la base d'une classification du savoir adaptée à son époque; 2) l'ordre des disciplines qui respecte une savante gradation telle que chaque nouvelle discipline dérive, par subordination, de la précédente; 3) les localisations alternatives qui permettent à un sujet, ex. l'Histoire économique, de se rattacher soit à l'Histoire, soit à l'Économie; 4) la brièveté de la notation par lettres; 5) la structure à facettes.

Page 27: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 27

Classification des LD

Page 28: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 28

Partage de documents

Voisinage réseau

Réseau Microsoft

= fichiers (dossier non partageable)

/users/dess/istie/ = pot (dossier partagé par tt la promo)

Page 29: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 29

2. Langages d’indexation :

Quelques classifications

Page 30: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 30

Un langage documentaire

Unités Linguistiques Documents

S’appuie sur

Décrit

Diapo. 31

stocker, repérer, RI

Page 31: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 31

Unités Linguistiques

Vocabulaire

utilise

Contrôlé Libre ou NON contrôlé

Ensemble fini de termes

Termes expurgés des contraintes du LN:

{ ambiguïtés, polysémies, synonymies,…}

Répertoires terminologiques

Collecte et traitement des termes d'un domaine spécialisé: (normalisation,

systématisation)

Le plus souvent

Diapo. 32

Diapo. 35

Page 32: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 32

Ensemble fini de termes

indexer

repérer

Faciliter l’activité documentairecontrôlé

Langage doc. à vocabulaire contrôlé

Termes postcoordonnés

Termes précoordonnés

Modèles

classifications

Répertoires de vedettes-matière

thesauri

thésaurus

classaurus

Diapo. 33

Diapo. 33

Diapo. 34

Diapo. 34

Page 33: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 33

Termes postcoordonnés

thesauri

thésaurus

classaurus

concepts

Termes d’indexation

Termes

de recherche

caractéristiques

Système

de classification

thésaurus

Type de langage contrôlé qui réunit des traduire

Page 34: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 34

Termes précoordonnés

Modèles

classifications

Répertoires de vedettes-matière

Organiser le savoir et le monde physique en classes (établir des relations entres les unités)

Listes structurées de mots-clés précoordonnés

Page 35: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 35

Libre ou

Non contrôlé

Répertoires terminologiques

Terminologies

Vocabulaires

Ensemble de termes propres à un domaine et à un groupe de personnes

Générique du répertoire Propre au répertoire

Types de représentation

voc. alphabétique

voc. systématique

unilingue multilingue

Termes d’une langue donnée

Termes accompagnés de leur équivalence dans d’autres langues

Diapo. 36

Page 36: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 36

Répertoire :

- qui inventorie les termes d’un domaine

- qui décrit les notions désignées par ces termes

Vocabulaires

Répertoires terminologiques

au moyen de

illustrations définitions

- Lexiques

- Glossaires

- Nomenclatures

- Dico. techniques

Page 37: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 37

Les langages d’indexation coordonnés

Ils sont de deux types : Langage d’indexation post-coordonné :La combinaison des descripteurs se fait au moment de la recherche documentaire, au même titre que les thésaurus. Langage d’indexation pré-coordonné :La combinaison des termes est fixée au moment de l’indexation, tout comme les classifications et les langages en chaîne.

Page 38: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 38

Les langages d’indexation contrôlés

Les langages d’indexation contrôlés se rapprochent des langages naturels : Un langage d’indexation peu contrôlé (libre) correspond

aux descripteurs choisis librement pour représenter le contenu d’un document.

Les langages d’indexation plus contrôlés (contrôlés) se différencient nettement de la langue naturelle.

Il s’agit des langages d’indexation post-coordonnés et pré-coordonnés.

Page 39: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 39

URLs

www.upco.es/terminologia/IntroFrances.htmwww.chu-rouen.fr

Page 40: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 40

3. Recherche d’information :

Quelques schémas fonctionnels

Page 41: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 41

Schéma fonctionnel d’un Système de Recherche d’Information

DOCS

Procédure de Traitement de l’Information (PTI)

INDEX

MASTER

Procédure de Recherche d’Information (PRI)

REQSLangage

d’Indexation

Réponses (REPS)

Base de Données

1

2

3

3

4

56

78

Indexation

Recherche

Page 42: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 42

Modules majeurs d’un SRI

Les composants fonctionnels d’un SRI, pour distinguer ses principales fonctions, peuvent se regrouper en des modules majeurs : a) d'un ensemble d'information (DOCS) ; b) d’une Procédure de Traitement d’Information

(PTI) ; c) d’un ensemble de requêtes (REQS) ; d) d'un mécanisme qui détermine quelles

informations répondent aux requêtes : (Procédures de Recherche d’Information (PRI) )

Page 43: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 43

PTI: Procédure de Traitement d’Information

La PTI est la procédure responsable par le traitement, par l’indexation et par le stockage des documents. Comme résultat, elle génère deux structures de données ou deux groupes de fichiers :

1) INDEX où sont stockés les descripteurs dans une structure construite de manière à faciliter l’accès à l’information ;

2) MASTER où les contenus de documents sont stockés.

L’extraction des descripteurs est faite en ayant comme base un Langage d’Indexation.

Page 44: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 44

Schéma de fonctionnement d’une Procédure de Traitement d’Information

LEXIQUE

Segmentation et Identification des Unités Lexicales

(SIDUL)

Reconnaissance, Extraction et Indexation des Termes (syntagmes nominaux)

(REIS)

Procédure de Traitement d’Information

TEXTES

Base de Données textuelles

Page 45: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 45

PRI: Procédure de Recherche d’Information

La PRI est la procédure chargée de : recevoir la requête de l’usager (REQS), l’interpréter, déterminer la similitude des items

d'information selon ce que demandent ces requêtes,

donner les réponses à l’usager (REPS).

Page 46: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 46

CATALOGAGE DOCUMENTAIREINFORMATISE : Architecture générale

Utilisateur

Demandeen

Langagenaturel

For

mu

lati

onF

orm

ula

tion

Requête« documentaire »

Ref

orm

ula

tion

Ref

orm

ula

tion

Fiches

RésultatRésultat

Mise en correspondanceMise en correspondance+ thésaurus+ thésaurus

Basedocumentaire

Sai

sie

Sai

sie

Fiches

Inde

xati

onIn

dexa

tion

+ th

esau

rus

+ th

esau

rus

Interrogation enInterrogation enlangage naturellangage naturel

IndexationIndexationautomatiqueautomatique

InformatiqueInformatiquedocumentairedocumentaire

BasedocumentairePage Web

Information à valeur

ajoutée (IVA)

Page Web

Page 47: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 47

SRI et les Systèmes d’Information (documentaire)

Il y a plusieurs types de systèmes d’information sur le marché, lesquels sont classés par G. SALTON & M. J. MCGILL en cinq grands groupes :

les systèmes de recherche d’information, les systèmes de gestion d'information, les systèmes de gestion de bases de données, les systèmes de support/ d’aide à la prise de décision, les systèmes de question-réponse.

---------------Gerald SALTON & Michael J. McGILL. Introduction to modern

information retrieval. New York : Mcgraw-Hill Book Company, 1983.

Page 48: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 48

Superposition entre les quatre modules d’un système d'information

Recherche d’Information

Question Réponse

Gestion de Bases de Données

Gestion d’Information

• Récupère des documents et références.

• Stocke des textes en langage naturel.

• Traite les requêtes et en donne un résultat approximatif.

• Récupère les éléments de données (numériques).• Stocke les éléments de données (tables de données).

• Traite les requêtes et en donne un résultat exact.

• Ajoute aux systèmes de gestion de base de données des procédures d’analyse et de synthèse (résumés, synthèses, projections).

• Récupère des faits spécifiques

• Stocke des faits sur des domaines spécifiques et représente les connaissances générales• Traite les requêtes sans restrictions

Page 49: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 49

Position d’un système d’aide à la prise de décision par rapport aux

autres

Recherche d’Information

Question Réponse

Gestion de Bases de Données

Gestion d’Information

SIAD

Référence : http://bdd.univ-lyon2.fr/~boussaid/chap1.pdf (Page 2)

Page 50: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 50

INDEX = Fichier inverse

descripteurs documents

information D1, D2, D3

connaissanceD5, D6, D2

stratégie D2, D3, D6

connaissancerequêteBase docs :

Page 51: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 51

Fichier Direct

documents descripteurs

informationD1

documentsLDDoc DES

D2

D3

stratégieinformation

information

connaissance

stratégieD5 connaissanceD6 connaissance stratégie

Page 52: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 52

Schéma de fonctionnement d’une Procédure de Traitement d’Information

LEXIQUE+

REGLES

Segmentation et Identification des Unités Lexicales

schémas morpho-syntaxique

Reconnaissance, Extraction et Indexation des Termes

(groupes nominaux GN)

thésaurus

Conception du thésaurus

Document

Fichier inverse(GN, DOCs)

production résumé

Texte source

Page 53: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 53

4.

Projet : par groupe de travail

Page 54: Cours n°3UE 304b (S. Sidhom) UE 304 b Cours_L2.documentation_n° 3 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi

Cours n°3 UE 304b (S. Sidhom) 54

Travail demandé

Faites une recherche sur une des classifications (LD)Identifiez ses fonctionnalitésCommentez par des exemples sur un catalogue en ligneIdentifiez les fonctionnalités de recherche d’information par ce LDBibliographie et URLs

Merci.