guide pour l'installation du glossaire sur un site drupal 6.x

25
Installation du glossaire Eaufrance sur un site DRUPAL (version 6.x) Guide d’installation Nicolas Dhuygelaere (OIEau) 12/11/2015 Version 1.2 Document élaboré en application du schéma national des données sur l’eau

Upload: haliem

Post on 05-Jan-2017

221 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Guide pour l'installation du glossaire sur un site DRUPAL 6.x

Installation du glossaire Eaufrance sur un site DRUPAL (version 6.x) Guide d’installation Nicolas Dhuygelaere (OIEau)

12/11/2015 Version 1.2

Document élaboré en application du schéma national des données sur l’eau

Page 2: Guide pour l'installation du glossaire sur un site DRUPAL 6.x

CONTEXTE

Ce document a été élaboré par l'Office International de l'Eau (OIEau) avec le soutien financier de l'Office National de l'Eau et des Milieux Aquatiques (Onema). Il vient en appui aux utilisateurs des outils communs du SIE mis en place sur les sites en application du schéma web de diffusion des données (SWDD) sur l’eau. C’est un document technique à destination des administrateurs de sites web. DOCUMENTS DE REFERENCE

Schéma web de diffusion des données sur l’eau Anne Lançon (ONEMA)

Un glossaire sur l’eau et les milieux aquatiques Janik Michon (ONEMA)

Création d’un flux de syndication de concepts du glossaire Eaufrance pour intégration à un site web

Nicolas Dhuygelaere (OIEau)

Installation du glossaire Eaufrance sur un site SPIP (version 2.x)

Nicolas Dhuygelaere (OIEau)

Installation du glossaire Eaufrance sur un site Drupal (version 7.x)

Nicolas Dhuygelaere (OIEau)

AUTEURS ET CONTRIBUTEURS

Nicolas Dhuygelaere, ingénieur études données (OIEau)

Avec la contribution de

Anne Lançon, chef de projet « diffusion des données » (ONEMA)

Janik Michon, chef de projet « valorisation des données » (ONEMA)

Sous la coordination de

Janik Michon, chef de projet « valorisation des données » (ONEMA)

Droits d’usage : http://creativecommons.org/licenses/by-nc-sa/2.0/fr Mots-clés : Glossaire, eaufrance, eau, thésaurus, guide Couverture géographique : France (dont DOM) Niveau géographique : - Niveau de lecture : Professionnel Langue : Français Diffuseur : Office national de l’eau et des milieux aquatiques (Onema)

Page 3: Guide pour l'installation du glossaire sur un site DRUPAL 6.x

OBJET ET DOMAINE D’APPLICATION

Ce document vient en appui aux utilisateurs des outils communs du SIE mis en place en application du schéma web de diffusion des données (SWDD) sur l’eau. C’est un document technique à destination des administrateurs de sites web, en particulier ceux de la toile eaufrance.fr, qui souhaitent intégrer le glossaire Eaufrance sur leur site web développé en DRUPAL. Les préconisations techniques qui suivent sont valables pour les sites développés en DRUPAL, pour toutes versions de la branche 6.x qui utilise la version 1.2 du package « glossaire ».

Page 4: Guide pour l'installation du glossaire sur un site DRUPAL 6.x

SOMMAIRE

1. Introduction ......................................................................................................... 5 2. Présentation du package DRUPAL 6.x .............................................................. 6 3. Installation du package DRUPAL 6.x ................................................................. 7

3.1 Pré-requis .............................................................................................................. 7 3.2 Téléchargement et installation du package ....................................................... 8

3.2.1 Téléchargement ...................................................................................................... 8 3.2.2 Installation .............................................................................................................. 8

3.3 Configuration des modules et des droits utilisateurs ..................................... 10 3.3.1 Attribution des droits utilisateurs ........................................................................... 10 3.3.2 Configuration du module « Glossaire syndicate » ................................................. 11 3.3.2.1 Créer une liste de concepts pour votre site depuis le glossaire Eaufrance ........ 11 3.3.2.2 Configurer la syndication à une liste de concepts .......................................... 11 3.3.3 Configuration du module « Glossaire auto » ......................................................... 12 3.3.3.1 Principe de fonctionnement ............................................................................ 12 3.3.3.2 Options de configurations ............................................................................... 13 3.3.4 Configuration du module « Glossaire eaufrance » et intégration dans un site « eaufrance » ................................................................................................................. 16

4. Présentation du type de contenu « Concept SKOS » .................................... 17

4.1. Qu’est-ce qu’un « Concept SKOS » ? ............................................................... 17 4.2. Pourquoi un nouveau type de contenu? .......................................................... 18 4.3. Description des champs .................................................................................... 18

5. Intégration du glossaire selon la charte Eaufrance ....................................... 18

5.1. Modification du bandeau haut ........................................................................... 18 5.2. Style général de la page abécédaire ................................................................. 19 5.3. Style général de la page descriptive d’un concept ......................................... 21

6. Informations supplémentaires pour les développeurs .................................. 22

Page 5: Guide pour l'installation du glossaire sur un site DRUPAL 6.x

GUIDE

1. Introduction

De nombreux acteurs produisent et diffusent des informations relatives à l'eau et aux milieux aquatiques, utilisant des termes plus ou moins techniques. Pour faciliter un langage commun, et dans un souci de cohérence, les partenaires du système d'information sur l'eau (SIE) ont décidé de mettre à disposition le glossaire qu'ils ont établi ensemble.

Ce glossaire est accessible à l'adresse suivante : http://www.glossaire.eaufrance.fr.

Figure 1 : Page d’accueil du site www.glossaire.eaufrance.fr

Le contenu actuel de ce glossaire repose sur l'analyse d'une cinquantaine de glossaires existants (documents, sites web, ...), et comprend environ 1400 termes disponibles en 3 langues : français, anglais et espagnol, dont la consultation est libre d'accès. Le glossaire est évolutif : tout utilisateur peut proposer de modifier ou supprimer certains termes. Les propositions sont évaluées par un groupe d'utilisateurs, partenaires du SIE. Ce site permet par ailleurs à d'autres sites web d'alimenter dynamiquement leurs contenus, en s’abonnant au glossaire, et d'être mis à jour en temps réel. Si un utilisateur gère lui-même un glossaire et qu’il souhaite bénéficier du contenu de celui-ci, il lui suffit de s’abonner par flux RSS / RDF.

Par ailleurs, pour favoriser l'utilisation du glossaire par d'autres sites partenaires, des outils ont été développés afin d'importer, de présenter et d'exploiter sur leur propre site les concepts définis dans le glossaire Eaufrance. Il s'agit notamment de packages contenant les modules/plugin nécessaires à l'intégration du glossaire sur des sites réalisés sous DRUPAL 6.x, 7x et SPIP 2.x. Ces outils sont disponibles à l'adresse : http://www.glossaire.eaufrance.fr/noeud/comment-réutiliser-le-glossaire.

Le présent document détail les modalités d’utilisation de l’outil destiné aux sites fonctionnant sous DRUPAL 6.x.

Page 6: Guide pour l'installation du glossaire sur un site DRUPAL 6.x

2. Présentation du package DRUPAL 6.x

Le package « glossaire Eaufrance pour DRUPAL 6.x », offre les fonctionnalités suivantes :

la création d'une page « glossaire » sur votre site

Figure 2 : Capture d'écran de la page "glossaire"

la syndication à une liste de concepts du glossaire eaufrance

Figure 3 : Capture d'écran de la page de configuration des flux de syndication

la recherche des mots du glossaire dans les pages de votre site afin de créer des liens/infobulles présentant les concepts du glossaire (la création de ces éléments interactifs ne modifie en rien le contenu de votre site)

Figure 4 : Exemple de fonctionnement du glossaire automatique

Le package pour DRUPAL 6.x est composé de 6 modules :

le module « glossaire » permet la mise en place d'un glossaire utilisant des concepts SKOS. Il permet notamment d'ajouter le type de contenu « concept_skos » à votre installation

Page 7: Guide pour l'installation du glossaire sur un site DRUPAL 6.x

DRUPAL et une page spécifique pour le glossaire (http://www.monsitedrupal.fr/?q=glossaire ou http://www.monsitedrupal.fr/glossaire) ;

le module « glossaire_syndicate » vient en complément du module « glossaire ». Ce module permet de se syndiquer aux concepts d'un glossaire à partir de flux RSS ou RDF-SKOS notamment diffusé(s) pour le site http://www.glossaire.eaufrance.fr ;

le module « glossaire_auto » vient en complément du module « glossaire ». Ce module fournit des fonctions permettant de repérer des mots dans un texte à partir des mots d'un glossaire et de créer des liens et/ou des infobulles pointant dessus ;

Le module « glossaire_eaufrance » propose différentes fonctionnalités spécifiques (ajout de blocs, de liens…) pour les interactions avec le site http://www.glossaire.eaufrance.fr ;

Le module « jquery_tooltip » vient en complément du module « glossaire_auto ». Ce module est une implémentation pour DRUPAL du plugin jquery « Tooltip » disponible à l'adresse suivante : http://bassistance.de/jquery-plugins/jquery-plugin-tooltip/. Le plugin « tooltip » fournit les librairies permettant l'affichage d'infobulles avec jquery.

Le module « link_image » ajoute un affichage des liens sous la forme d'image. Il s'agit d'un appendis pour le module « link ».

Le package offre également de nombreuses options de configuration et une gestion fine des droits utilisateurs.

3. Installation du package DRUPAL 6.x

Avertissement :

Même si le package a fait l'objet de nombreux tests, avant toute opération, effectuez une sauvegarde complète de votre site (code+base de données) pour plus de précautions.

3.1 Pré-requis

Le package a été développé et testé pour une installation DRUPAL 6.x, sous PHP 5 fonctionnant avec une base Mysql et/ou une base Postgres. Une installation sous PHP 4 est fortement déconseillée car dans ce cas le module « glossaire_auto » peut avoir un fonctionnement dégradé et le module « glossaire_syndicate » sera inopérant en raison de sa dépendance à la librairie simpleXML de PHP.

Vous devez bénéficier des droits d'écriture sur votre serveur web afin de déposer les fichiers des différents modules nécessaires, et des droits administrateur sur votre site DRUPAL pour activer les modules.

Par ailleurs, pour installer le module « glossaire », vous devez installer au préalable, et dans l'ordre suivant, les modules présentés ci-après, préférentiellement dans leur dernière version stable pour DRUPAL 6.x :

content (cck) : ce module permet aux administrateurs de définir de nouveaux types de contenus. Il est disponible à l'adresse suivante : http://drupal.org/project/cck ;

text : ce module permet de définir des champs de type texte. Ce module est compris dans le module cck ;

content_copy : ce module permet d'importer/exporter la définition des types de contenu. Ce module est compris dans le module cck ;

link : ce module définit des champs de type texte lien. Il est disponible à l'adresse suivante : http://drupal.org/project/link

Pour installer un module sous DRUPAL 6.x, référez-vous à la documentation officielle en ligne : http://drupal.org/documentation/install/modules-themes/modules-5-6. Si votre installation dispose déjà de l'un de ces modules, il n'est à priori pas nécessaire de le réinstaller.

Page 8: Guide pour l'installation du glossaire sur un site DRUPAL 6.x

Pour un fonctionnement optimal du package, il est également recommandé de :

disposer de la librairie curl, accessible à l’adresse : http://fr.php.net/manual/fr/book.curl.php avec php. Cette librairie est notamment utile pour le module « glossaire_syndicate » afin de charger le flux en provenance du glossaire eaufrance. Si cette librairie n'est pas disponible, le module « glossaire_syndicate » utilisera la fonction php « file_get_contents() » avec le risque d'atteindre un timeout si le glossaire met trop de temps à répondre ;

d'installer le module « simplehtmldom » disponible à l’adresse suivante : http://drupal.org/project/simplehtmldom. Ce module permet d'améliorer le fonctionnement du module « glossaire_auto », c’est-à-dire les fonctions de recherche automatique des mots du glossaire dans les textes du site (cf partie 3.3.3.2).

3.2 Téléchargement et installation du package

3.2.1 Téléchargement

Le package « glossaire Eaufrance » pour DRUPAL 6.x est disponible à l'adresse suivante : http://www.glossaire.eaufrance.fr/noeud/comment-r%C3%A9utiliser-le-glossaire.

Dans la section « Comment utiliser un flux de syndication sur un site web ? » de la page concernée, cliquez sur le lien de téléchargement des « Modules d’installation du glossaire sur un site DRUPAL 6.x » : le fichier en téléchargement est une archive zip.

Figure 5 : Page de téléchargement du package glossaire

3.2.2 Installation

Une fois le package téléchargé, décompressez l'archive zip et placez les fichiers sur votre serveur web, au niveau du répertoire dédié aux modules complémentaires de DRUPAL, à savoir, au choix :

//chemin vers le répertoire d'installation drupal/sites/all/modules/custom

Page 9: Guide pour l'installation du glossaire sur un site DRUPAL 6.x

//chemin vers le répertoire d'installation drupal/sites/all/modules

Lorsque les fichiers sont en place, ouvrez l'interface d'administration de votre site DRUPAL 6.x, depuis votre navigateur web, à la page de gestion des modules : http://www.monsite.fr/admin/build/modules/list (cela nécessite les droits administrateur).

Puis, cochez les modules suivants (voir image ci-dessous) :

Glossaire : le module de base du package ; Glossaire Auto : si vous souhaitez disposez des fonctions du glossaire automatique ; Glossaire syndicate : si vous souhaitez vous syndiquer aux définitions des concepts du

glossaire eaufrance ; Glossaire Eaufrance : si vous souhaitez disposer des fonctions spécifiques pour le glossaire

eaufrance ; jquery_tooltip : si vous souhaitez bénéficier des définitions des concepts retrouvés par le

glossaire de manière automatique ; link_image,: si vous souhaitez pouvoir afficher les illustrations du glossaire sous forme

d'images ; simplehtmldom API (facultatif mais recommandé - cf partie 3.3.3.2) : il se trouve dans la

section « Filter » de la page de gestion des modules.

Figure 6 : Page d'activation des modules Drupal

Enfin, cliquez sur le bouton « Enregistrer la configuration » (situé en bas de page) pour activer les modules sélectionnés. A la fin du processus d'activation, un message du type « The configuration options have been saved. » s’affichera, ainsi que, éventuellement, des détails sur les opérations réalisées par DRUPAL sur la base de données.

Après l'activation des modules, il est conseillé de vider le cache de DRUPAL en lançant la page suivante : http://www.monsite.fr/admin_menu/flush-cache. Afin de vérifier que installation est correctement réalisée, vous pouvez :

ouvrir la page http://www.monsite.fr/?q=glossaire ; tester l’existence du type de contenu « Concept SKOS » dans la section « Gestion du

contenu » de l'administration du site ; constater la présence des items « Glossaire auto » et «Glossaire syndicate » dans la section

«configuration du site » de l'administration du site.

Page 10: Guide pour l'installation du glossaire sur un site DRUPAL 6.x

Note sur les fichiers de langues et la traduction du site :

Afin de prendre en compte le multilinguisme de DRUPAL, les interfaces du « package glossaire » ont été développées en anglais. Des fichiers de traduction en langue française sont disponibles au niveau de chaque module. Ils sont normalement installés automatiquement par DRUPAL lors de l'activation des modules, si la langue française a été choisie lors de l'installation de votre site DRUPAL.

Si, lors de l'installation des modules, les fichiers de langues n'ont pas été pris en compte, vous pouvez forcer leur activation en les téléchargeant depuis l'espace d'administration de votre site, en vous rendant à l'adresse suivante sur votre site : http://www.monsite.fr/admin/build/translate/import

3.3 Configuration des modules et des droits utilisateurs

3.3.1 Attribution des droits utilisateurs

Généralement, DRUPAL n’accorde pas des droits d’accès aux différents profils d'utilisateurs. Cette étape est donc importante, par exemple si vous souhaitez que vos visiteurs puissent consulter la page du glossaire, voir les pages descriptives des concepts, etc. A minima, il est donc recommandé de faire les réglages suivants dans la section « Permissions » de la partie « Gestion des utilisateurs » de l'espace d'administration de votre site (http://www.monsite.fr/admin/user/permissions) :

Tableau 1 : Table d'attribution préférentielle des droits utilisateur

Module et permission Utilisateur anonyme Utilisateur authentifié

glossaire_module

access Glossaire oui oui

glossaire_syndicate_module

administer glossaire syndicate non déconseillé

glossaire_auto_module

administer glossaire auto non déconseillé

node module

creat concept_skos content déconseillé déconseillé

delete concept_skos content déconseillé déconseillé

delete own concept_skos content déconseillé déconseillé

edit any concept_skos content déconseillé déconseillé

edit own concept_skos content déconseillé déconseillé

La capture d'écran suivante vous présente un exemple d'interface d'attribution des droits sous DRUPAL.

Figure 7 : Interface Drupal de l'attribution des droits

Après avoir attribué les droits aux différents rôles utilisateurs, n’oubliez pas de sauvegarder votre configuration en cliquant sur « Enregistrer les droits d’accès » (en bas de la page).

Page 11: Guide pour l'installation du glossaire sur un site DRUPAL 6.x

3.3.2 Configuration du module « Glossaire syndicate »

3.3.2.1 Créer une liste de concepts pour votre site depuis le glossaire Eaufrance

Une guide spécifique décrit le processus. Il est également accessible à l’adresse : http://www.glossaire.eaufrance.fr/node/8438.

3.3.2.2 Configurer la syndication à une liste de concepts

Une fois que vous avez établi votre liste de concepts et configuré son export en flux RSS ou RDF sur le site http://www.glossaire.eaufrance.fr, vous pouvez réutiliser l'URL de votre flux pour importer les concepts sur votre site grâce au module « glossaire_syndicate ».

L'accès à l'interface de configuration se trouve dans la section « configuration du site » de l'administration de votre site. L'URL pour y accéder est de la forme suivante : http://www.monsite.fr/admin/settings/glossaire_syndicate.

Sur cette page, vous trouverez la liste des flux déjà configurés avec les informations les concernant.

Figure 8 : Interface de configuration des flux de syndication

A la fin, de chaque ligne descriptive, vous trouverez des liens vous permettant de forcer la synchronisation du flux avec le glossaire, de le modifier et de le supprimer. Sur cette page vous trouverez également un lien pour créer un nouveau flux.

Lors de la modification ou de la création des flux vous disposez des options de configuration suivantes :

le nom du flux ;

l'adresse du flux (celle que vous avez créée sur le site http://www.glossaire.eaufrance.fr ) ;

le format du flux : RSS, RDF-SKOS + mode de détermination automatique ;

la définition de la valeur par défaut du champ « source » ;

la fréquence de synchronisation de votre flux : elle nécessite d'avoir une tâche cron (ou, à défaut, utilisez le module poormanscron : http://drupal.org/project/poormanscron);

la configuration des liens d’interaction avec le glossaire Eaufrance (fonctionnalités ajoutées par le module glossaire_eaufrance).

Figure 9 : Formulaire de configuration d'un flux de syndication

Page 12: Guide pour l'installation du glossaire sur un site DRUPAL 6.x

Dans le cas d’une mise à jour depuis la version 1.0 du module, avant de resynchroniser les concepts, il est recommandé de supprimer au préalable tous les concepts issus du site www.glossaire.eaufrance.fr afin d’éviter les doublons de contenu lors de la mise en place de la gestion multilingue.

3.3.3 Configuration du module « Glossaire auto »

3.3.3.1 Principe de fonctionnement

Le module « glossaire auto » permet de rechercher dans un texte une liste de termes prédéfinie. Nous utilisons ici le mot « terme » et non pas « concept » car la liste des mots à rechercher est en fait constituée des libellés, des libellés alternatifs et des sigles de chaque concept du glossaire importés dans votre site.

Lors du processus de recherche des termes du glossaire dans un texte, l’algorithme recherche dans le texte des séquences de mots correspondant aux termes du glossaire en utilisant une méthode simplifiée de lemmatisation (cf : http://fr.wikipedia.org/wiki/Lemmatisation) associée à des expressions régulières (cf http://fr.wikipedia.org/wiki/Expressions_régulières). La lemmatisation est dite simplifiée car elle ne gère que les caractères accentués, les formes plurales et féminines simples, c'est à dire des mots finissant par : s, x et e.

Par exemple le système trouvera :

« eaux douces » pour « eau douce » ;

« rejeté », « rejets », « rejetées » pour « rejet ».

Mais le système ne trouvera pas :

« arrêtés préfectoraux » pour « arrêté préfectoral » car la forme plurale est plus complexe ;

« normalisation » pour « norme » mots ayant pourtant le même lemme (même racine).

Page 13: Guide pour l'installation du glossaire sur un site DRUPAL 6.x

Dans cette première version, le glossaire automatique n'est pas capable de considérer le sens du terme (en fonction d'une thématique) par rapport au sens du texte, en se basant sur un champ sémantique ou sur une liste fermée de thématiques. Des contresens sont donc possibles sur des termes ayant des homonymes ou des sigles significatifs (exemple : MISE). Dans la version suivante, un correctif sera apporté.

Le tableau ci-dessous présente quelques exemples de résultats de recherche en fonction du mode de recherche sur un texte de référence (les mots en italique indiquent quels sont les mots trouvés par le glossaire auto).

Texte de référence :

Agence de l'eau Établissement public de l'État à caractère administratif placé sous la tutelle du ministre chargé de l'environnement. Dans le bassin ou groupement de bassins, l'agence de l'eau met en œuvre le schéma directeur d'aménagement et de gestion des eaux (SDAGE) et les schémas d'aménagement et de gestion des eaux (SAGE), en favorisant une gestion équilibrée et économe de la ressource en eau et des milieux aquatiques, l'alimentation en eau potable, la régulation des crues et le développement durable des activités économiques. Elle mène, de plus, une politique foncière de sauvegarde des zones humides approuvée par le comité de bassin. Ses ressources proviennent essentiellement de la perception de redevances sur les prélèvements et la pollution des eaux...

Tableau 2 : Exemples de résultat en fonction du mode de recherche sur un texte de référence

Termes du glossaire Recherche simple (mot à mot)

Recherche insensible à la casse

Recherche insensible à la casse avec prise en compte de la ponctuation

Recherche avec lemmatisation

Bassin non oui oui oui

Groupement de bassins non non oui oui

Schéma directeur non oui oui oui

SDAGE non non oui oui

Schéma d'aménagement et de gestion des eaux

non non non oui

SAGE non non oui oui

Eau potable non non oui oui

Crue non non non oui

Développement durable non oui oui oui

Zone humide non non non oui

Comité de bassin non non oui oui

Prélèvement non non oui oui

Pollution non oui oui oui

3.3.3.2 Options de configurations

Le module propose différentes options de configuration dans la section « configuration du site » :

la sélection des types de contenu sur lesquels seront effectués les traitements du glossaire automatique : DRUPAL permet de créer autant de types de contenus que souhaité, avec les champs spécifiques (avec le module cck) correspondants (par exemple: des actualités, des notices documentaires, des fiches de présentation d'un objet, d'un milieu, etc.). Vous pouvez donc appliquer la recherche des termes sur les types de contenus que vous aurez définis. Il n'est par contre pas possible dans cette version d'appliquer le glossaire automatique sur les pages produites par d'autres modules, tels que : view, taxonomy, book, user.

Page 14: Guide pour l'installation du glossaire sur un site DRUPAL 6.x

Figure 10 : Configuration du glossaire_auto : sélection des types de contenu

la sélection de l'étape de génération du nœud pour effectuer la recherche des mots du glossaire : DRUPAL propose plusieurs points d'ancrage/insertion (des hook, en langage DRUPAL) de code dans son processus de rendu des nœuds. Pour l'instant, le glossaire auto propose deux points d'entrée :

- avant le rendu du nœud : le traitement sera réalisé sur le champ « body » du nœud et sur les champs cck de type texte n'utilisant pas le module « optionwidgets ». Cette option offre le meilleur compromis entre le temps d'exécution et la complétude de la recherche ;

- après le rendu du nœud : le traitement sera réalisé sur le contenu du nœud mis en forme. Cette option permet une recherche très complète car basée sur l'intégralité du contenu mais peut s’avérer très consommatrice en ressource car dans ce cas on analyse le code HTML.

l’optimisation du mode recherche : le glossaire auto propose plusieurs options afin d'augmenter la sensibilité de sa recherche ou de diminuer le temps d’exécution de la page. Vous pouvez choisir :

- d'appliquer ou non la sensibilité à la casse : il est conseillé d'utiliser la sensibilité à la casse même si le temps d’exécution s'en trouve légèrement augmenté, mais vos chances de retrouver les termes du glossaire s'en trouveront fortement augmenté ;

- de chercher toutes les occurrences des mots du glossaire ou seulement la première : ne chercher que la première occurrence d'un terme permet de réduire le temps d’exécution du script et d'alléger la charge visuelle de vos pages ;

- de faire la recherche sur tout le code HTML de la page ou seulement sur le texte c'est à dire sans les balises HTML. Cette option est celle qui aura le plus d'impact sur le temps d’exécution ou sur l'intégrité de votre code HTML. Appliquer la recherche sur tout le code HTML permet de réduire très fortement le temps d’exécution du script surtout si les pages sont longues et riches en balises HTML (c'est souvent le cas lorsque l'on utilise un éditeur wysiwyg : http://fr.wikipedia.org/wiki/Wysiwyg) et que le glossaire contient beaucoup de termes. En revanche, effectuer une recherche sur tout le code HTML peut conduire à la création d'erreurs dans le code HTML si certains attributs ds balises HTML correspondent à des termes du glossaire (voir exemple 1) et certains termes composés de plusieurs mots peuvent ne pas être détectés (voir exemple 2). Le mode de recherche sur le texte évite les problèmes évoqués précédemment mais est très consommateur en ressources machines et plus long à exécuter. En effet, au préalable, le système doit éliminer tout le code HTML et conserver les différents fragments de texte dans un tableau. Donc, au lieu de réaliser tous ces traitements en une seule passe, le système est obligé de répéter la séquence de recherche pour chaque fragment du tableau. Si vous souhaitez utiliser le mode de recherche uniquement sur le texte, il est vivement conseillé d'activer le cache DRUPAL afin d'éviter de refaire le traitement à chaque fois qu'un utilisateur souhaite consulter une page déjà calculée.

Page 15: Guide pour l'installation du glossaire sur un site DRUPAL 6.x

Exemple 1 : génération d'erreur html (cas de la recherche sur le code HTML complet)

Texte HTML original :

« ...le site du <a href="http://www.glossaire.eaufrance.fr">glossaire</a> propose des définitions... »

Le système peut entrainer l'erreur suivante si « glossaire » est un des termes à rechercher :

Texte HTML générer par le glossaire auto :

« ...le site du <a href="http://www.<em>glossaire</em>.eaufrance.fr"><em>glossaire</em></a> propose des définitions... »

Dans ce cas, le système a ajouté des balises <em> (emphase) à l'intérieur de l'attribut « href » du lien. Cela casse au minimum le lien vers la page concernée, et, en fonction du navigateur, cela peut également entrainer des erreurs d'affichage.

Exemple 2 : des termes du glossaire ne sont pas trouvés (cas de la recherche sur le code HTML complet)

Texte HTML original :

« <p>Ceci est un <b>paragraphe</b> contenant des balises de <u>mise</u> en forme</p> »

Dans ce cas si le glossaire auto recherche les termes « paragraphe » et « mise en forme », il trouvera « paragraphe » mais pas « mise en forme » à cause des balises <u>.

Figure 11 : Configuration du glossaire_auto : paramétrage des options de recherche

la sélection du mode d'affichage des mots trouvés : lorsqu'un terme est trouvé, vous avez la possibilité de choisir quel masque appliquer :

- la seule création d'un lien vers la page de description du concept ;

- la seule création d'une infobulle contenant la définition du concept ;

- ou les deux.

Figure 12 : Configuration du glossaire_auto : sélection du masque de remplacement

Page 16: Guide pour l'installation du glossaire sur un site DRUPAL 6.x

la création d'une liste noire de concepts du glossaire à ne pas rechercher : il peut s’avérer utile, dans certains cas, de retirer certains mots de la recherche du glossaire automatique tout en souhaitant conserver le concept dans son glossaire. C'est notamment le cas de certains mots pouvant avoir plusieurs sens (homonymie) ou de sigles pouvant se trouver couramment dans la langue française. Par exemple :

- système d'information (SI) : il peut être intéressant de mettre « SI » dans la liste noire pour éviter de marquer tous les « si » se trouvant dans le texte tout en conservant « système d'information » dans son glossaire ;

- valeur : ce concept possède une définition propre dans le glossaire eaufrance, se rapportant au sens économique du terme, mais le mot « valeur » peut aussi être utilisé dans certaines expressions telles que « la mise en valeur d'un milieu ». Dans ce cas, il est nécessaire de supprimer « valeur » de la base de recherche du glossaire automatique pour éviter un contre sens.

Figure 13 : Configuration du glossaire_auto : utilisation d'une liste de mots à ne pas rechercher

A noter, la présence de trois items, se trouvant au même niveau que l'item de configuration dans le menu. Ils ont un rôle d'aide au débogage et de forçage du cache du glossaire automatique.

Figure 14 : Configuration du glossaire_auto : items de gestion du cache du glossaire auto

3.3.4 Configuration du module « Glossaire eaufrance » et intégration dans un site « eaufrance »

Le module « glossaire eaufrance » permet l’ajout de différents éléments tels que des blocs ou des options de configuration, nécessaires à la bonne intégration graphique du glossaire sur votre site, selon les préconisations de la charte eaufrance.

A son activation, le module « glossaire eaufrance » crée un bloc nommé « A propos du Glossaire Eaufrance » : par défaut, ce bloc est désactivé. Or, pour un site de la toile Eaufrance, ce bloc doit être positionné dans la colonne de droite du site, pour les pages de type « abécédaire » et les pages descriptives de concept.

L’interface d’activation des blocs d’un site DRUPAL est disponible à l’adresse : http://www.monsite.fr/admin/build/block/list, mais l’accès à cette page requière les droits administrateur. La gestion de l’affichage du bloc en fonction des pages du site s’effectue dans la

Page 17: Guide pour l'installation du glossaire sur un site DRUPAL 6.x

section « Paramètres de visibilité spécifiques à la page » du formulaire de configuration du bloc. Il est recommandé la configuration suivante :

cochez l’option « Afficher le bloc seulement sur les pages listées »,

puis, dans la zone de saisie, entrez les trois lignes suivantes : « glossaire », « glossaire/* » et « concept/* »1.

Figure 15 : Configuration des blocs : affichage en fonction des pages

Le module « glossaire eaufrance » permet également d’ajouter des options sur la gestion des liens d’interaction avec site www.glossaire.eaufrance.fr au niveau du formulaire de configuration de la syndication au flux de concept.

Figure 16 : Configuration des liens d'interaction

4. Présentation du type de contenu « Concept SKOS »

Le fonctionnement du package repose sur l’utilisation d’un type de contenu DRUPAL définissant les différentes propriétés des concepts du glossaire Eaufrance selon le standard SKOS.

4.1. Qu’est-ce qu’un « Concept SKOS » ?

SKOS, ou Simple Knowledge Organisation System (Système simple d'organisation des connaissances), est une famille de langages formels permettant une représentation standard des thésaurus, classifications ou de tout autre type de vocabulaire contrôlé et structuré. SKOS est construit sur la base du langage RDF, et son principal objectif est de permettre la publication facile de vocabulaires structurés pour leur utilisation dans le cadre du Web sémantique. SKOS est une recommandation du W3C depuis le 18/08/2009.

Pour aller plus loin sur le SKOS : http://www.w3.org/2004/02/skos/

1 La création des URL de la forme « concept/* » nécessite l’utilisation du module « pathauto » avec la configuration suivante : pour l’item « Modèle de chemin pour les contenus de type Concept SKOS : » ajouter la ligne suivante « concept/[title-raw] »

Page 18: Guide pour l'installation du glossaire sur un site DRUPAL 6.x

Un concept est une représentation générale et abstraite d'un objet. Dans SKOS, un concept permet de designer un mot ou un groupe de mots et son/leur sens (un mot ne permet pas de définir à lui seul un concept à cause du risque d'homonymie). À chaque concept peuvent être attachés comme propriétés RDF :

au maximum un terme préférentiel par langue ; des synonymes, avec spécification possible de la langue ; des définitions et notes, avec spécification possible de la langue ; des concepts par des relations « générique-spécifique », ou par des relations associatives,

comme pour les termes d'un thésaurus.

4.2. Pourquoi un nouveau type de contenu?

DRUPAL, avec l’aide du « module cck », permet de générer de nouveaux types de contenus complètement customisables. Les possibilités offertes par l'utilisation d'un type de contenu spécifique sont très larges. On peut notamment citer :

la gestion des droits d'accès ; le paramétrage de la recherche ; l’utilisation dans les vues DRUPAL ; la gestion du style...

Ceci pour chaque type de contenu et ce sans perturber le fonctionnement initial du site. Par ailleurs, la configuration de base du type de contenu est modifiable par le webmaster, via l’interface d’administration du site.

4.3. Description des champs

Le glossaire eaufrance est conçu pour gérer les différentes propriétés des concepts et leurs relations avec les autres concepts selon le standard SKOS. Le but du package n'est pas de recréer toute cette structuration, mais de fournir aux sites tiers une vue simplifiée des concepts afin de créer leur propre glossaire. Dans cette première version, le glossaire Eaufrance ne gère pas le multilinguisme.

Chaque entrée du glossaire présente les champs suivants :

Libellé : libellé préférentiel du concept (obligatoire) ; Libellé alternatif : synonyme du concept (facultatif) ; Sigle : sigle du concept - exemple : DCE, Sandre, ONEMA (facultatif) ; Définition : définition du concept (obligatoire) ; Illustration : URL des images illustrant le concept (facultatif) ; Source : source de la définition du concept (facultatif) ; Lien : libellé + adresse des concepts associés au concept courant (facultatif) ; Identifiant : adresse de la page ou est décrit le concept sur le site

http://www.glossaire.eaufrance.fr (obligatoire).

5. Intégration du glossaire selon la charte Eaufrance

5.1. Modification du bandeau haut

Pour toutes les pages du site, le lien « glossaire » doit apparaître dans le bandeau haut, dans le coin supérieur droit (à la droite du lien « contact »). Le libellé est en blanc gras (de même style de police que le lien « contact ») et est précédé du pictogramme . Le lien pointe vers la page de l’abécédaire, présentant par défaut la première lettre du glossaire affichant au moins une définition (le plus souvent, la lettre A).

Figure 17 : Exemple du bandeau charté pour le site www.gesteau.eaufrance.fr

Page 19: Guide pour l'installation du glossaire sur un site DRUPAL 6.x

Pour un site développé en DRUPAL, l’adresse URL de cette page est : http://www.monsite.eaufrance.fr/glossaire/A, si au moins une définition existe pour la lettre A.

5.2. Style général de la page abécédaire

Le plugin crée une page générique communément appelée « abécédaire ». Cette page présente la liste des concepts par ordre alphabétique pour la lettre sélectionnée lors du paramétrage. Cette page est accessible en utilisant une adresse URL du type : http://www.monsite.eaufrance.fr/glossaire/A

Ci-après, sont décrits les points qui doivent être respectés :

Figure 18 : Exemple de page abécédaire charté pour le site www.gesteau.eaufrance.fr

Le lien « Glossaire » est présent dans le bandeau haut de toutes les pages du site ;

Le fil d’Ariane est composé de 3 items : le lien vers l’accueil, puis le lien vers la page glossaire abécédaire et la lettre consultée par l’utilisateur ;

Dans le menu de gauche, la rubrique de niveau 1 « Glossaire » apparaît sur fond bleu en première position pour toutes les pages de l’abécédaire. Cette rubrique peut éventuellement apparaître en deuxième position si la rubrique de niveau 1 « Espace perso » est également activée ;

Le titre de niveau 1 de la page est « Glossaire ». Il apparait en police bleu foncé (#3D6098) gras, et est suivi de l’alphabet en majuscule. Pour ce qui concerne l’alphabet :

la lettre de la page active est affichée en gras, de couleur blanche et sur fond bleu foncé ;

les lettres pour lesquelles il existe des concepts sont affichées en gras, de couleur bleu foncé sur fond blanc ;

les lettres pour lesquelles il n’existe pas de concept sont affichées en bleu foncé, sur fond blanc, en gras ;

Page 20: Guide pour l'installation du glossaire sur un site DRUPAL 6.x

chaque lettre correspond à un lien (vers la page de la lettre concernée) qui n’est pas souligné par défaut ; le soulignement apparaît au survol.

Les concepts sont affichés sous forme d’une liste. Pour chaque item :

le libellé est un lien renvoyant vers la page descriptive du concept. Il est affiché en bleu foncé gras et n’est pas souligné (le soulignement n’apparaît qu’au survol avec la souris). Il est suivi du sigle entre parenthèses quand il en existe un ;

10 px plus bas, est affichée la définition du concept ; le texte est justifié ; 10 px plus bas, est affichée la source éventuelle de la définition. Celle-ci est écrite en

caractères plus petits que la définition (font-size : 0.9em) ; sur la ligne suivante, alignés à droite, sont affichés un pictogramme si la définition

possède une illustration, et un lien « En savoir plus » renvoyant vers la page descriptive du concept ;

Figure 19 : Cas d'une définition possédant des illustrations

Les sigles seuls s’affichent de la même manière que les libellés des concepts, dans la liste. Ils sont par contre suivis directement d’un lien faisant un renvoi vers la page descriptive du concept. Ce lien de renvoi est en gris (#aaaaaa), gras, italique et n’est pas souligné ;

Dans la colonne de droite, est affiché un bloc présentant le glossaire eaufrance et son mode de fonctionnement. Le texte de ce bloc est le suivant :

A propos du Glossaire Eaufrance

Techniciens, ingénieurs, scientifiques, services de l'état, élus, ... de nombreux acteurs produisent et diffusent des informations relatives à l'eau et aux milieux aquatiques, utilisant des termes spécifiques. Pour faciliter l'échange, améliorer la compréhension des termes et créer un langage commun pédagogique, un glossaire a été établi par les partenaires du système d'information sur l'eau (SIE). Son contenu complet est accessible sur le site Glossaire, mais vous trouverez ici une extraction, correspondant aux termes utilisés dans le site Gest'eau.

Le glossaire est collaboratif : vous pouvez proposer de modifier ou supprimer certains termes, d'en ajouter d'autres. Les propositions seront évaluées par un groupe d'utilisateurs, partenaires du SIE. N'hésitez pas à devenir contributeur, faites vivre le glossaire.

En cas d’utilisation du mode de recherche automatique des concepts du glossaire (module « glossaire_auto »), les mots détectés doivent apparaître en gras, souligné par des pointillés (utiliser la propriété CSS, border-bottom : 1px dashed #AAAAAA).

Page 21: Guide pour l'installation du glossaire sur un site DRUPAL 6.x

5.3. Style général de la page descriptive d’un concept

La page descriptive d’un concept est accessible en utilisant une adresse URL du type : http://www.monsite.eaufrance.fr/glossaire/A/concept

Ci-après, sont décrits les points qui doivent être respectés :

Figure 20 : Exemple d'une page de concept charté pour le site GESTEAU

Le lien « Glossaire » est présent dans le bandeau haut de toutes les pages du site ;

Le fil d’Ariane est composé de 4 items : le lien vers l’accueil, puis le lien vers la page glossaire abécédaire, le lien vers la lettre concernée et le libellé du concept ;

Dans la rubrique de gauche, la rubrique de niveau 1 « Glossaire » apparaît sur fond bleu en première position pour toutes les pages descriptives de concept. Cette rubrique peut éventuellement apparaître en deuxième position si la rubrique de niveau 1 « espace perso » est également activée ;

Le titre de niveau 1 de la page est le libellé du concept, suivi du sigle entre parenthèses quand il en existe un. Il apparait en police bleu foncé (#3D6098), gras. La partie centrale de la page permet d’afficher les champs du concept : l’ordre et l’affichage de ces champs sont ceux définis par le squelette par défaut ;

Dans la colonne de droite, est affiché un bloc présentant le glossaire eaufrance et son mode de fonctionnement. Le texte de ce bloc est le suivant :

A propos du Glossaire Eaufrance

Techniciens, ingénieurs, scientifiques, services de l'état, élus, ... de nombreux acteurs produisent et diffusent des informations relatives à l'eau et aux milieux aquatiques, utilisant des termes spécifiques. Pour faciliter l'échange, améliorer la compréhension des termes et créer un langage commun pédagogique, un glossaire a été établi par les partenaires du système d'information sur l'eau (SIE). Son contenu complet est accessible sur le site Glossaire, mais vous trouverez ici une extraction, correspondant aux termes utilisés dans le site Gest'eau.

Page 22: Guide pour l'installation du glossaire sur un site DRUPAL 6.x

Le glossaire est collaboratif : vous pouvez proposer de modifier ou supprimer certains termes, d'en ajouter d'autres. Les propositions seront évaluées par un groupe d'utilisateurs, partenaires du SIE. N'hésitez pas à devenir contributeur, faites vivre le glossaire.

6. Informations supplémentaires pour les développeurs

Dans cette version, le module de recherche automatique des concepts du glossaire (module « glossaire_auto ») ne fonctionne que sur les pages présentant le contenu (« content ») d’un nœud. Par conséquent, cette fonctionnalité ne s’applique pas aux différents blocs, vues (module « views »), livres (module « book ») ou autres formes de contenu créés par les modules génériques DRUPAL. Vous pouvez toutefois forcer l’appel de ce traitement en appliquant, au niveau des modules DRUPAL ou des templates, la fonction: glossaire_auto_search_glossaire_arg($argument) où « $argument » est un tableau pouvant contenir les variables suivantes :

txt : chaines de caractères (pouvant contenir du code HTML) dans lesquelles sont recherchés les mots du glossaire ;

nid : identifiant du nœud (ou tableau d'identifiant) ; les identifiants correspondant seront éliminés du glossaire pour la recherche automatique ;

cid : identifiant du cache. La bonne pratique est de suivre le pattern suivant : « ‘glossaire_auto_'.$objet.'_'$field.'_'.$nid » (: « glossaire_auto_node_body_333 », par exemple)

last_update : timestamp de la dernière mise à jour du concept.

Page 23: Guide pour l'installation du glossaire sur un site DRUPAL 6.x

GLOSSAIRE

Terme : Mot, groupe de mots, expression.

Concept : Représentation générale et potentiellement abstraite d'un objet. Par exemple, dans SKOS,un concept permet de designer à la fois un terme et son sens (le libellé ne permet pas de définir à lui seul un concept à cause du risque d'homonymie).

Mot : Son, groupe de sons ou de lettres formant une unité de sens.

Nœud : Elément central du modèle de contenu employé par DRUPALl. Dans sa version la plus simple, un nœud est un objet générique composé d’un titre et d’un contenu de type texte. Toute la puissance de DRUPAL réside dans la possibilité de spécialiser un nœud en lui adjoignant des champs supplémentaires. C’est ainsi que l’on va créer ce que l’on appelle un nouveau type de contenu. Ainsi, chaque élément de contenu présent dans un site DRUPAL est un nœud et chaque nœud appartient à un type de contenu. La distribution de base utilise deux types de contenu (article et page) : ce sont des types de contenu génériques qui conviennent à de nombreuses situations. Cependant, en cas de besoin d'autres types de contenu ; DRUPAL permet de les créer soit par l'intermédiaire de modules optionnels, soit par l’utilisation d’un module indispensable appelé CCK. Pour différencier un type de contenu, il est possible d’associer de nouveaux champs. Grâce à ces modules, DRUPAL dispose d’une multitude de champs qui permettent de stocker des éléments de contenu extrêmement variés : texte, chiffre, date, url, numéro de téléphone, image, vidéo, carte.

Exemple : pour un site web d’actualités, vous considérez que le contenu de type Article n’est pas suffisamment structuré, vous pouvez alors créer un nouveau type de contenu « Article_Journal » et lui adjoindre un sous-titre (champs texte) et une image principale (champ image). Source : http://drupalfr.org/node/4679#noeud

Syndication de contenu web : Forme de syndication dans laquelle une partie d'un site est accessible depuis d'autres sites. Cela est possible en y ajoutant une licence accordée à ses utilisateurs. Bien souvent, la syndication consiste à mettre à disposition un flux RSS avec l’en-tête du contenu récemment ajouté au site web (par exemple, la dernière news ou le dernier post du forum). Source : http://fr.wikipedia.org/wiki/Syndication_de_contenu

Page 24: Guide pour l'installation du glossaire sur un site DRUPAL 6.x

SIGLES & ABREVIATIONS

API : Application Programming Interface

HTML : Hypertext Markup Language

RDF : Resource Description Framework

RSS : Really Simple Syndication

SIE : Système d’Information sur l’Eau

SKOS : Simple Knowledge Organisation System

W3C : World Wide Web Consortium

Page 25: Guide pour l'installation du glossaire sur un site DRUPAL 6.x

TABLE DES ILLUSTRATIONS

Figure 1 : Page d’accueil du site www.glossaire.eaufrance.fr ................................................................. 5 Figure 2 : Capture d'écran de la page "glossaire" ................................................................................... 6 Figure 3 : Capture d'écran de la page de configuration des flux de syndication .................................... 6 Figure 4 : Exemple de fonctionnement du glossaire automatique .......................................................... 6 Figure 5 : Page de téléchargement du package glossaire ...................................................................... 8 Figure 6 : Page d'activation des modules Drupal .................................................................................... 9 Figure 7 : Interface Drupal de l'attribution des droits ............................................................................. 10 Figure 8 : Interface de configuration des flux de syndication ................................................................ 11 Figure 9 : Formulaire de configuration d'un flux de syndication ............................................................ 11 Figure 10 : Configuration du glossaire_auto : sélection des types de contenu ..................................... 14 Figure 11 : Configuration du glossaire_auto : paramétrage des options de recherche ........................ 15 Figure 12 : Configuration du glossaire_auto : sélection du masque de remplacement ........................ 15 Figure 13 : Configuration du glossaire_auto : utilisation d'une liste de mots à ne pas rechercher ....... 16 Figure 14 : Configuration du glossaire_auto : items de gestion du cache du glossaire auto ................ 16 Figure 15 : Configuration des blocs : affichage en fonction des pages ................................................ 17 Figure 16 : Configuration des liens d'interaction ................................................................................... 17 Figure 17 : Exemple du bandeau charté pour le site www.gesteau.eaufrance.fr ................................. 18 Figure 18 : Exemple de page abécédaire charté pour le site www.gesteau.eaufrance.fr .................... 19 Figure 19 : Cas d'une définition possédant des illustrations ................................................................. 20 Figure 20 : Exemple d'une page de concept charté pour le site GESTEAU ......................................... 21

LISTE DES TABLEAUX

Tableau 1 : Table d'attribution préférentielle des droits utilisateur ........................................................ 10 Tableau 2 : Exemples de résultat en fonction du mode de recherche sur un texte de référence ......... 13