une introduction - université de sherbrooke

20
Christina KHNAISSER et Luc LAVOIE Département d’informatique Faculté des sciences [email protected] [email protected] http://info.usherbrooke.ca/llavoie Une introduction 2016-10-15 B ASES DE DONNÉES E NTREPÔTS DE DONNÉES BD300 v100b

Upload: others

Post on 11-Apr-2022

7 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Une introduction - Université de Sherbrooke

ChristinaKHNAISSER etLucLAVOIEDépartementd’informatiqueFacultédessciences

[email protected]@usherbrooke.cahttp://info.usherbrooke.ca/llavoie

Uneintroduction

2016-10-15

BASES DE DONNÉESENTREPÔTS DE DONNÉES

BD300v100b

Page 2: Une introduction - Université de Sherbrooke

Départem

entd’informatique,Facultédessciences,U

niversitédeSherbrooke,Québec

2016-10-15

2

BD301:E

ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie

PLAN

¢Problématique

¢Leconceptd’entrepôtdedonnées

¢Lesarchitectures

¢Lesmodèlesdeschéma

¢Lesvisions

¢Laquestiondutemps

¢Laquestiondesorigines

¢Unevisionévolutiveetlarenormalisation

¢Quelquesquestionsouvertes

Page 3: Une introduction - Université de Sherbrooke

Départem

entd’informatique,Facultédessciences,U

niversitédeSherbrooke,Québec

2016-10-15BD301:E

ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie

3

PROBLÉMATIQUE

¢UneBDc’estbien,deuxc’estmieux, troisc’esttrop?� del’ordinateurcentral

� enpassantparl’architectureclient-serveur,

� ledépôtdépartementalet

� lesBDpersonnelles

� onarriveauchaos!

¢Nécessitéd’avoiruneimagecomplètecohérente� Commentgérerlamultiplicité?

� Commentunifierl’hétérogénéité?

Page 4: Une introduction - Université de Sherbrooke

Départem

entd’informatique,Facultédessciences,U

niversitédeSherbrooke,Québec

2016-10-15

4

BD301:E

ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie

PROBLÉMATIQUEEXPLOITATION ET ANALYSE,DES BESOINS DIFFÉRENTS ?

Page 5: Une introduction - Université de Sherbrooke

Départem

entd’informatique,Facultédessciences,U

niversitédeSherbrooke,Québec

2016-10-15

5

BD301:E

ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie

PROBLÉMATIQUECOMMENT RETROUVER CECI

SGBD

Schémalogique

IPMlogique

IPMconceptuelle

SE

Schéma physique n

BD n

Analyste informatique

Analyste métier

Administrateur de BD

Utilisateurs

Schéma Conceptuel

BD 1

Schéma physique 1

Page 6: Une introduction - Université de Sherbrooke

Départem

entd’informatique,Facultédessciences,U

niversitédeSherbrooke,Québec

2016-10-15BD301:E

ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie

6

ENTREPÔT DE DONNÉES

¢Comment« fédérer »les« visions »?� Agrégationdes« faits »

¢ parlesprocessus« producteurs »dedonnées,

¢ doncselonl’axedutemps.

� Documentationdes« dimensions »¢ parlesentitésliées.

� Découpagedessourcesparproducteur.

� Liaisondessourcesparentité.

Page 7: Une introduction - Université de Sherbrooke

Départem

entd’informatique,Facultédessciences,U

niversitédeSherbrooke,Québec

2016-10-15BD301:E

ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie

7

ENTREPÔT DE DONNÉESARCHITECTURES

¢DataMart (DM)� lapratiqueoriginale« adhoc »

¢ InformationFactory (IF)� lapropositionoriginaledeInmon

¢DataWarehouse (DW)� lapropositionsubséquentedeKimball

Page 8: Une introduction - Université de Sherbrooke

Départem

entd’informatique,Facultédessciences,U

niversitédeSherbrooke,Québec

2016-10-15BD301:E

ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie

8

ENTREPÔTS DE DONNÉESMODÈLES DE SCHÉMA CLASSIQUES

¢Cube� décompositionparentitésindépendantes

� structurationorthogonale

¢Étoile� décompositionparentitésindépendantes

� structurationparprocessusproducteur

¢Flocon� décompositionparentitésindépendantes

� hiérarchisationdesentités

� structurationparprocessusproducteur

Page 9: Une introduction - Université de Sherbrooke

Départem

entd’informatique,Facultédessciences,U

niversitédeSherbrooke,Québec

2016-10-15BD301:E

ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie

9

ENTREPÔTS DE DONNÉESVISIONS¢Visionclassique

� temporellementestampillée� incrémentalepure� optimisationparladénormalisation

¢ quellenormalisation?¢ quelleoptimisation?

¢Visioncontemporaine� résolumentbitemporelle� nepeutêtreseulementincrémentale� optimisationparlanormalisation

¢ quelleméthoded’accès?¢ quellegestionmémoire?

Page 10: Une introduction - Université de Sherbrooke

Départem

entd’informatique,Facultédessciences,U

niversitédeSherbrooke,Québec

2016-10-15

10

BD301:E

ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie

PROBLÉMATIQUECOMMENT RETROUVER CECI

SGBD

Schémalogique

IPMlogique

IPMconceptuelle

SE

Schéma physique n

BD n

Analyste informatique

Analyste métier

Administrateur de BD

Utilisateurs

Schéma Conceptuel

BD 1

Schéma physique 1

Page 11: Une introduction - Université de Sherbrooke

Départem

entd’informatique,Facultédessciences,U

niversitédeSherbrooke,Québec

2016-10-15

11

BD301:E

ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie

LA QUESTION DU TEMPS

Page 12: Une introduction - Université de Sherbrooke

Départem

entd’informatique,Facultédessciences,U

niversitédeSherbrooke,Québec

2016-10-15BD301:E

ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie

12

LA MESURE DU TEMPS

¢VoirManthey

Page 13: Une introduction - Université de Sherbrooke

Départem

entd’informatique,Facultédessciences,U

niversitédeSherbrooke,Québec

2016-10-15BD301:E

ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie

13

TEMPS ET CALENDRIER

¢VoirManthey

Page 14: Une introduction - Université de Sherbrooke

Départem

entd’informatique,Facultédessciences,U

niversitédeSherbrooke,Québec

2016-10-15BD301:E

ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie

14

RELATIVITÉ DU TEMPS

¢VoirManthey

Page 15: Une introduction - Université de Sherbrooke

Départem

entd’informatique,Facultédessciences,U

niversitédeSherbrooke,Québec

2016-10-15BD301:E

ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie

15

UN MODÈLE

Modèle'discret'du'temps

Perception'du'temps'(continue)

Instant PériodeAlfa Oméga

;'∞ +'∞

Durée

Modèlesimplediscret(chronon)fini(alpha,omega)intervallesopérateursdeAllen

Page 16: Une introduction - Université de Sherbrooke

Départem

entd’informatique,Facultédessciences,U

niversitédeSherbrooke,Québec

2016-10-15

16

BD301:E

ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie

OPÉRATEURS DE ALLEN

Opération gauche droite résultat Description Définition[b:e] Allenintervalle(b,e) point point intervalle {x∊ T|b≤x≤e} [p-:p+)

début intervalle point p.b p-

fin intervalle point p.e p+

prédécesseur point point p.b-1 ?

successeur point point p.e+1 ?

dénombrement intervalle entier nombred'éléments ?

alpha Typepoint point LapluspetitevaleurdutypeT first

oméga Typepoint point LaplusgrandevaleurdutypeT last

appartenance point intervalle booléen x∊ p x∊ p

appartenance-1 intervalle point booléen p∍ x ?

antérioritéstricte intervalle intervalle booléenp : |---|ooooooq : oooooo|---| p.e+1<q.b before

adjacenceantérieure intervalle intervalle booléenp : o|---|oooooq : oooooo|---| p.e+1=q.b meets

chevauchementantérieurstrict intervalle intervalle booléenp : oo|---|ooooq : ooooo|---|o p.b<q.b∧ p.e≥q.b∧ p.e<q.e overlaps

commencementstrict intervalle intervalle booléenp : ooo|--|ooooq : ooo|---|ooo q.b=p.b∧ p.e<q.e starts

inclusionbi-stricte intervalle intervalle booléenp : oooo|-|ooooq : ooo|---|ooo q.b<p.b∧ p.e<q.e during

achèvementstrict intervalle intervalle booléenp : oooo|--|oooq : ooo|---|ooo q.b<p.b∧ p.e=q.e finishes

égalité intervalle intervalle booléenp : ooo|---|oooq : ooo|---|ooo q.b=p.b∧ p.e=q.e equals

Page 17: Une introduction - Université de Sherbrooke

Départem

entd’informatique,Facultédessciences,U

niversitédeSherbrooke,Québec

2016-10-15BD301:E

ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie

17

LA COORDINATION ET LA QUESTION DES ORIGINES

¢VoirManthey

Page 18: Une introduction - Université de Sherbrooke

Départem

entd’informatique,Facultédessciences,U

niversitédeSherbrooke,Québec

2016-10-15BD301:E

ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie

18

QUELQUES QUESTIONS OUVERTES

¢Traitementdel’incertitudedesmesures� margesd’erreur

¢Traitementdel’incertitudedesfaits� mondeouvertvsmondefermé

¢L’alimentation:ETLouELT� origine:ELT

� règledepratique:ETL

� retouràlaraison:ELT

Page 19: Une introduction - Université de Sherbrooke

Départem

entd’informatique,Facultédessciences,U

niversitédeSherbrooke,Québec

2016-10-15BD301:E

ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie

19

VISION ÉVOLUTIVE

¢ Incontournableévolutivité

¢ Inadéquationdelavisionincrémentalepure� temporalisation

� correction

� harmonisation

¢L’entrepôtdedonnées,unebasededonnéescommelesautres?

Page 20: Une introduction - Université de Sherbrooke

Départem

entd’informatique,Facultédessciences,U

niversitédeSherbrooke,Québec

2016-10-15

20

BD301:E

ntrepôtsdedonnées-uneintroduction(v100b)—LucLavoie

PRINCIPALES RÉFÉRENCES

¢ ADAMSON,C. 2010.Thecomplete reference starschema.McGraw-Hill,NewYork,NY,USA.

¢ ADAMSON,C. 2008-2015.http://blog.oaktonsoftware.com

¢ INMON,W.H. 2005.Buildingthedatawarehouse.JohnWiley,Indianapolis,IN,USA.

¢ JIANG,B.2015.Constructing DataWharehouses with Metadriven Generic Operators,andmore.2nded.,Createspace.

¢ KIMBALL,R. 2013.Thedatawarehouse toolkit:thedefinitive guidetodimensional modeling.JohnWiley,Indianapolis,IN,USA.

¢ MANTHEY,R.2015.http://www.iai.uni-bonn.de/III/lehre/vorlesungen/TemporalIS/SS15/