datubaze.files.wordpress.com€¦ · web viewdatu bāzes shēmu integrēšana. piemērs. trīs...
TRANSCRIPT
1
Datu bāzes shēmu integrēšanaPiemērs. Trīs tipa organizāciju sadarbība
1. Kas ir vienāds (vienādi nosaukumi).2. Kas ir vienāds (dažādi nosaukumi).3. Kas ir līdzīgs (vienādi nosaukumi).4. Kas ir līdzīgs (dažādi nosaukumi).
Dublikātu novēršana.Apvienošana.Papildus struktūru un saišu ieviešana.
Izmantotāji Izstrādātāji Ražotāji
Nodaļas Grupas Cehi
DarbiniekiStrādnieki InženieriProjektētāji
KonstruktoriProjekti
Projekti
Izstrādnes
Darbi
Specifikācijas
PasūtījumiPasūtījumi
Prasības
Tehniskie noteikumi
Etapi
Darba posmi
Pārbaudes
Testi
Biroji
Vēlmes
LīgumiLīgumi
Organizācijas
Izmantotāji Izstrādātāji Ražotāji
2
Globālā shēma
Darbinieki
Darbinieki Projektētāji Konstruktori Strādnieki Inženieri
Izpildāmie uzdevumi
Projekti Projekti Izstrādnes
Prasības
Specifikācijas Vēlmes Prasības Tehniskie noteikumi
Etapi
Etapi Darbi
Apakšetapi
Darba posmi
Pārbaudes
Testi Pārbaudes
Pasūtījumi Pasūtījumi Līgumi
Apakšvienības
Nodaļas Biroji Grupas Cehi
Pasūtījumi Līgumi
Darbinieki
Projekti
3
Datu konceptu attiecības
1. Ekvivalenti koncepti
2. Iekļaušana plašākā
Darbinieki
Projekti (saistīti ar nodaļu)
Nodaļa
Grāmata (virsraksts)
Grāmata (virsraksts,
gads)
Izdevējs
Darbinieki
Projekti
4
3. Nesaderīgi koncepti
1 N N M
Darbinieki
Projekti
5
Datu bāzes shēmu integrācijas stratēģijas
1. Stratēģija visas shēmas vienā
2. Stratēģija – līmeņu lietošana
6
Konfliktu analīze - nosaukumi
1. Sinonīmi (dažādi nosaukumi).
2. Homonīmi (vienāds nosaukums dažādām lietām).
Konfliktu analīze – struktūras
1. Identiski koncepti (var apvienot).
2. Saderīgi koncepti (var tikt salāgoti kopā).
3. Nesavienojami koncepti:
- dažādas kardinalitātes;
- dažādi identifikatori;
- pretēji saišu tipi (1:n n:1).
7
Shēmu integrācijas piemērs
8
9
Shēmu mezglu punkti (elementi)
1. Vispārīgs (general) mezgla punkts (tam ir nosaukums).2. Lapu elements (tam ir vērtība).3. Atribūta elements (tam arī ir vērtība).4. Bērna elements.5. Vecāku elements.6. Struktūru paskaidrojošais elements (compositor node):
a) izvēle (choice) („ | „);b) virkne (sequence) („ , „);c) visi (all) („ & „);d) sastopamība (occurence).
Līdzīgi kā XML struktūrās.
10
Sinonīmi
firma, organizācija, uzņēmums, iestāde
apakšfirma, meitas firma
nodaļa, departaments, sektors, iecirknis
darbinieks, strādājošais, ierēdnis, kalpotājs
grāmatvedis, uzskaitvedis, rēķinvedis
projektētājs, dizaineris, konstruktors, plānotājs
izpildītājs, strādnieks, inženieris, darītājs, veicējs
karkass, korpuss
bloks, modulis
elements, detaļa, daļa
11
Semantiskā datu integrēšana (ontoloģijas izmantošana)
No 2010. gada daži darbi datu integrācijas pētījumos attiecas uz semantisko integrācijas problēmu. Šī problēma nav integrācijas struktūras strukturēšana, bet kā atrisināt semantiskos konfliktus starp neviendabīgiem datu avotiem.Kopīga stratēģija šādu problēmu risināšanai ietver ontoloģijas izmantošanu, kas skaidri definē shēmas terminus un tādējādi palīdz atrisināt semantiskos konfliktus.
Datu integrācija ar ontoloģiju, ietver ontoloģijas (-u) izmantošanu, lai efektīvi apvienotu datus vai informāciju no vairākiem neviendabīgiem avotiem. Tā ir viena no daudzajām datu integrācijas pieejām, un to var klasificēt kā globālo – kā - skatu (GAV). Ontoloģijas datu integrācijas efektivitāte ir cieši saistīta ar integrācijas procesā izmantotās ontoloģijas konsekvenci un ekspresiju.
12
Datu neviendabība
Datus no vairākiem avotiem raksturo vairāki neviendabīguma veidi: 1) sintaktisks neviendabīgums: ir atšķirību rezultāts datu attēlojuma formātā;2) shematisks vai strukturāls neviendabīgums: vietējais modelis vai struktūra datu glabāšanai atšķiras datu avotos, kas izraisa strukturālu neviendabīgumu; 3) semantiskais neviendabīgums: atšķirības datu “līdzekļa” interpretācijā ir semantisko neviendabīguma avots;4) sistēmas neviendabīgums: dažādu operētājsistēmu izmantošana, aparatūras platformas izraisa sistēmas neviendabīgumu.
13
Datu avota semantiska shēmaVispārinājumu un sastāvdaļu norādīšana
Firma
Apakšfirma
Izejmateriālu ražošana
Detaļu ražošana
Iekārtu ražošana
Darbinieks
Nodaļa
Sastāvdaļa
Vispārinājums
Iekārta
Materiāls
Sastāvdaļa
Sastāvdaļa
Vispārinājums
Vispārinājums
Sastāvdaļa
Vispārinājums
Grāmatvedis
Projektētājs
Izpildītājs
Karkass
Bloks
ElementsMetāls PlastmasaKoks
Vispārinājums
14
Shēmu elementu semantiskās attiecības1. Sinonīms (sinonīmu kopa (synset)) - pēc nozīmes līdzīgs vai vienāds.
2. Holonīms (holonym) – plašāks apzīmējums, kuram dotais vārds ir daļa (daļa veselais, agregāts (var būt veselais bez daļām), kompozīcija (veselais un daļas)).
3. Hipernīms (hypernym) – vispārīgāks vārds dotajam vārdam (klase – apakšklase, vispārinājums.)
Lietvārds (noun): - hypernyms: Y is a hypernym of X, if every X is a kind of Y (abinieks ir vardes hipernīms).- hyponyms: Y is a hyponym of X, if every Y is a kind of X (varde ir abinieka hiponīms).- coordinate terms: Y is a coordinate term of X, if X and Y share a hypernym (vilks ir suņa koordinējošs termins un otrādi).- daļa (meronym): Y is a meronym of X, if Y is a part of X (logs ir mājas daļa).- holonym: Y is a holonym of X, if X is a part of Y (māja ir loga holonīms).
Darbības vārds (verb): - hypernym: the verb Y is a hypernym of the verb X if the activity X is a kind of Y (uztvert ir klausīties hipernīms)- troponym: the verb Y is a troponym of the verb X, if the activity Y is doing X in some manner (šļupstēšana ir runāšanas troponīms).- izsecināšana (entailment): the verb Y is entailed by X, if by doing X you must be doing Y (gulēt var izsecināt ja krāc).- coordinate terms: those verbs sharing a common hypernym (šļupstēt un brēkt).
15
Shēmas elementu semantiskās attiecības (turpinājums)
Semantisko attiecību tipi:1) identitāte (identical);2) ekvivalence (equivalent);3) saderība (compatible);4) nesaderība (incompatible).
XML shēmu elementu semantisko attiecību tipi:1) identitāte (identical);2) vienādība (equal);3) ekvivalence (equivalent);4) apakskopa (subset);5) unikalitāte (unique);6) nesaderība (incompatible).
Let S be the set of all nodes across schema(s). Let x, y be nodes in S. We first define the structure of a node x. Structure of a node x is defined as a 4-tuple:
<nodetype, attribute, datatype, childList>,
x.structure = y.structure iff (x.nodetype = y.nodetype) ∧ (x.attribute = y.attribute) ∧ (x.datatype = y.datatype) ∧ (x.childList = y.childList).
16
Semantisko attiecību definējumi
x.identical(y) iff Two elements with the same name and namespace must be the same element.
x.equal(y) iff (x.name = y.name) ∧ (x.structure = y.structure) ∧ (x.namespace ≠ y.namespace). Elements that have the same name and structure but different namespaces are equal.
x.equivalent(y) iff (x.name ≠ y.name) ∧ (x.structure = y.structure) ∧ (x.namespace ≠ y.namespace). Elements that have different names and namespaces but the same structure.
x.subset(y) iff (x.name = y.name) ∧ (x.namespace ≠ y.namespace) ∧ (x.childList ⊆ y.childList) ∧ (y.nodetype = ‘all’ ∨ y.nodetype = ‘choice’). Elements with the same name, different namespaces, a condition that the children of one element exist as a direct child list of the second element that is defined in terms of an all or choice satisfy the subset semantic relationship.
x.incompatible(y) iff (x.name = y.name) ∧ (x.namespace ≠ y.namespace) ∧ (x.structure ≠ y.structure) ∧ ¬x.subset(y). Elements with the same name, differe the subset semantic relationship are seen as incompatible.
unique(x) iff ∀ y ∈ (S-x), (x.name ≠ y.name) ∧ (x.structure ≠ y.structure) ∧ (x.namespace ≠ y.namespace). Elements that have different names and namespaces are considered to be unique.
17
18
Altova Mapforce, Stylus Studio, MS mapping composer1
Clio (semi-automatic schema integration)2
1 http://www.edbt.org/Proceedings/2013-Genova/papers/edbt/a81-cate.pdf2 http://www.vldb.org/conf/2007/papers/demo/p1326-chiticariu.pdf
19