ugent datacenter of waarom we 140tb kopen
DESCRIPTION
VLENGEL meetingTRANSCRIPT
UGent Datacenterof waarom we 140TB kopen...
300.000 volumes...
140.000 volumes...
70.000 objects...
12.500 full-text documenten
Storage requirements
Storage requirements
Ideaal Model
Ideaal Model
Observaties
Ideaal Model
Observaties Ruwe Data
Ideaal Model
Observaties Ruwe Data
Hypothese
Ideaal Model
Observaties Ruwe Data
Hypothese
Test
Ideaal Model
Observaties Ruwe Data
Hypothese
Test
Ideaal Model
Observaties Ruwe Data
Hypothese
Test
Paper
Annex
Ideaal Model
Observaties Ruwe Data
Hypothese
Test
Paper
AnnexBibliotheek
Ideaal Model
Observaties Ruwe Data
Hypothese
Test
Paper
AnnexBibliotheek
Ideaal Model
Observaties
Hypothese
Paper
Ruwe DataTest
AnnexBibliotheek
Praktijk
Observaties
Hypothese
Paper
Ruwe DataTest
AnnexBibliotheek
Praktijk
Observaties
Hypothese
PaperBibliotheek
Praktijk
Karen Van Godtsenhoven, Mikael Karstensen Elbæk, Gert Schmeltz Pedersen, Barbara Sierman, Magchiel Bijsterbosch, Patrick Hochstenbach, Rosemary Russell, Maurice Vanderfeesten
Emerging standards for enhanced publications and repository technology : survey on technology
Amsterdam University Press 2009 ISBN 9789089641892
(Meta)datastandaarden voor digitale archieven
UGent MMLab & Universiteitsbibliotheek Gent 2009 ISBN 9789052230009
Paul Bastijns, Sam Coppens, Siska Corneillie, Patrick Hochstenbach, Erik Mannens, Liesbeth Van Melle
Institutional Repository
• 150.530 bibliografische beschrijvingen
• 12.413 flagged full-text available
• 50 bestandtypes
• 94.3% .PDF , 2.7% .DOC
• 3% .ZIP .JPG .TEX + 46 others
• 1-2 bestanden per beschrijving
ETD’s
• 6.336 bibliografische beschrijvingen
• 1.370 flagged full-text available
• 1.180 bestandtypes
• PDF , DOC, TXT, XLS, ACC, TIF, JPG, EXE, CLASS,...
• 1 - 10.000 bestanden per beschrijving
Bit$Errors/Bugs$File$Formaat$Wijzigingen$
Tijd$
Technologie$Shi:$
Organisatorische$wijzigingen$
Formaat$Interpreta?es$
1980% 1990% 2000%
Risico’s
Repository
Lib Catalog
Aleph
Archive System
?ICA-Atom?
Discovery
Meercat
Preservation
Waalse K
rook
IngestWorkflow
???
IR
Biblio
LMS
Minerva
Scanning
Digital LibrarySources LTP
Catmandu [Gent|Lund|Bielefeld Perl Framework]
FedoraCommons
SOLR ActiveMQ
NetAppAmazon.com
S3
GREP
• Sinds Mei 2010 operationeel
• ~ 200.000 objecten
• ~ 50.000.000 bestanden
• 1.200 bestandtypes
• Kleinste object: 10 KB
• Grootste object: 250GB
• 8.3 TB in ingested
• 2.0 TB in queue + ( >> TB Google Books)
• 100.000 paginaviews per jaar (via Meercat)
Demo
Ingest
Automatic Aleph Import
Access
OAI-PMHSPARQL
RESTSOAP