DSpace -Eine Einführung
IT-Zertifikat :Dedizirte Systeme
Milena Kujawa
Gliederung
In heutiger Sitzung:
Was ist DSpace? Geschichte von DSpace Techniche Grundlagen Architektur Datenmodell Rechtevergabe
Was ist DSpace?
Open Source Software für einen Dokumentenserver
DSpace is a platform that allows you to capture items in any format – in text, video, audio, and data. It distributes it over the web. It indexes your work, so users can search and retrieve your items. It preserves your digital work over the long term.
Was ist DSpace?
DSpace wird meist in Universitäten, Bibliotheken und Forschungseinrichtungen für ein "Institutional Repository" eingesetzt.
Es ermöglicht vor allem drei Hauptaufgaben:
Erfassung Weiterverbreitung Langzeitarchivierung von digitalen Ressourcen
What can DSpace be used for?
DSpace unterstützt eine Vielzahl von digitalen Objekten beliebigen Formats.
Einsetzbar für: Journal papers Data sets Electronic theses Reports Conference posters Videos Images
Was kann DSpace?
Zu jedem Dokument deskriptive, administrative und strukturelle Metainformationen
Metadatenformat (Standard) Qualified Dublin Core und diverse weitere (METS/MODS)
Benutzerverwaltung mit Nutzern und Gruppen Nutzer können sich selbst registrieren integriertes System zur Authentifizierung und
Authorisierung Persistent Identifier BSD-Lizenz
Geschichte von DSpace
Der Beginn: 2000Gemeinschaftsentwicklung von Massachusetts Institute of Technology (MIT) und den HP Labs
Software Versionen: Version 1.0 – 8th November 2002 Version 1.1 - 8th May 2003 Version 1.2 – 13th August 2004 Version 1.3 – 3rd August 2005 Version 1.4 – 26th July 2006 Version 1.5 – 25th March 2008
Dspace Foundation
DSpace Federation entstand 2007 als non-profit organization zur Unterstützung der immer wachsender Gemeinde der DSpace Benutzer.
koordiniert das gemeinschaftliche Entwicklungsmodell und damit die Herausgabe neuer Versionen
DSpace Foundation
eine Gruppe von Kernentwicklern Feedback aus Anwenderkreisen erwünscht Austausch über Newsgroups, Wiki,
Anwendertreffen Plattform: Sourceforge-Projekt
Technische Grundlagen
- Unix Betriebssystem (empfohlen, Windows-Server möglich)- in Java und JavaServer Pages (JSP) geschrieben- verwendet eine relationale Datenbank (PostgreSQL, Oracle)- Apache Tomcat- Apache Lucene als Index-/ Suchmaschine- OAI-PMH-Schnittstelle- unterstützte Metadatenformate:
DC, QDC, METS, MODS, MPEG21-DIDL, XEpicur- Persistent Identifier: CNRI Handle oder URN- sessionbasierte Statistik durch integriertes Logsystem- Vollständige Benutzerverwaltung mit Nutzern und Gruppenein System zur Authentifizierung und Authorisierung enthalten
Persistent Identifier
• Eindeutige, dauerhafte, ortsunabhängige Bezeichner (Identifikator) für eine Ressource bzw. digitale Inhalte
• Ähnlich DNS (Domain Name System), also Verfahren zur Auflösung von Namensräumen
• z.B. URN (Uniform Resource Name)
Persistent Identifier
• Können nicht direkt aufgerufen werden, sondern müssen in URLs übersetzt werden
• Handle-System: System zur Vergabe und Verwaltung von Identifikatoren und ist so eine abstrakte Referenz, die nicht direkt mit dem wirklich zugeteilten Speicher in Verbindung steht
• Digital Object Identifier (DOI) baut auf Handle-System auf und wird vor allem für Online-Artikel von wissenschaftlichen Fachzeitschriften verwendet
Architektur
DSpace System besteht aus drei Schichten:
http://www.dspace.org/1_5_1Documentation/image/architecture-600x450.gif
Storage Layer
Storage Layer: Speicherungphysikaliche Datenspeicherung (Content und Metadaten)
Business Logic Layer
Geschäftslogistik Verwaltung von Benutzer(gruppen), Rechtevergabe, Content, Workflow
Application Layer
Anwendungsschicht die Komponenten, mit denen eine DSpace-Instanz mit der Außenwelt kommuniziert, z. B. Webinterface, OAI-PMH-Schnittstelle
The DSpace Web UI is the largest and most-used component in the application layer. Two versions:
1. JSPUI: Built on Java Servlet and JavaServer Page technology2. XMLUI (Manakin): Built on XML and Cocoon technology
Datenmodell
Ein Dokument besteht aus: Metadaten Bündel (ORIGINAL / LICENCE / TEXT / THUMBNAILS)
Bitstreams
Metadaten
Descriptive Metadata:neben dem DC-Schema (default), basierend auf dem Library Application
Profile weitere Konfigurationsmöglichkeiten für jedes Item. Communities und Collections werden einfacher beschrieben, bspw. mit Name und Beschreibung
Administrative Metadata:Metadaten zu Herkunft, Archivierung, Authorisierung. Bitstream-Größe,
MIME-Type usw.
Structural Metadata:Die Struktur eines Items und die Beziehungen zwischen dessen Bitstreams
zwecks Ausgabe / Präsentation an den End-User.
Benutzer und Gruppen
Benutzer zu Gruppen zusammengefasst
Rechte+Aufgaben Gruppe Anonymus Administratorengruppe
Benutzer werden von Systemadministrator verwaltet
Administration Veröffentlichungen Rechte+Aufgaben
Rechtevergabe
hinzufügen, löschen, bearbeiten und lesen von Objekten
eigene Lizenz und Creative Commons konfigurierbar
Suchfunktionen
Suchmaschine Lucene Stichwortsuche und erweiterte Suchfunktionen
Browsen
Praxis
Praktisches Beispiel mit Live CD