boddy 2014 - workshop 6: andreas mängel
DESCRIPTION
Präsentation auf dem Berlin Open Data Day 2014 Thema: Imperia-Tool für die einfache Veröffentlichung digitaler Dokumente im DatenportalTRANSCRIPT
1
Imperia DocumentCenterImperia-Tool fur die einfache Veroffentlichung digitaler Dokumente im Datenportal
Stand: 04. Juni 2014
2
Agenda
• Bestandsaufnahme
• Zielsetzung
• Lösungsskizze
• Fragen
Stand: 04. Juni 2014
3
Agenda
• Bestandsaufnahme
• Zielsetzung
• Lösungsskizze
• Fragen
Stand: 04. Juni 2014
4
Bestandsaufnahme
Stand: 04. Juni 2014
5
Bestandsaufnahme
• Fast 900 Datensätze• 480 GSI
• 72 Amt für Statistik
• 40 aus SimpleSearch
• ca. 500 Einträge mit Dokumenten• Aus vielen Verwaltungen
• Teils Dummy-Einträge
• 21 Anwendungen
Stand: 04. Juni 2014
6
Agenda
• Bestandsaufnahme
• Zielsetzung
• Lösungsskizze
• Fragen
Stand: 04. Juni 2014
7
Zielsetzung
• Bereitstellung von Dokumenten im Datenportal
• Möglichst kein zusätzlicher Aufwand
• Keine zusätzlichen Tools/Logins
• Intelligente Erkennung von Meta-Daten
Stand: 04. Juni 2014
8
Metadaten
Stand: 04. Juni 2014
Titel (Pflichtfeld) Name (Pflichtfeld) Art (Pflichtfeld) Veröffentlichende Stelle (Pflichtfeld)
Kontakt-Email (Pflichtfeld)
Kontaktinformation Name
Veröffentlichende Person Webadresse Kurzbeschreibung Lizenz (Pflichtfeld)
Veröffentlichungsdatum (Pflichtfeld) Aktualisierungsdatum Kategorie (Pflichtfeld) Schlagwörter Zeitraum von
Zeitliche Auflösung Geopraphische Abdeckung
Geopraphische Auflösung Anwendungen Sonstiges
Datei URL API URL Version
9
Agenda
• Bestandsaufnahme
• Zielsetzung
• Lösungsskizze
• Fragen
Stand: 04. Juni 2014
10
Lösungsskizze
• Login via Imperia
• DocumentCenter integriert (ähnlich DLDB)
• Upload von Dokumenten via Browser
• Mail-Weiterleitung von hinterlegten Adressen
• (teil-)automatische Erkennung von Meta-Daten (wenn vorhanden)
• Publikation der Dokumente auf www.berlin.de
• Publikation der Metadaten nach daten.berlin.de
Stand: 04. Juni 2014
11
Agenda
• Bestandsaufnahme
• Zielsetzung
• Lösungsskizze
• Fragen
Stand: 04. Juni 2014
12
Fragen
1. Welche Dokumententypen gibt es?
2. Welcher Art sind die Dokumente inhaltlich?
3. Welche davon können freigegeben werden?
4. Wie viele Dokumente gibt es?
5. Welche Meta-Daten gibt es bisher?
6. Wo stehen diese Meta-Daten?
7. Wer pflegt die Dokumente?
8. Wer stellt die Dokumente bereit?
9. Wo liegen die Dokumente?
10. Wie können sie in Imperia eingepflegt werden?
11. Wo können oder dürfen sie veröffentlicht werden?
12. Gibt es Dokumente, die nach www.berlin.de, aber nicht ins Datenportal veröffentlicht werden sollen?
Stand: 04. Juni 2014
13
Fragen
Welche Dokumententypen gibt es?
- Word-Dokumente, .doc, .xls, .pdf, .ppt
Stand: 04. Juni 2014
14
Fragen
Welcher Art sind die Dokumente (inhaltlich)?
• Telefonliste
• Parlamentsbeschlüsse
• Heimberichte
• Rundschreiben
• Formulare
• Themenbezogene Informationen (Faltblätter, Merkblätter, Broschüren)
• Haushaltspläne
• Publikationen
Stand: 04. Juni 2014
15
Fragen
Welche davon können freigegeben werden?
Fragen:
• Nur „finale“ Daten bereitstellen?
• Wie geht man mit Aktualisierungen um?
• Wie wird Missbrauch verhindert?
Stand: 04. Juni 2014
16
Fragen
Wie viele Dokumente gibt es?
- Beispiel: Heimberichte 50 am Stück
- GSI: 1200 Dokumente im Jahr
Stand: 04. Juni 2014
17
Fragen
Welche Meta-Daten gibt es bisher?
- Wenig bis keine Metadaten
- Eventuell über die Ordnerstruktur
- Gefahr der falschen Metadaten bei Kopieren von Dokumenten bzw. der Verwendung von Vorlagen
Stand: 04. Juni 2014
18
Fragen
Wo stehen diese Meta-Daten?
Stand: 04. Juni 2014
19
Fragen
Wer pflegt die Dokumente?
- Nicht unbedingt die Datenbereitsteller, eher die Fachabteilungen.
Stand: 04. Juni 2014
20
Fragen
Wer stellt die Dokumente bereit?
- Alle Verwaltungen/Bereichen
Stand: 04. Juni 2014
21
Fragen
Wo liegen die Dokumente?
- Fileservern
- Lokale Festplatten, Austausch per Mail
- Bei Projekten Collab-Software (z.B. BSCW)
- Kommen per Mail
- Liegen auf berlin.de und können übergreifend genutzt werden.
Stand: 04. Juni 2014
22
Fragen
Wie können sie in Imperia eingepflegt werden?
- Download-Modul via Media-Datenbank
- FTP-Account und SimpleSearch
- Automatisches Auslesen von Metadaten (Titel, Copyright, Datum) Ziel: 8 von 10 Treffern
Stand: 04. Juni 2014
23
Fragen
Wo können oder dürfen sie veröffentlicht werden?
- Teilweise schon bei berlin.de
- OpenData unklar
Stand: 04. Juni 2014
24
Fragen
Gibt es Dokumente, die nach www.berlin.de, aber nicht ins Datenportal veröffentlicht werden sollen?
- Ja und Nein, Lizenzrechtliche Fragen vs. Datenportal als zentrale Anlaufstelle (Dokumenten Datenbank)
- Aufbereitung im Datenportal aufwendiger als bei Veröffentlichung auf berlin.de (Metadaten)
Stand: 04. Juni 2014
25
Fragen
?
Stand: 04. Juni 2014