communities in biographischen netzwerken -...

5
Communities in biographischen Netzwerken Ágoston Zénó Bernád, Maximilian Kaiser Inst. f. Neuzeit- und Zeitgeschichtsforschung (INZ) Österreichische Akademie der Wissenschaften Sebastian M. Mair Technische Universität Wien Alexander Rind Inst. f. Creative\Media/Technologies Fachhochschule St. Pölten Abstract—Biographical lexica are a rich data source for the Digital Humanities. For example, the connections between places can be studied based on the migrations of scholars. The work at hand resulted from the OpenGLAM.at Cultural Data Hackathon 2017 and describes the analysis of 151 biographies from the Aus- trian Biographical Dictionary 1815–1950. Community detection algorithms were applied to find groups of places that are densely connected internally and sparsely connected between groups. The resulting communities were examined in detail using network visualization. Zusammenfassung—Biographische Nachschlagewerke sind ei- ne reichhaltige Quelle für Digital Humanities. Beispielsweise können Zusammenhänge zwischen Orten durch die Migration der dort wirkenden Personen erforscht werden. Vorliegender Beitrag entstand im Rahmen des OpenGLAM.at Kulturhacka- thons 2017 und beschreibt die Analyse von 151 Biographien aus dem Österreichischen Biographischen Lexikon 1815–1950. Mittels Communitiy Detection wurden stärker verknüpfte Bereiche des Migrationsnetzwerks ermittelt. In der Visualisierung wiederum konnten diese Communities dann näher erforscht werden. I. EINLEITUNG Die Erforschung historischer Personennetzwerke anhand di- gitalisierter biographischer Nachschlagewerke rückte in den letzten Jahren, wie dies u. a. die Projekte Deutsche Biographie [1], [2] und BiographyNet [3], [4] zeigen, immer mehr in den Fokus der Digital Humanities [5]. Zu diesen, nach dem Prinzip des Semantic Web konzipierten Vorhaben, gehört auch Mapping historical networks: Building the new Austrian Prosopographical | Biographical Information System (APIS), das sich die semantische Anreicherung des Österreichischen Biographischen Lexikons 1815–1950 (ÖBL) mittels Methoden der Computerlinguistik zum Ziel setzt [6], [7, S. 464–467]. Das seit 1954 erscheinende ÖBL stellt ein paradigmati- sches Beispiel einer grenzüberschreitenden Nationalbiographie dar: Es umfasst nicht nur das Gebiet des heutigen Öster- reich, sondern den gesamten Raum des Kaisertums bzw. der österreichisch-ungarischen Monarchie und bietet somit ein Ab- bild zentraleuropäischer Kultur mit all ihren Wandlungen im 19. und 20. Jahrhundert. Die Printversion enthält in bis dato 14 Bänden (68 Lieferungen) über 18.000 Biographien im Buch- stabenbereich A–Vo. Das Lexikon durchlief mehrere Etappen der Digitalisierung, die Online-Edition mit Biographien in einem Ad-hoc-XML-Format wurde 2009 umgesetzt [8], [9]. Die XMLs enthalten Name, Geburts- und Sterbedaten (ein- schließlich Orte), Berufs- sowie Werks- und Literaturangaben in strukturierter Form. Die meisten Informationen befinden sich jedoch im unstrukturierten Haupttext der Biographien. Im Rahmen des OpenGLAM.at Kulturhackathons 2017 hat sich ein interdisziplinäres Team mit der Erforschung biogra- phischer Daten beschäftigt und ist dabei vor allem folgenden zwei Forschungsfragen nachgegangen: Welche Städte hängen über die Wanderungsbewegungen von Personen zusammen (am Beispiel der beruflichen Tätigkeiten „Historiker“ und „Lehrer“)? Wie kann man diese Zusammenhänge anhand der extra- hierten Named Entities 1 identifizieren und visualisieren? II. APIS DATENSET HUMANITIES SCHOLARS Der untersuchte Datensatz [10] entstand im Frühjahr 2016 in Zusammenhang mit einer Projektpräsentation bei der Kon- ferenz „Entangled Worlds – Vernetzte Welten“ am Institut für Mittelalterforschung der ÖAW [11]. Er basiert auf einer Auswahl von 151 Biographien aus dem ÖBL, in denen Orte und Institutionen annotiert wurden. Jede Biographie kann neben ihrer Zuordnung zu einer von 18 Hauptberufsgruppen („Literatur, Buch- und Zeitungswesen“, „Medizin“, „Religio- nen und Theologie“, „Sozial- und Wirtschaftswissenschaften“, „Politik“, „bildende und angewandte Kunst“ usw.), abhängig vom Wirkungsfeld der biographierten Person, auch noch bis zu 5 berufliche Tätigkeiten zugewiesen bekommen. Jede die- ser Tätigkeiten („Altphilologe“, „Kunsthistoriker“, „Bibliothe- kar“, „Archivar“, „Volkskundler“ usw.) verweist wiederum auf eine der Hauptberufsgruppen. Durch die vielseitigen Lebens- und Karrierewege entstehen so Verflechtungen zwischen die- sen Gruppen. Um dieses Phänomen der Interferenz näher zu untersuchen, fiel die Wahl aus thematischen Gründen auf Biographien von „Historikern“, die zu der Gruppe „Geistes- wissenschaften“ zählen. Des Weiteren wurden die Daten durch das Kriterium der drei am häufigsten vorkommenden beruf- lichen Tätigkeiten aus der Berufsgruppe „Unterrichtswesen“ („Lehrer“, „Pädagoge“ und „Schulmann“) nochmals gefiltert. Die Annotationen erfolgten in der am Austrian Centre for Digital Humanities (ÖAW | ACDH) entwickelten APIS We- bapplikation [12], [13, S. 221–222]. Mittels eines Highlighter- Tools können so die Biographietexte unmittelbar über die Oberfläche bearbeitet, die darin enthaltenen Named Entities annotiert und mit Linked-Open-Data-Ressourcen verknüpft werden (Abbildung 1). Aus Datenbanken wie der Gemein- samen Normdatei (GND) [14] und GeoNames [15] werden dabei je nach Quelle Informationen, wie z. B. Labels von Insti- tutionen, Lebensdaten von Personen oder Geokoordinaten von 1 Als Named Entities werden Satzelemente bezeichnet, die für Namen von Personen, Orten oder Institutionen stehen können. 83

Upload: others

Post on 02-Nov-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Communities in biographischen Netzwerken - CEUR-WS.orgceur-ws.org/Vol-2009/fmt-proceedings-2017-paper12.pdf · 2017. 11. 29. · Gephi [28] durchgeführt, und bei einer Au ösung

Communities in biographischen NetzwerkenÁgoston Zénó Bernád, Maximilian Kaiser

Inst. f. Neuzeit- und Zeitgeschichtsforschung (INZ)Österreichische Akademie der Wissenschaften

Sebastian M. MairTechnische Universität Wien

Alexander RindInst. f. Creative\Media/Technologies

Fachhochschule St. Pölten

Abstract—Biographical lexica are a rich data source for theDigital Humanities. For example, the connections between placescan be studied based on the migrations of scholars. The work athand resulted from the OpenGLAM.at Cultural Data Hackathon2017 and describes the analysis of 151 biographies from the Aus-trian Biographical Dictionary 1815–1950. Community detectionalgorithms were applied to find groups of places that are denselyconnected internally and sparsely connected between groups. Theresulting communities were examined in detail using networkvisualization.

Zusammenfassung—Biographische Nachschlagewerke sind ei-ne reichhaltige Quelle für Digital Humanities. Beispielsweisekönnen Zusammenhänge zwischen Orten durch die Migrationder dort wirkenden Personen erforscht werden. VorliegenderBeitrag entstand im Rahmen des OpenGLAM.at Kulturhacka-thons 2017 und beschreibt die Analyse von 151 Biographien ausdem Österreichischen Biographischen Lexikon 1815–1950. MittelsCommunitiy Detection wurden stärker verknüpfte Bereiche desMigrationsnetzwerks ermittelt. In der Visualisierung wiederumkonnten diese Communities dann näher erforscht werden.

I. EINLEITUNGDie Erforschung historischer Personennetzwerke anhand di-

gitalisierter biographischer Nachschlagewerke rückte in denletzten Jahren, wie dies u. a. die Projekte Deutsche Biographie[1], [2] und BiographyNet [3], [4] zeigen, immer mehr inden Fokus der Digital Humanities [5]. Zu diesen, nach demPrinzip des Semantic Web konzipierten Vorhaben, gehörtauch Mapping historical networks: Building the new AustrianProsopographical | Biographical Information System (APIS),das sich die semantische Anreicherung des ÖsterreichischenBiographischen Lexikons 1815–1950 (ÖBL) mittels Methodender Computerlinguistik zum Ziel setzt [6], [7, S. 464–467].Das seit 1954 erscheinende ÖBL stellt ein paradigmati-

sches Beispiel einer grenzüberschreitenden Nationalbiographiedar: Es umfasst nicht nur das Gebiet des heutigen Öster-reich, sondern den gesamten Raum des Kaisertums bzw. derösterreichisch-ungarischen Monarchie und bietet somit ein Ab-bild zentraleuropäischer Kultur mit all ihren Wandlungen im19. und 20. Jahrhundert. Die Printversion enthält in bis dato 14Bänden (68 Lieferungen) über 18.000 Biographien im Buch-stabenbereich A–Vo. Das Lexikon durchlief mehrere Etappender Digitalisierung, die Online-Edition mit Biographien ineinem Ad-hoc-XML-Format wurde 2009 umgesetzt [8], [9].Die XMLs enthalten Name, Geburts- und Sterbedaten (ein-schließlich Orte), Berufs- sowie Werks- und Literaturangabenin strukturierter Form. Die meisten Informationen befindensich jedoch im unstrukturierten Haupttext der Biographien.

Im Rahmen des OpenGLAM.at Kulturhackathons 2017 hatsich ein interdisziplinäres Team mit der Erforschung biogra-phischer Daten beschäftigt und ist dabei vor allem folgendenzwei Forschungsfragen nachgegangen:

∙ Welche Städte hängen über die Wanderungsbewegungenvon Personen zusammen (am Beispiel der beruflichenTätigkeiten „Historiker“ und „Lehrer“)?

∙ Wie kann man diese Zusammenhänge anhand der extra-hierten Named Entities1 identifizieren und visualisieren?

II. APIS DATENSET HUMANITIES SCHOLARSDer untersuchte Datensatz [10] entstand im Frühjahr 2016

in Zusammenhang mit einer Projektpräsentation bei der Kon-ferenz „Entangled Worlds – Vernetzte Welten“ am Institutfür Mittelalterforschung der ÖAW [11]. Er basiert auf einerAuswahl von 151 Biographien aus dem ÖBL, in denen Orteund Institutionen annotiert wurden. Jede Biographie kannneben ihrer Zuordnung zu einer von 18 Hauptberufsgruppen(„Literatur, Buch- und Zeitungswesen“, „Medizin“, „Religio-nen und Theologie“, „Sozial- und Wirtschaftswissenschaften“,„Politik“, „bildende und angewandte Kunst“ usw.), abhängigvom Wirkungsfeld der biographierten Person, auch noch biszu 5 berufliche Tätigkeiten zugewiesen bekommen. Jede die-ser Tätigkeiten („Altphilologe“, „Kunsthistoriker“, „Bibliothe-kar“, „Archivar“, „Volkskundler“ usw.) verweist wiederum aufeine der Hauptberufsgruppen. Durch die vielseitigen Lebens-und Karrierewege entstehen so Verflechtungen zwischen die-sen Gruppen. Um dieses Phänomen der Interferenz näherzu untersuchen, fiel die Wahl aus thematischen Gründen aufBiographien von „Historikern“, die zu der Gruppe „Geistes-wissenschaften“ zählen. Des Weiteren wurden die Daten durchdas Kriterium der drei am häufigsten vorkommenden beruf-lichen Tätigkeiten aus der Berufsgruppe „Unterrichtswesen“(„Lehrer“, „Pädagoge“ und „Schulmann“) nochmals gefiltert.

Die Annotationen erfolgten in der am Austrian Centre forDigital Humanities (ÖAW | ACDH) entwickelten APIS We-bapplikation [12], [13, S. 221–222]. Mittels eines Highlighter-Tools können so die Biographietexte unmittelbar über dieOberfläche bearbeitet, die darin enthaltenen Named Entitiesannotiert und mit Linked-Open-Data-Ressourcen verknüpftwerden (Abbildung 1). Aus Datenbanken wie der Gemein-samen Normdatei (GND) [14] und GeoNames [15] werdendabei je nach Quelle Informationen, wie z. B. Labels von Insti-tutionen, Lebensdaten von Personen oder Geokoordinaten von

1Als Named Entities werden Satzelemente bezeichnet, die für Namen vonPersonen, Orten oder Institutionen stehen können.

83

Page 2: Communities in biographischen Netzwerken - CEUR-WS.orgceur-ws.org/Vol-2009/fmt-proceedings-2017-paper12.pdf · 2017. 11. 29. · Gephi [28] durchgeführt, und bei einer Au ösung

Abbildung 1. APIS Webapplikation

Orten, automatisch übernommen. Die APIS Webapplikation istals virtuelle Forschungsumgebung konzipiert und bietet demUser neben Möglichkeiten der Datenerfassung, auch die derDatenvisualisierung (z. B. als Karten oder Netzwerkdarstel-lung) und des Datenexports in verschiedenen Formaten (JSON,GraphML, CSV, Excel).

III. COMMUNITY DETECTIONSeit den Anfängen der sozialen Netzwerkanalyse steht

die Untersuchung sozialer Strukturen und Teilgruppen vonGraphen (engl. communities) im Fokus der Forschung. AlsThema lässt es sich über die Klassiker der Forschungsliteratur,beginnend in den 1930er-Jahren mit Who shall survive? vonMoreno [16] bis zu der Untersuchung Robust action andthe rise of the Medici, 1400–1434 von Padgett und Ansellin den 1990er-Jahren [17] nachvollziehen. Im Kontext derhistorischen Netzwerkforschung findet dieses Thema in un-terschiedlichen Bereichen wie z. B. der Mittelalterforschung[18], der Wirtschafts- und Sozialgeschichte [19] oder derZeitgeschichte [20] Anwendung.Vor dem Beginn einer derartigen Untersuchung war eine

Vorbereitung der Daten erforderlich. Der APIS-Datensatz liegtals Netzwerk von Personen vor, die mit Orten verbunden sind.Diese Architektur wird als Bipartiter Graph bezeichnet. Zurweiteren Analyse wurde dieses Netzwerk auf einen einfache-ren ungerichteten Graphen aus Orts-Knoten mit gewichtetenKanten projiziert. Das Gewicht der Kanten berechnet sichhierbei aus der Anzahl der Personen, welche mit zwei Ortenverbunden sind. Daraus ergibt sich eine NachbarschaftsmatrixAij . Jeder Knoten entspricht einer Zeile/Spalte. Falls zweiKnoten nicht über eine Kante verbunden sind, gilt Aij = 0andernfalls ist Aij = !ij das Kantengewicht. Für diese Pro-jektion wurde die Python Bibliothek networkx [21] eingesetztund der resultierende Graph zur weiteren Analyse zurück indas GraphML Format übertragen.Die zuvor formulierten Fragestellungen erfordern es zu-

sätzlich zur Bestimmung der gängigen mikroskopischen undmakroskopischen Eigenschaften wie Gradzentralität oder Netz-werkdurchmesser, vor allem die mesoskopischen Eigenschaf-

ten des konstruierten Netzwerks zu identifizieren. WelcheGruppen von Orten sind gleichermaßen mit mehreren Perso-nen assoziiert. Übersetzt in Netzwerksprache lautet die Frage:Welche Bereiche innerhalb des Netzwerks sind untereinanderstärker verknüpft als mit dem restlichen Netzwerk? Stärkerverknüpfte Bereiche innerhalb eines größeren Netzwerks wer-den als Communities bezeichnet, wobei es zur Zeit keinepräzisere, allgemein anerkannte Defintion einer Communitygibt [22]. Basierend auf unterschiedlichen mathematischen De-finitionen von Communities wurde eine Reihe von CommunityDetection Algorithmen entwickelt, wobei wir den Ansatz derModularitätsmaximierung mit Grivan-Newman Null-Modell[23] mittels Louvain-Algorithmus [24] angewandt haben. Die-se Konzepte sollen im folgenden Abschnitt näher erläutertwerden.

Die Modularität Q misst die Wahrscheinlichkeit, dass einePartitionierung Σ = {�} des Netzwerks in Gruppen vonKnoten vom Zufall abweicht. Dies wird im Vergleich zueinem gegebenen Null-Modell pij , das unser Wissen ob derKonstruktion des Netzwerkes beinhaltet, berechnet.

Q = −∑i≠j(Aij − pij)��i,�j (1)

wobei Aij die Nachbarschaftsmatrix ist. �i gibt die Com-munity, welcher der Knoten i angehört, an. ��i,�j ist dasKronecker-Delta, das den Wert 1 annimmt falls �i = �j an-dernfalls den Wert 0. Modularitätsmaximierung hat Probleme,kleine Communities zu finden, dieser Umstand kann durchgeeignete Wahl der Auflösung kompensiert werden [25].In Spezialfällen ist es möglich die optimale Auflösung algo-rithmisch abzuschätzen [26], darüber hinaus gibt es Verfahrenplausible Wertebereiche zu finden [27]. In der Praxis wie auchin dieser Arbeit wird die Auflösung allerdings iterativ undmittels Domänenwissen im Rückschluss auf erzielte Netzwerk-partitionierungen angenähert. Das genutzte Girvan-NewmanNull-Modell beschreibt, dass jeder Knoten eine gleich großeWahrscheinlichkeit hat, mit jedem anderen Knoten im Netz-werk verknüpft zu sein. So ist die Wahrscheinlichkeit zweierKnoten i und j mit ki und kj Verknüpfungen eine gemeinsameKante zu haben

pij =kikj2m

(2)wobei m die Summe über alle Kantengewichte im Netzwerk

ist. Die Maximierung dieser Modularitätsfunktion Q stellt einNP-hartes Problem dar, der eingesetzte Louvain-Algorithmusermittelt daher keine exakte, jedoch eine gute Lösung: Zuord-nung der Knoten i zu Communities �i. In dieser Arbeit wurdedie Community Detection über die graphische Oberfläche vonGephi [28] durchgeführt, und bei einer Auflösung von = 9.549 Communities ermittelt.

IV. VISUALISIERUNGUm die Communities von Orten zu untersuchen und abzu-

schätzen wie gut sich die Community Detection-Algorithmenfür diese Daten eignen, wurden die Visualisierungsysteme

Communities in biographischen Netzwerken

84

Page 3: Communities in biographischen Netzwerken - CEUR-WS.orgceur-ws.org/Vol-2009/fmt-proceedings-2017-paper12.pdf · 2017. 11. 29. · Gephi [28] durchgeführt, und bei einer Au ösung

Community (S) Source

Community (T) / Target

1

Dresden

Gießen

Hostouň

Jičín

Jihlava

Königgrätz

Litten

Mähren

Oberösterreich

Olmütz

Peruc

Pilsen

Prag

Sambir

Tschernowitz

Wallachisch Meseri..

Warschau

2

Aguntum

Bozen

Brixen

Enns

Gais

Hall in Tirol

Lienz

Pupping

Rovereto

Schwaz

Trient

3

Bludenz District

England

Feldkirch

Freising

Moravská Třebová

Niederlande

Straubing

35

Albanien

Ausseerland

Bad Aussee

Böhmen

Budweis

Czernowitz

Gmunden

Gschnitz

Horn

Italien

Mies

Neutitschein

Niederösterreich

Nikolsburg

Nová Bystřice

Prachatitz

Prossnitz

Pula

St. Pölten

Steyr

Steyr-Land District

Vidnava

Wien

37

Erlangen

Eugendorf

Hallein

Hallwang

Linz

Magersdorf, Bez. O..

Mühlau

Obertrum am See

Rastatt

Saalfelden am Stein..

Salzburg

Sitzendorf an der S..

St. Johann im Pong..

49

Celje

Chrzanów

Chyriw

Friesach

Graz

Hüttenberg

Innsbruck

Ivano-Frankivs’k

Klagenfurt

Knappenberg

Krzeszowice

Lemberg

Leoben

Marburg an der Drau

Padua

Przemyśl

Rudawa

Sankt Paul im Levan..

Stara Wieś

Tarnopol

Triest

Villach Stadt

1 DresdenGießenHostouňJičínJihlavaKöniggrätzLittenMährenOberösterreichOlmützPerucPilsen

PragSambirTschernowitzWallachisch Mese..Warschau

2 AguntumBozenBrixenEnnsGaisHall in TirolLienzPuppingRoveretoSchwazTrient

3 Bludenz DistrictEnglandFeldkirchFreisingMoravská TřebováNiederlandeStraubing

35 AlbanienAusseerlandBad AusseeBöhmenBudweisCzernowitzGmundenGschnitzHornItalienMiesNeutitscheinNiederösterreichNikolsburgNová BystřicePrachatitzProssnitzPulaSt. PöltenSteyrSteyr-Land DistrictVidnavaWien

37 Erlangen

EugendorfHalleinHallwangLinzMagersdorf, Bez. ..MühlauObertrum am SeeRastattSaalfelden am Ste..SalzburgSitzendorf an der ..St. Johann im Pon..

49 CeljeChrzanówChyriwFriesachGrazHüttenbergInnsbruckIvano-Frankivs’kKlagenfurtKnappenbergKrzeszowice

LembergLeobenMarburg an der Dr..PaduaPrzemyślRudawaSankt Paul im Lev..Stara WieśTarnopolTriestVillach Stadt

Blatt 1

1,000 4,000

weight

Abbildung 2. Visualisierung der Nachbarschaftsmatrix gruppiert nach Communities (Ausschnitt): Jede Zelle stellt die mögliche Verbindung zwischen zweiOrten aus Zeile und Spalte dar. Die Farbe der Zelle ist umso dunkler je mehr Personen bei beiden Orten erwähnt werden, also je höher das Kantengewichtist. Ohne Kante bleibt die Zelle weiß. Die stärkere Vernetzung innerhalb der Communities ist hier deutlich sichtbar.

Ljubljana

Tschechisch Teschen

NemesvámosHódmezővásárhely

Liptau-Sankt-Nikolaus

Provincia di Treviso

Hvězdov

Wallachisch Meseritsch

Hüttenberg

Peruc

Banská Bystrica

Szegedin

Mies

Lienz

Aguntum

RastattAdmont

Krzeszowice

Seleu

Kuttenberg

Straubing

Neudorf

Laslea

Nová BystřiceGrossullersdorf

Březinka, Bez. Münchengrätz

Bad Aussee

Znióváralja, Kom. Turóc

Keszthely

Steyr-Land District

Levoča

Schwaz

Nagykőrös

Kecskemét

Dalmatien

Münchenbuchsee

Bregenz

Rijeka

Auschwitz

Magersdorf, Bez. Oberhollabrunn

Bjelovar

ProssnitzAgnita

Bolešov

Bulgarien

Česká Kamenice

Svinia

Litten

Gschnitz

Judenburg

Blasendorf

Hallwang

Czernowitz

Mantova

Bakar

Dvůr Králové nad Labem

Przemyśl

Halle (Saale)

Knappenberg

Sremski Karlovci

Koper

Villach Stadt

Yverdon-les-Bains

Čejč

RosenbergSillein

Lundenburg

Kiel

Ivano-Frankivs’k

Senj

Rava-Rus’ka

Szekszárd

Hostouň

Pazin

Burgdorf BE

Bistritz

Moravská Nová Ves

Neuwerbaß/Újverbász, Kom. Bács-Bodrog

Sankt Paul im Levanttal

Wittenberg

Hodonín

Rumänien

Czeitsch/Čejč, Bez. Göding

Gais

Sitzendorf an der Schmida

Steyr

Saalfelden am Steinernen Meer

Kiskunfélegyháza

Köszeg

Provincia di Como

Smolník

Braunau

St. Johann im Pongau

Chyriw

Sighioara

Steiermark

Erlangen

Rudawa

Türkei

Krasiczyn

Chrzanów

Bremgarten

Oberösterreich

Albanien

Esztergom

Obertrum am See

Serbien

Modern

Pupping

Martinsberg/Pannonhalma, Kom. Győr

Eugendorf

Neustadt/Nagybánya, Kom. Szatmár Neutitschein

Sambir

Prešov

Horn

Trenčín

Österreich

Sátoraljaújhely

Stara Wieś

Trient

Benešov

Griechenland

Gießen

Verneřice

Bludenz District

Gmunden

Hallein

Monor

Vidnava

Pilsen

Siebenbürgen

Ödenburg/Sopron

Marseille

Varaždin

Raab

Fogarasch

Prachatitz

Marburg an der Drau

Königgrätz

Antwerpen

Baja

Jena

Aszód

Rudolfswert

Ptuj

Erlau/Eger, Kom. Heves

Uherské Hradiště

Děčín

Bytča

Friesach

Požega

Mediaş

Bosnien und Herzegowina

Göttingen

St. Gallen

Taus

Ungarn

Moravská Třebová

Jungbunzlau

Tarnów

Ausseerland

Freising

Pápa, Kom Veszprém

Mühlau

Kranj

Salzburg

Südtirol

Wien

Budapest

PragBerlin

Salzburg

Klausenburg

Innsbruck

Pressburg

Italien

LeipzigGraz

Lemberg

Niederösterreich

München

Triest

Brünn

Linz

Deutschland

Görz

Frankreich

Schweiz

Hall in Tirol

Klagenfurt

Bozen

Mähren

Zagreb

Brixen

Budweis

Dresden

Jičín

Paris

Tübingen

Feldkirch

Celje

Znaim

Krakau

Tábor

Krems an der Donau

Hermannstadt

Kesmark

London

Turin

Leoben

Bern

St. Pölten

Warschau

Zadar

Aussig

Pula

Venedig

Tarnopol

Rychnov nad Kněžnou

Enns

BöhmenEngland

Wiener Neustadt

Niederlande

OlmützJihlava

Debrecen

Nikolsburg

Pardubice

Tschernowitz

Rzeszów

Arad

Kolín

Holland

Osijek

Großschenk

Klattau

Rovereto

Blaj

Königreich Belgien

Split

Padua Wien

Berlin

Budapest

Pressburg

Prag

Deutschland

Innsbruck

München

Italien

Graz

Leipzig

Brünn

Lemberg

FrankreichSchweiz

SalzburgLinz

TübingenHermannstadt

Königreich BelgienKrakau

Bern

Triest

Görz

Holland

Niederösterreich

KlagenfurtCelje

Znaim

Brixen

Paris

Rzeszów

Znióváralja, Kom. TurócBolešovČejč

RosenbergSillein

LundenburgMoravská Nová Ves

Czeitsch/Čejč, Bez. GödingKiskunfélegyháza

TrenčínBytča

Mähren

Niederlande

Großschenk

AuschwitzRava-Rus’ka

Bistritz

ÖsterreichTarnów

Hall in TirolBozen

Zagreb

England

Tschechisch Teschen

Rastatt

NeudorfKeszthelyLevoča

Hallwang

Sremski KarlovciWittenberg

Sitzendorf an der Schmida

Smolník

St. Johann im PongauErlangen

Esztergom

Obertrum am SeeEugendorf

Krems an der Donau

London

Aussig

Böhmen

Padua

SeleuLaslea

Agnita

Villach StadtSankt Paul im Levanttal

Sighioara

Marburg an der Drau

Klausenburg

Feldkirch

Turin

LienzAguntumSchwazPupping

Dresden

Pula

Enns

Olmütz

Pardubice

Tschernowitz

Kolín

DalmatienBulgarien

Halle (Saale)

Rumänien

Köszeg

TürkeiSerbien

ModernPrešov

Griechenland

Aszód

Bosnien und Herzegowina

BudweisTábor

ZadarVenedig

Jihlava

Arad

Osijek

Klattau

Split

HódmezővásárhelyLiptau-Sankt-Nikolaus

Grossullersdorf

Březinka, Bez. Münchengrätz

Nagykőrös

MünchenbuchseeBregenz

Rijeka

SviniaBlasendorf

Yverdon-les-Bains

Szekszárd

Burgdorf BEBremgarten

Albanien

SátoraljaújhelyMonorFogarasch

Antwerpen

Uherské Hradiště

Mediaş

GöttingenSt. Gallen

Ungarn

Mühlau

Südtirol

Kesmark

Warschau

Rychnov nad Kněžnou

Wiener Neustadt

Debrecen

Blaj

Provincia di TrevisoHvězdov

PerucKrzeszowice

Straubing

Bjelovar

Česká Kamenice

Litten

BakarKoper

Hostouň

Provincia di Como

RudawaChrzanów

Martinsberg/Pannonhalma, Kom. Győr

Verneřice

MarseilleVaraždin

BajaErlau/Eger, Kom. Heves

Děčín

Požega

Freising

Jičín

Tarnopol

Ljubljana

Wallachisch Meseritsch

Hüttenberg

Banská BystricaSzegedin

Admont

KuttenbergSteyr-Land District

Kecskemét

Magersdorf, Bez. Oberhollabrunn

Gschnitz

Judenburg

Dvůr Králové nad Labem

Knappenberg

Senj

Hodonín

Steyr

Saalfelden am Steinernen Meer

Steiermark

Oberösterreich

Neutitschein

Sambir

Horn

Benešov

HalleinSiebenbürgen

Ödenburg/Sopron

Königgrätz

Jena

Rudolfswert

Friesach

Salzburg

Leoben Rovereto

Nemesvámos

Nová BystřiceBad Aussee

ProssnitzCzernowitz

Mantova

PrzemyślIvano-Frankivs’k

Pazin

Neuwerbaß/Újverbász, Kom. Bács-Bodrog

Chyriw

Krasiczyn

Neustadt/Nagybánya, Kom. Szatmár

Stara Wieś

Gießen

Bludenz District

GmundenPrachatitz

Ptuj

Taus

Moravská Třebová

Jungbunzlau

Ausseerland

Pápa, Kom Veszprém

Kranj

NikolsburgMies

Kiel

Gais

Braunau

Trient

Vidnava

Pilsen

Raab

St. Pölten

Abbildung 3. Visualisierung der Orte als Netzwerkknoten mit Verbindungen durch Wanderungsbewegungen. Die Farbe der Knoten entspricht der Communityund die Größe dem Knotengrade. Links sind die Knoten auf Basis von Kräften positioniert und rechts in einem Kreis sortiert nach Community.

Communities in biographischen Netzwerken

85

Page 4: Communities in biographischen Netzwerken - CEUR-WS.orgceur-ws.org/Vol-2009/fmt-proceedings-2017-paper12.pdf · 2017. 11. 29. · Gephi [28] durchgeführt, und bei einer Au ösung

Provincia di Treviso

Königreich Belgien

Yverdon-les-Bains

Provincia di Como

Wiener Neustadt

Sremski Karlovci

Ivano-Frankivs’k

Banská Bystrica

Bludenz District

Sátoraljaújhely

Hermannstadt

Tschernowitz

Villach StadtKlausenburg

Deutschland

Rudolfswert

Niederlande

Antwerpen

Frankreich

Österreich

Warschau

Straubing

Chrzanów

Keszthely

Debrecen

Tübingen

Aguntum

München

Ljubljana

Szegedin

Erlangen Tarnopol

Varaždin

Rzeszów

Lemberg

Budweis

Braunau

Benešov

Bjelovar

England

RudawaVidnava

Smolník

Admont

Rastatt

Tarnów

Trenčín

Klattau

London

Požega

Sambir

Köszeg

Jihlava

Leipzig

Gießen

Krakau

Prešov

Monor

PaduaOsijek

Sillein

Bozen

Pilsen

Berlin

Litten

Bakar

Tábor

PazinTurin

Paris

Raab

Celje Arad

Graz

Jena

Jičín

Baja

Orte und CommunitiesMedian Degrees

1,00

20,00

40,00

60,00

81,00

Community0

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

Karte basiert auf Mittelwert von F2 und Mittelwert von F3. Farbe zeigt Details zu Community an. Größe zeigt Median von Degrees an. Die Markierungen werden nach Place1 beschriftet. Details werden für Place angezeigt. Die Daten werdenunter Aktion (Person,Relation Type) gefiltert, wobei 195 Elemente beibehalten wird.

Abbildung 4. Visualisierung der Orte auf einer Landkarte. Die Farbe derKnoten entspricht der Community und die Größe dem Knotengrade.

Gephi [28] und Tableau [29] eingesetzt. Derartige computerba-sierte Visualisierungssyteme stellen interaktive visuelle Reprä-sentationen von Datensätzen zur Verfügung und unterstützenso Menschen dabei, ein mentales Modell der Datensätze zuentwickeln [30], [31]. Gerade im Bereich der Netzwerkvisua-lisierung gibt es ein umfangreiches Methodenrepertoire [32].Prinzipiell bestehen die beiden Möglichkeiten Netzwerke

als Matrix oder als Node/Link Diagramm darzustellen. Beider Matrix-Darstellung wird jede Kante durch eine Tabel-lenzelle repräsentiert, deren Zeile und Spalte von Ursprungs-und Zielknoten abhängen. Diese Darstellung hat den Vorteil,dass auch größere Netzwerke übersichtlich dargestellt werdenkönnen. Wie in Abbildung 2 ersichtlich lassen sich bei geeig-neter Sortierung der Knoten Communties gut überprüfen. ImNode/Link-Diagramm werden Knoten als Markierungen wiez. B. Kreise und Kanten als Linien zwischen diesen dargestellt.Diese Darstellung ist weitgehend bekannt und wird häufigverwendet, da es leichter möglich ist Pfaden über mehr als eineKante hinweg zu folgen. Zur Anordnung der Knoten gibt esverschiedene Algorithmen – unter anderem ein Ausbalanzierenvon an- und abstoßenden Kräften zwischen den Knoten oderdie Anordnung der Knoten in einem Kreis (vgl. Abbildung 3).Auch auf einer geographischen Karte können die Communi-

ties angezeigt werden (Abbildung 4). Dabei war es von Vorteil,dass die Orte auf Basis der verknüpften Linked-Open-Datamit Geokoordinaten versehen werden konnten. Alternativ wäreeine Set Visualisierung [33] wie KelpFusion [34] möglichgewesen.Obwohl die Abbildungen nur das größte zusammenhängen-

de Teilnetzwerk bestehend aus 243 Orten enthalten, ist dieVisualisierung bereits überladen. Durch Filtern lassen sichTeile des Netzwerks im Detail erkunden. Beispielsweise zeigtAbbildung 5 Orte zweier Communities sowie Orte andererCommunities, die direkt mit jenen verbunden sind. DurchVerknüpfung mit dem Personen–Ort Netzwerk können auchdie zugrundeliegenden Biographien in die visuelle Analyseeinbezogen werden (Abbildung 6).

Wien

Berlin

Budapest

PragDeutschland

Innsbruck

München

Italien

Graz

Leipzig

Brünn

Lemberg

Salzburg

Linz

Krakau

Triest

Görz

Niederösterreich

Klagenfurt

Celje

ZnaimBrixen

Rzeszów

Mähren

Niederlande

Hall in Tirol

Bozen

Rastatt

Hallwang

Sitzendorf an der Schmida

St. Johann im Pongau

Erlangen

Obertrum am See

Eugendorf

Krems an der Donau

Aussig

Böhmen

Padua

Villach Stadt

Sankt Paul im Levanttal

Marburg an der Drau

Feldkirch

Turin

Olmütz

Tschernowitz

Jihlava

Grossullersdorf

Uherské Hradiště

Mühlau

Südtirol

Warschau

Krzeszowice

Koper

RudawaChrzanów

Tarnopol

Hüttenberg

AdmontMagersdorf, Bez. OberhollabrunnJudenburg

Knappenberg

Saalfelden am Steinernen Meer

Oberösterreich

Sambir

Hallein

Friesach

Salzburg

Leoben

Rovereto

Czernowitz

Przemyśl

Ivano-Frankivs’k

Chyriw

Stara Wieś

Bludenz District

Abbildung 5. Filtern auf die Orte der Communities {Graz, Lemberg, etc.}und {Linz, Salzburg, etc.} und deren unmittelbarer Netzwerk-Nachbarschaft.

Budapest

Italien

Berlin

Wien

Paris

Orte und CommunitiesCommunity2

5

6

8

14

Person

Relation Type

ausgebil..deportie..flüchtet..forschte ..ging ins ..reiste na..wirkte inPolaczek, S..

Politeo, Gio..

Pollák, Chai..

Poparić, Ba..

Popescu, Io..

Prašek, Jus..

Prem, Simon

Pröll, Laure..

Reissenber..

Renner, Vik..

Řezáč, Fran..

Riedl, Frigy..

Riss, Josef

Rolleder, A..

Rowid, Hen..

Rumy, Karl ..

Sacher, Edu..

Šafránek, J..

Saloni, Alek..

Salzer, P. A..

Samolewicz..

Sander, Her..

Sárváry, Pál

Personen und Relationen

Median Degrees12,00

40,00

60,00

81,00

Abbildung 6. Interaktive Verknüpfung der Landkartenansicht von Orten mitden verknüpften Personen. Die gewählte Person hat eine außergewöhnlicheWanderbewegung durch Orte aus fünf Communities vollzogen.

V. RESÜMEEAnders als bei einer nach Zentralitätsmaßen wie Gradzentra-

lität (engl. degree) oder Zwischenzentralität (engl. betweeness)geleiteten Darstellung, lassen sich über die Communities Ge-meinsamkeiten in den Wanderungsbewegungen von Personenhervorheben und identifizieren. Wien war als Hauptstadt derDonaumonarchie bzw. Republik Österreich nicht nur politi-sches und administratives Zentrum, sondern auch für Wirt-schaft, Gesellschaft und Kultur maßgebend. Die beruflichenTätigkeiten der ausgewählten Personen wie „Lehrer“, „Histo-riker“ usw. beschränkten sich hingegen nicht ausschließlich aufdie Metropolregionen. Mit der Auswahl des Samples einerseitsund der Art von Analyse andererseits wird dadurch ein andererBlickwinkel auf die Stadt und ihre Bedeutung ermöglicht.Es kann also zusammenfassend gesagt werden, dass es sichbei dieser Methode um einen vielversprechenden Ansatz zurVisualisierung und Analyse biographischer Daten handelt.

DANKSAGUNGDank aller Autoren gilt dem Organisationsteam des OpenGLAM.at

Kulturhackathons sowie den TeamkollegInnen Christian Erlinger-Schiedlbauer, Janina Hoth und Barbara Kermer. Die Daten wurden im

Communities in biographischen Netzwerken

86

Page 5: Communities in biographischen Netzwerken - CEUR-WS.orgceur-ws.org/Vol-2009/fmt-proceedings-2017-paper12.pdf · 2017. 11. 29. · Gephi [28] durchgeführt, und bei einer Au ösung

Rahmen des durch den österreichischen Nationalfonds für Forschung,Technologie und Entwicklung geförderten Projekts Mapping histori-cal networks: Building the Austrian Prosopographical/BiographicalInformation System (APIS) gewonnen und bereitgestellt. Die Analysewurde teilweise durch Mittel des vorher genannten APIS-Projekts unddes KAVA-Time Projekts (Austrian Science Fund (FWF): P25489-N23) gefördert.

LITERATUR[1] ,,Deutsche Biographie,” https://www.deutsche-biographie.de, Zugriff

24.10.2017.[2] S. Stotz, V. Stuß, M. Reinert, und M. Schrott, ,,Interpersonal Relations

in Biographical Dictionaries. A Case Study.” in BD2015. BiographicalData in a Digital World 2015. Proceedings of the 1st Conference onBiographical Data in a Digital World, S. ter Braake, A. Fokkens,R. Sluijter, T. Declerck, und E. Wandl-Vogt, Hrsgg., Vol. 1399. CEUR-WS.org, 2015, S. 74–80.

[3] ,,BiographyNet,” http://www.biographynet.nl, Zugriff 24.10.2017.[4] S. ter Braake, A. Fokkens, und F. van Lieburg, ,,Mining Ministers

(1572–1815). Using Semi-structured Data for Historical Research,” inSocial Informatics: SocInfo 2014 International Workshops, Barcelona,Spain, November 11, 2014, Revised Selected Papers, L. M. Aiello undD. McFarland, Hrsgg. Cham: Springer, 2015, S. 279–283.

[5] F. Jannidis, H. Kohle, und M. Rehbein, Hrsgg., Digital Humanities: EineEinführung. Stuttgart: J.B. Metzler, 2017.

[6] Österreichische Akademie der Wissenschaften, Hrsg., ÖsterreichischesBiographisches Lexikon 1815–1950, Wien, 1954ff.

[7] Á. Z. Bernád, ,,Das Österreichische Biographische Lexikon 1815–1950.Ein Nachschlagewerk im Wandel der Zeit,” in Hortus Amicorum. Kös-zöntőkötet Egyed Emese tiszteletére, K. A. Bartha, A. Biró, Z. Demeter,und G. N. Tar, Hrsgg., Kolozsvár, 2017, S. 457–467.

[8] ,,Österreichisches Biographisches Lexikon 1815–1950 Online Edition,”http://www.biographien.ac.at, Zugriff 24.10.2017.

[9] C. Gruber und R. Feigl, ,,Von der Karteikarte zum biografischenInformationsmanagementsystem. Neue Wege am Institut Österreichi-sches Biographisches Lexikon und biographische Dokumentation,” inBiografische Lexika im Internet. Internationale Tagung der „SächsischenBiografie“ in Dresden, 30.–31.05.2008, M. Schattkowsky und F. Me-tasch, Hrsgg., 2009, S. 55–75.

[10] Á. Z. Bernád, M. Kaiser, M. Schlögl, und K. Lejtovicz, ,,APIS Datasethumanities scholars,” Sep. 2017, https://doi.org/10.5281/zenodo.896281,Zugriff 24.10.2017.

[11] Á. Z. Bernád, M. Kaiser, K. Lejtovicz, und M. Schlögl, ,,Mapping his-torical networks. Working with biographical data,” in Entangled Worlds– Vernetzte Welten, J. Preiser-Kapeller, Hrsg., Wien, im Erscheinen.

[12] ,,Testinstanz der Webapplikation APIS,” https://apisdev.eos.arz.oeaw.ac.at, Zugriff 24.10.2017.

[13] K. Lejtovicz und M. Schlögl, ,,APIS – Eine Linked Open Data ba-sierte Datamining-Webapplikation für das Auswerten biographischerDaten,” in DHd 2017. Digitale Nachhaltigkeit, Konferenzabstracts, 13.–18.02.2017, Bern, 2017, S. 220–223.

[14] ,,Gemeinsame Normdatei (GND),” http://dnb.de/gnd, Zugriff24.10.2017.

[15] ,,GeoNames,” http://www.geonames.org/, Zugriff 06.11.2017.

[16] J. L. Moreno, Who shall survive?: A new approach to the problemof human interrelations. Washington: Nervous and Mental DiseasePublishing Co, 1934.

[17] J. F. Padgett und C. K. Ansell, ,,Robust Action and the Rise of theMedici, 1400–1434,” American Journal of Sociology, Vol. 98, Nr. 6, S.1259–1319, 1993.

[18] R. Gramsch, Das Reich als Netzwerk der Fürsten: Politische Struk-turen unter dem Doppelkönigtum Friedrichs II. und Heinrichs (VII.),1225–1235. Ostfildern: Thorbecke, 2013.

[19] M. Stark, ,,Soziale Einbettung eines ländlichen Kreditmarktes im 19.Jahrhundert,” Univ. Dissertation, Trier, 2012.

[20] M. Düring, ,,Hilfe für Verfolgte während des Nationalsozialismus,” inVom Papier zum Laptop. Perspektiven elektronischer Tools zur partizi-pativen Visualisierung und Analyse sozialer Netzwerke, M. Schönhut,M. Gamper, und M. Stark, Hrsgg. Bielefeld: transcript Verlag, 2011.

[21] A. A. Hagberg, D. A. Schult, und P. J. Swart, ,,Exploring networkstructure, dynamics, and function using NetworkX,” in Proceedings ofthe 7th Python in Science Conference (SciPy2008), Pasadena, CA USA,Aug. 2008, S. 11–15.

[22] S. Fortunato und D. Hric, ,,Community detection in networks: A userguide,” Physics Reports, Vol. 659, S. 1–44, 2016.

[23] M. E. Newman und M. Girvan, ,,Finding and evaluating communitystructure in networks,” Physical review E, Vol. 69, Nr. 2, S. 026113,2004.

[24] V. D. Blondel, J.-L. Guillaume, R. Lambiotte, und E. Lefebvre, ,,Fastunfolding of communities in large networks,” Journal of statisticalmechanics: theory and experiment, Vol. 2008, Nr. 10, S. P10008, 2008.

[25] S. Fortunato und M. Barthélemy, ,,Resolution limit in communitydetection,” Proceedings of the National Academy of Sciences, Vol. 104,Nr. 1, S. 36–41, 2007.

[26] M. Newman, ,,Community detection in networks: Modularity optimi-zation and maximum likelihood are equivalent,” arXiv preprint ar-Xiv:1606.02319, 2016.

[27] V. A. Traag, G. Krings, und P. Van Dooren, ,,Significant scales incommunity structure,” Scientific reports, Vol. 3, 2013.

[28] M. Bastian, S. Heymann, und M. Jacomy, ,,Gephi: An Open SourceSoftware for Exploring and Manipulating Networks,” in InternationalAAAI Conference on Weblogs and Social Media, 2009, http://www.aaai.org/ocs/index.php/ICWSM/09/paper/view/154, Zugriff 25.10.2017.

[29] ,,Tableau Desktop,” https://www.tableau.com/products/desktop, Zugriff25.10.2017.

[30] S. K. Card, J. D. Mackinlay, und B. Shneiderman, Hrsgg., Readingsin Information Visualization: Using Vision to Think. San Francisco:Morgan Kaufmann, 1999.

[31] H. Schumann und W. Müller, Visualisierung: Grundlagen und Allge-meine Methoden. Berlin: Springer, 2000.

[32] S. Hadlak, H. Schumann, und H.-J. Schulz, ,,A Survey of Multi-faceted Graph Visualization,” in Proc. Eurographics Conference onVisualization – State of The Art Report, EuroVis STAR, R. Borgo,F. Ganovelli, und I. Viola, Hrsgg. Eurographics, 2015, S. 1–20.

[33] B. Alsallakh, L. Micallef, W. Aigner, H. Hauser, S. Miksch, und P. Rod-gers, ,,The State-of-the-Art of Set Visualization,” Computer GraphicsForum, Vol. 35, Nr. 1, S. 234–260, 2016.

[34] W. Meulemans, N. Henry Riche, B. Speckmann, B. Alper, und T. Dwyer,,,KelpFusion: A Hybrid Set Visualization Technique,” IEEE Trans.Visualization and Computer Graphics, Vol. 19, Nr. 11, S. 1846–1858,Nov. 2013.

Communities in biographischen Netzwerken

87