communities in biographischen netzwerken -...
TRANSCRIPT
Communities in biographischen NetzwerkenÁgoston Zénó Bernád, Maximilian Kaiser
Inst. f. Neuzeit- und Zeitgeschichtsforschung (INZ)Österreichische Akademie der Wissenschaften
Sebastian M. MairTechnische Universität Wien
Alexander RindInst. f. Creative\Media/Technologies
Fachhochschule St. Pölten
Abstract—Biographical lexica are a rich data source for theDigital Humanities. For example, the connections between placescan be studied based on the migrations of scholars. The work athand resulted from the OpenGLAM.at Cultural Data Hackathon2017 and describes the analysis of 151 biographies from the Aus-trian Biographical Dictionary 1815–1950. Community detectionalgorithms were applied to find groups of places that are denselyconnected internally and sparsely connected between groups. Theresulting communities were examined in detail using networkvisualization.
Zusammenfassung—Biographische Nachschlagewerke sind ei-ne reichhaltige Quelle für Digital Humanities. Beispielsweisekönnen Zusammenhänge zwischen Orten durch die Migrationder dort wirkenden Personen erforscht werden. VorliegenderBeitrag entstand im Rahmen des OpenGLAM.at Kulturhacka-thons 2017 und beschreibt die Analyse von 151 Biographien ausdem Österreichischen Biographischen Lexikon 1815–1950. MittelsCommunitiy Detection wurden stärker verknüpfte Bereiche desMigrationsnetzwerks ermittelt. In der Visualisierung wiederumkonnten diese Communities dann näher erforscht werden.
I. EINLEITUNGDie Erforschung historischer Personennetzwerke anhand di-
gitalisierter biographischer Nachschlagewerke rückte in denletzten Jahren, wie dies u. a. die Projekte Deutsche Biographie[1], [2] und BiographyNet [3], [4] zeigen, immer mehr inden Fokus der Digital Humanities [5]. Zu diesen, nach demPrinzip des Semantic Web konzipierten Vorhaben, gehörtauch Mapping historical networks: Building the new AustrianProsopographical | Biographical Information System (APIS),das sich die semantische Anreicherung des ÖsterreichischenBiographischen Lexikons 1815–1950 (ÖBL) mittels Methodender Computerlinguistik zum Ziel setzt [6], [7, S. 464–467].Das seit 1954 erscheinende ÖBL stellt ein paradigmati-
sches Beispiel einer grenzüberschreitenden Nationalbiographiedar: Es umfasst nicht nur das Gebiet des heutigen Öster-reich, sondern den gesamten Raum des Kaisertums bzw. derösterreichisch-ungarischen Monarchie und bietet somit ein Ab-bild zentraleuropäischer Kultur mit all ihren Wandlungen im19. und 20. Jahrhundert. Die Printversion enthält in bis dato 14Bänden (68 Lieferungen) über 18.000 Biographien im Buch-stabenbereich A–Vo. Das Lexikon durchlief mehrere Etappender Digitalisierung, die Online-Edition mit Biographien ineinem Ad-hoc-XML-Format wurde 2009 umgesetzt [8], [9].Die XMLs enthalten Name, Geburts- und Sterbedaten (ein-schließlich Orte), Berufs- sowie Werks- und Literaturangabenin strukturierter Form. Die meisten Informationen befindensich jedoch im unstrukturierten Haupttext der Biographien.
Im Rahmen des OpenGLAM.at Kulturhackathons 2017 hatsich ein interdisziplinäres Team mit der Erforschung biogra-phischer Daten beschäftigt und ist dabei vor allem folgendenzwei Forschungsfragen nachgegangen:
∙ Welche Städte hängen über die Wanderungsbewegungenvon Personen zusammen (am Beispiel der beruflichenTätigkeiten „Historiker“ und „Lehrer“)?
∙ Wie kann man diese Zusammenhänge anhand der extra-hierten Named Entities1 identifizieren und visualisieren?
II. APIS DATENSET HUMANITIES SCHOLARSDer untersuchte Datensatz [10] entstand im Frühjahr 2016
in Zusammenhang mit einer Projektpräsentation bei der Kon-ferenz „Entangled Worlds – Vernetzte Welten“ am Institutfür Mittelalterforschung der ÖAW [11]. Er basiert auf einerAuswahl von 151 Biographien aus dem ÖBL, in denen Orteund Institutionen annotiert wurden. Jede Biographie kannneben ihrer Zuordnung zu einer von 18 Hauptberufsgruppen(„Literatur, Buch- und Zeitungswesen“, „Medizin“, „Religio-nen und Theologie“, „Sozial- und Wirtschaftswissenschaften“,„Politik“, „bildende und angewandte Kunst“ usw.), abhängigvom Wirkungsfeld der biographierten Person, auch noch biszu 5 berufliche Tätigkeiten zugewiesen bekommen. Jede die-ser Tätigkeiten („Altphilologe“, „Kunsthistoriker“, „Bibliothe-kar“, „Archivar“, „Volkskundler“ usw.) verweist wiederum aufeine der Hauptberufsgruppen. Durch die vielseitigen Lebens-und Karrierewege entstehen so Verflechtungen zwischen die-sen Gruppen. Um dieses Phänomen der Interferenz näherzu untersuchen, fiel die Wahl aus thematischen Gründen aufBiographien von „Historikern“, die zu der Gruppe „Geistes-wissenschaften“ zählen. Des Weiteren wurden die Daten durchdas Kriterium der drei am häufigsten vorkommenden beruf-lichen Tätigkeiten aus der Berufsgruppe „Unterrichtswesen“(„Lehrer“, „Pädagoge“ und „Schulmann“) nochmals gefiltert.
Die Annotationen erfolgten in der am Austrian Centre forDigital Humanities (ÖAW | ACDH) entwickelten APIS We-bapplikation [12], [13, S. 221–222]. Mittels eines Highlighter-Tools können so die Biographietexte unmittelbar über dieOberfläche bearbeitet, die darin enthaltenen Named Entitiesannotiert und mit Linked-Open-Data-Ressourcen verknüpftwerden (Abbildung 1). Aus Datenbanken wie der Gemein-samen Normdatei (GND) [14] und GeoNames [15] werdendabei je nach Quelle Informationen, wie z. B. Labels von Insti-tutionen, Lebensdaten von Personen oder Geokoordinaten von
1Als Named Entities werden Satzelemente bezeichnet, die für Namen vonPersonen, Orten oder Institutionen stehen können.
83
Abbildung 1. APIS Webapplikation
Orten, automatisch übernommen. Die APIS Webapplikation istals virtuelle Forschungsumgebung konzipiert und bietet demUser neben Möglichkeiten der Datenerfassung, auch die derDatenvisualisierung (z. B. als Karten oder Netzwerkdarstel-lung) und des Datenexports in verschiedenen Formaten (JSON,GraphML, CSV, Excel).
III. COMMUNITY DETECTIONSeit den Anfängen der sozialen Netzwerkanalyse steht
die Untersuchung sozialer Strukturen und Teilgruppen vonGraphen (engl. communities) im Fokus der Forschung. AlsThema lässt es sich über die Klassiker der Forschungsliteratur,beginnend in den 1930er-Jahren mit Who shall survive? vonMoreno [16] bis zu der Untersuchung Robust action andthe rise of the Medici, 1400–1434 von Padgett und Ansellin den 1990er-Jahren [17] nachvollziehen. Im Kontext derhistorischen Netzwerkforschung findet dieses Thema in un-terschiedlichen Bereichen wie z. B. der Mittelalterforschung[18], der Wirtschafts- und Sozialgeschichte [19] oder derZeitgeschichte [20] Anwendung.Vor dem Beginn einer derartigen Untersuchung war eine
Vorbereitung der Daten erforderlich. Der APIS-Datensatz liegtals Netzwerk von Personen vor, die mit Orten verbunden sind.Diese Architektur wird als Bipartiter Graph bezeichnet. Zurweiteren Analyse wurde dieses Netzwerk auf einen einfache-ren ungerichteten Graphen aus Orts-Knoten mit gewichtetenKanten projiziert. Das Gewicht der Kanten berechnet sichhierbei aus der Anzahl der Personen, welche mit zwei Ortenverbunden sind. Daraus ergibt sich eine NachbarschaftsmatrixAij . Jeder Knoten entspricht einer Zeile/Spalte. Falls zweiKnoten nicht über eine Kante verbunden sind, gilt Aij = 0andernfalls ist Aij = !ij das Kantengewicht. Für diese Pro-jektion wurde die Python Bibliothek networkx [21] eingesetztund der resultierende Graph zur weiteren Analyse zurück indas GraphML Format übertragen.Die zuvor formulierten Fragestellungen erfordern es zu-
sätzlich zur Bestimmung der gängigen mikroskopischen undmakroskopischen Eigenschaften wie Gradzentralität oder Netz-werkdurchmesser, vor allem die mesoskopischen Eigenschaf-
ten des konstruierten Netzwerks zu identifizieren. WelcheGruppen von Orten sind gleichermaßen mit mehreren Perso-nen assoziiert. Übersetzt in Netzwerksprache lautet die Frage:Welche Bereiche innerhalb des Netzwerks sind untereinanderstärker verknüpft als mit dem restlichen Netzwerk? Stärkerverknüpfte Bereiche innerhalb eines größeren Netzwerks wer-den als Communities bezeichnet, wobei es zur Zeit keinepräzisere, allgemein anerkannte Defintion einer Communitygibt [22]. Basierend auf unterschiedlichen mathematischen De-finitionen von Communities wurde eine Reihe von CommunityDetection Algorithmen entwickelt, wobei wir den Ansatz derModularitätsmaximierung mit Grivan-Newman Null-Modell[23] mittels Louvain-Algorithmus [24] angewandt haben. Die-se Konzepte sollen im folgenden Abschnitt näher erläutertwerden.
Die Modularität Q misst die Wahrscheinlichkeit, dass einePartitionierung Σ = {�} des Netzwerks in Gruppen vonKnoten vom Zufall abweicht. Dies wird im Vergleich zueinem gegebenen Null-Modell pij , das unser Wissen ob derKonstruktion des Netzwerkes beinhaltet, berechnet.
Q = −∑i≠j(Aij − pij)��i,�j (1)
wobei Aij die Nachbarschaftsmatrix ist. �i gibt die Com-munity, welcher der Knoten i angehört, an. ��i,�j ist dasKronecker-Delta, das den Wert 1 annimmt falls �i = �j an-dernfalls den Wert 0. Modularitätsmaximierung hat Probleme,kleine Communities zu finden, dieser Umstand kann durchgeeignete Wahl der Auflösung kompensiert werden [25].In Spezialfällen ist es möglich die optimale Auflösung algo-rithmisch abzuschätzen [26], darüber hinaus gibt es Verfahrenplausible Wertebereiche zu finden [27]. In der Praxis wie auchin dieser Arbeit wird die Auflösung allerdings iterativ undmittels Domänenwissen im Rückschluss auf erzielte Netzwerk-partitionierungen angenähert. Das genutzte Girvan-NewmanNull-Modell beschreibt, dass jeder Knoten eine gleich großeWahrscheinlichkeit hat, mit jedem anderen Knoten im Netz-werk verknüpft zu sein. So ist die Wahrscheinlichkeit zweierKnoten i und j mit ki und kj Verknüpfungen eine gemeinsameKante zu haben
pij =kikj2m
(2)wobei m die Summe über alle Kantengewichte im Netzwerk
ist. Die Maximierung dieser Modularitätsfunktion Q stellt einNP-hartes Problem dar, der eingesetzte Louvain-Algorithmusermittelt daher keine exakte, jedoch eine gute Lösung: Zuord-nung der Knoten i zu Communities �i. In dieser Arbeit wurdedie Community Detection über die graphische Oberfläche vonGephi [28] durchgeführt, und bei einer Auflösung von = 9.549 Communities ermittelt.
IV. VISUALISIERUNGUm die Communities von Orten zu untersuchen und abzu-
schätzen wie gut sich die Community Detection-Algorithmenfür diese Daten eignen, wurden die Visualisierungsysteme
Communities in biographischen Netzwerken
84
Community (S) Source
Community (T) / Target
1
Dresden
Gießen
Hostouň
Jičín
Jihlava
Königgrätz
Litten
Mähren
Oberösterreich
Olmütz
Peruc
Pilsen
Prag
Sambir
Tschernowitz
Wallachisch Meseri..
Warschau
2
Aguntum
Bozen
Brixen
Enns
Gais
Hall in Tirol
Lienz
Pupping
Rovereto
Schwaz
Trient
3
Bludenz District
England
Feldkirch
Freising
Moravská Třebová
Niederlande
Straubing
35
Albanien
Ausseerland
Bad Aussee
Böhmen
Budweis
Czernowitz
Gmunden
Gschnitz
Horn
Italien
Mies
Neutitschein
Niederösterreich
Nikolsburg
Nová Bystřice
Prachatitz
Prossnitz
Pula
St. Pölten
Steyr
Steyr-Land District
Vidnava
Wien
37
Erlangen
Eugendorf
Hallein
Hallwang
Linz
Magersdorf, Bez. O..
Mühlau
Obertrum am See
Rastatt
Saalfelden am Stein..
Salzburg
Sitzendorf an der S..
St. Johann im Pong..
49
Celje
Chrzanów
Chyriw
Friesach
Graz
Hüttenberg
Innsbruck
Ivano-Frankivs’k
Klagenfurt
Knappenberg
Krzeszowice
Lemberg
Leoben
Marburg an der Drau
Padua
Przemyśl
Rudawa
Sankt Paul im Levan..
Stara Wieś
Tarnopol
Triest
Villach Stadt
1 DresdenGießenHostouňJičínJihlavaKöniggrätzLittenMährenOberösterreichOlmützPerucPilsen
PragSambirTschernowitzWallachisch Mese..Warschau
2 AguntumBozenBrixenEnnsGaisHall in TirolLienzPuppingRoveretoSchwazTrient
3 Bludenz DistrictEnglandFeldkirchFreisingMoravská TřebováNiederlandeStraubing
35 AlbanienAusseerlandBad AusseeBöhmenBudweisCzernowitzGmundenGschnitzHornItalienMiesNeutitscheinNiederösterreichNikolsburgNová BystřicePrachatitzProssnitzPulaSt. PöltenSteyrSteyr-Land DistrictVidnavaWien
37 Erlangen
EugendorfHalleinHallwangLinzMagersdorf, Bez. ..MühlauObertrum am SeeRastattSaalfelden am Ste..SalzburgSitzendorf an der ..St. Johann im Pon..
49 CeljeChrzanówChyriwFriesachGrazHüttenbergInnsbruckIvano-Frankivs’kKlagenfurtKnappenbergKrzeszowice
LembergLeobenMarburg an der Dr..PaduaPrzemyślRudawaSankt Paul im Lev..Stara WieśTarnopolTriestVillach Stadt
Blatt 1
1,000 4,000
weight
Abbildung 2. Visualisierung der Nachbarschaftsmatrix gruppiert nach Communities (Ausschnitt): Jede Zelle stellt die mögliche Verbindung zwischen zweiOrten aus Zeile und Spalte dar. Die Farbe der Zelle ist umso dunkler je mehr Personen bei beiden Orten erwähnt werden, also je höher das Kantengewichtist. Ohne Kante bleibt die Zelle weiß. Die stärkere Vernetzung innerhalb der Communities ist hier deutlich sichtbar.
Ljubljana
Tschechisch Teschen
NemesvámosHódmezővásárhely
Liptau-Sankt-Nikolaus
Provincia di Treviso
Hvězdov
Wallachisch Meseritsch
Hüttenberg
Peruc
Banská Bystrica
Szegedin
Mies
Lienz
Aguntum
RastattAdmont
Krzeszowice
Seleu
Kuttenberg
Straubing
Neudorf
Laslea
Nová BystřiceGrossullersdorf
Březinka, Bez. Münchengrätz
Bad Aussee
Znióváralja, Kom. Turóc
Keszthely
Steyr-Land District
Levoča
Schwaz
Nagykőrös
Kecskemét
Dalmatien
Münchenbuchsee
Bregenz
Rijeka
Auschwitz
Magersdorf, Bez. Oberhollabrunn
Bjelovar
ProssnitzAgnita
Bolešov
Bulgarien
Česká Kamenice
Svinia
Litten
Gschnitz
Judenburg
Blasendorf
Hallwang
Czernowitz
Mantova
Bakar
Dvůr Králové nad Labem
Przemyśl
Halle (Saale)
Knappenberg
Sremski Karlovci
Koper
Villach Stadt
Yverdon-les-Bains
Čejč
RosenbergSillein
Lundenburg
Kiel
Ivano-Frankivs’k
Senj
Rava-Rus’ka
Szekszárd
Hostouň
Pazin
Burgdorf BE
Bistritz
Moravská Nová Ves
Neuwerbaß/Újverbász, Kom. Bács-Bodrog
Sankt Paul im Levanttal
Wittenberg
Hodonín
Rumänien
Czeitsch/Čejč, Bez. Göding
Gais
Sitzendorf an der Schmida
Steyr
Saalfelden am Steinernen Meer
Kiskunfélegyháza
Köszeg
Provincia di Como
Smolník
Braunau
St. Johann im Pongau
Chyriw
Sighioara
Steiermark
Erlangen
Rudawa
Türkei
Krasiczyn
Chrzanów
Bremgarten
Oberösterreich
Albanien
Esztergom
Obertrum am See
Serbien
Modern
Pupping
Martinsberg/Pannonhalma, Kom. Győr
Eugendorf
Neustadt/Nagybánya, Kom. Szatmár Neutitschein
Sambir
Prešov
Horn
Trenčín
Österreich
Sátoraljaújhely
Stara Wieś
Trient
Benešov
Griechenland
Gießen
Verneřice
Bludenz District
Gmunden
Hallein
Monor
Vidnava
Pilsen
Siebenbürgen
Ödenburg/Sopron
Marseille
Varaždin
Raab
Fogarasch
Prachatitz
Marburg an der Drau
Königgrätz
Antwerpen
Baja
Jena
Aszód
Rudolfswert
Ptuj
Erlau/Eger, Kom. Heves
Uherské Hradiště
Děčín
Bytča
Friesach
Požega
Mediaş
Bosnien und Herzegowina
Göttingen
St. Gallen
Taus
Ungarn
Moravská Třebová
Jungbunzlau
Tarnów
Ausseerland
Freising
Pápa, Kom Veszprém
Mühlau
Kranj
Salzburg
Südtirol
Wien
Budapest
PragBerlin
Salzburg
Klausenburg
Innsbruck
Pressburg
Italien
LeipzigGraz
Lemberg
Niederösterreich
München
Triest
Brünn
Linz
Deutschland
Görz
Frankreich
Schweiz
Hall in Tirol
Klagenfurt
Bozen
Mähren
Zagreb
Brixen
Budweis
Dresden
Jičín
Paris
Tübingen
Feldkirch
Celje
Znaim
Krakau
Tábor
Krems an der Donau
Hermannstadt
Kesmark
London
Turin
Leoben
Bern
St. Pölten
Warschau
Zadar
Aussig
Pula
Venedig
Tarnopol
Rychnov nad Kněžnou
Enns
BöhmenEngland
Wiener Neustadt
Niederlande
OlmützJihlava
Debrecen
Nikolsburg
Pardubice
Tschernowitz
Rzeszów
Arad
Kolín
Holland
Osijek
Großschenk
Klattau
Rovereto
Blaj
Königreich Belgien
Split
Padua Wien
Berlin
Budapest
Pressburg
Prag
Deutschland
Innsbruck
München
Italien
Graz
Leipzig
Brünn
Lemberg
FrankreichSchweiz
SalzburgLinz
TübingenHermannstadt
Königreich BelgienKrakau
Bern
Triest
Görz
Holland
Niederösterreich
KlagenfurtCelje
Znaim
Brixen
Paris
Rzeszów
Znióváralja, Kom. TurócBolešovČejč
RosenbergSillein
LundenburgMoravská Nová Ves
Czeitsch/Čejč, Bez. GödingKiskunfélegyháza
TrenčínBytča
Mähren
Niederlande
Großschenk
AuschwitzRava-Rus’ka
Bistritz
ÖsterreichTarnów
Hall in TirolBozen
Zagreb
England
Tschechisch Teschen
Rastatt
NeudorfKeszthelyLevoča
Hallwang
Sremski KarlovciWittenberg
Sitzendorf an der Schmida
Smolník
St. Johann im PongauErlangen
Esztergom
Obertrum am SeeEugendorf
Krems an der Donau
London
Aussig
Böhmen
Padua
SeleuLaslea
Agnita
Villach StadtSankt Paul im Levanttal
Sighioara
Marburg an der Drau
Klausenburg
Feldkirch
Turin
LienzAguntumSchwazPupping
Dresden
Pula
Enns
Olmütz
Pardubice
Tschernowitz
Kolín
DalmatienBulgarien
Halle (Saale)
Rumänien
Köszeg
TürkeiSerbien
ModernPrešov
Griechenland
Aszód
Bosnien und Herzegowina
BudweisTábor
ZadarVenedig
Jihlava
Arad
Osijek
Klattau
Split
HódmezővásárhelyLiptau-Sankt-Nikolaus
Grossullersdorf
Březinka, Bez. Münchengrätz
Nagykőrös
MünchenbuchseeBregenz
Rijeka
SviniaBlasendorf
Yverdon-les-Bains
Szekszárd
Burgdorf BEBremgarten
Albanien
SátoraljaújhelyMonorFogarasch
Antwerpen
Uherské Hradiště
Mediaş
GöttingenSt. Gallen
Ungarn
Mühlau
Südtirol
Kesmark
Warschau
Rychnov nad Kněžnou
Wiener Neustadt
Debrecen
Blaj
Provincia di TrevisoHvězdov
PerucKrzeszowice
Straubing
Bjelovar
Česká Kamenice
Litten
BakarKoper
Hostouň
Provincia di Como
RudawaChrzanów
Martinsberg/Pannonhalma, Kom. Győr
Verneřice
MarseilleVaraždin
BajaErlau/Eger, Kom. Heves
Děčín
Požega
Freising
Jičín
Tarnopol
Ljubljana
Wallachisch Meseritsch
Hüttenberg
Banská BystricaSzegedin
Admont
KuttenbergSteyr-Land District
Kecskemét
Magersdorf, Bez. Oberhollabrunn
Gschnitz
Judenburg
Dvůr Králové nad Labem
Knappenberg
Senj
Hodonín
Steyr
Saalfelden am Steinernen Meer
Steiermark
Oberösterreich
Neutitschein
Sambir
Horn
Benešov
HalleinSiebenbürgen
Ödenburg/Sopron
Königgrätz
Jena
Rudolfswert
Friesach
Salzburg
Leoben Rovereto
Nemesvámos
Nová BystřiceBad Aussee
ProssnitzCzernowitz
Mantova
PrzemyślIvano-Frankivs’k
Pazin
Neuwerbaß/Újverbász, Kom. Bács-Bodrog
Chyriw
Krasiczyn
Neustadt/Nagybánya, Kom. Szatmár
Stara Wieś
Gießen
Bludenz District
GmundenPrachatitz
Ptuj
Taus
Moravská Třebová
Jungbunzlau
Ausseerland
Pápa, Kom Veszprém
Kranj
NikolsburgMies
Kiel
Gais
Braunau
Trient
Vidnava
Pilsen
Raab
St. Pölten
Abbildung 3. Visualisierung der Orte als Netzwerkknoten mit Verbindungen durch Wanderungsbewegungen. Die Farbe der Knoten entspricht der Communityund die Größe dem Knotengrade. Links sind die Knoten auf Basis von Kräften positioniert und rechts in einem Kreis sortiert nach Community.
Communities in biographischen Netzwerken
85
Provincia di Treviso
Königreich Belgien
Yverdon-les-Bains
Provincia di Como
Wiener Neustadt
Sremski Karlovci
Ivano-Frankivs’k
Banská Bystrica
Bludenz District
Sátoraljaújhely
Hermannstadt
Tschernowitz
Villach StadtKlausenburg
Deutschland
Rudolfswert
Niederlande
Antwerpen
Frankreich
Österreich
Warschau
Straubing
Chrzanów
Keszthely
Debrecen
Tübingen
Aguntum
München
Ljubljana
Szegedin
Erlangen Tarnopol
Varaždin
Rzeszów
Lemberg
Budweis
Braunau
Benešov
Bjelovar
England
RudawaVidnava
Smolník
Admont
Rastatt
Tarnów
Trenčín
Klattau
London
Požega
Sambir
Köszeg
Jihlava
Leipzig
Gießen
Krakau
Prešov
Monor
PaduaOsijek
Sillein
Bozen
Pilsen
Berlin
Litten
Bakar
Tábor
PazinTurin
Paris
Raab
Celje Arad
Graz
Jena
Jičín
Baja
Orte und CommunitiesMedian Degrees
1,00
20,00
40,00
60,00
81,00
Community0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
Karte basiert auf Mittelwert von F2 und Mittelwert von F3. Farbe zeigt Details zu Community an. Größe zeigt Median von Degrees an. Die Markierungen werden nach Place1 beschriftet. Details werden für Place angezeigt. Die Daten werdenunter Aktion (Person,Relation Type) gefiltert, wobei 195 Elemente beibehalten wird.
Abbildung 4. Visualisierung der Orte auf einer Landkarte. Die Farbe derKnoten entspricht der Community und die Größe dem Knotengrade.
Gephi [28] und Tableau [29] eingesetzt. Derartige computerba-sierte Visualisierungssyteme stellen interaktive visuelle Reprä-sentationen von Datensätzen zur Verfügung und unterstützenso Menschen dabei, ein mentales Modell der Datensätze zuentwickeln [30], [31]. Gerade im Bereich der Netzwerkvisua-lisierung gibt es ein umfangreiches Methodenrepertoire [32].Prinzipiell bestehen die beiden Möglichkeiten Netzwerke
als Matrix oder als Node/Link Diagramm darzustellen. Beider Matrix-Darstellung wird jede Kante durch eine Tabel-lenzelle repräsentiert, deren Zeile und Spalte von Ursprungs-und Zielknoten abhängen. Diese Darstellung hat den Vorteil,dass auch größere Netzwerke übersichtlich dargestellt werdenkönnen. Wie in Abbildung 2 ersichtlich lassen sich bei geeig-neter Sortierung der Knoten Communties gut überprüfen. ImNode/Link-Diagramm werden Knoten als Markierungen wiez. B. Kreise und Kanten als Linien zwischen diesen dargestellt.Diese Darstellung ist weitgehend bekannt und wird häufigverwendet, da es leichter möglich ist Pfaden über mehr als eineKante hinweg zu folgen. Zur Anordnung der Knoten gibt esverschiedene Algorithmen – unter anderem ein Ausbalanzierenvon an- und abstoßenden Kräften zwischen den Knoten oderdie Anordnung der Knoten in einem Kreis (vgl. Abbildung 3).Auch auf einer geographischen Karte können die Communi-
ties angezeigt werden (Abbildung 4). Dabei war es von Vorteil,dass die Orte auf Basis der verknüpften Linked-Open-Datamit Geokoordinaten versehen werden konnten. Alternativ wäreeine Set Visualisierung [33] wie KelpFusion [34] möglichgewesen.Obwohl die Abbildungen nur das größte zusammenhängen-
de Teilnetzwerk bestehend aus 243 Orten enthalten, ist dieVisualisierung bereits überladen. Durch Filtern lassen sichTeile des Netzwerks im Detail erkunden. Beispielsweise zeigtAbbildung 5 Orte zweier Communities sowie Orte andererCommunities, die direkt mit jenen verbunden sind. DurchVerknüpfung mit dem Personen–Ort Netzwerk können auchdie zugrundeliegenden Biographien in die visuelle Analyseeinbezogen werden (Abbildung 6).
Wien
Berlin
Budapest
PragDeutschland
Innsbruck
München
Italien
Graz
Leipzig
Brünn
Lemberg
Salzburg
Linz
Krakau
Triest
Görz
Niederösterreich
Klagenfurt
Celje
ZnaimBrixen
Rzeszów
Mähren
Niederlande
Hall in Tirol
Bozen
Rastatt
Hallwang
Sitzendorf an der Schmida
St. Johann im Pongau
Erlangen
Obertrum am See
Eugendorf
Krems an der Donau
Aussig
Böhmen
Padua
Villach Stadt
Sankt Paul im Levanttal
Marburg an der Drau
Feldkirch
Turin
Olmütz
Tschernowitz
Jihlava
Grossullersdorf
Uherské Hradiště
Mühlau
Südtirol
Warschau
Krzeszowice
Koper
RudawaChrzanów
Tarnopol
Hüttenberg
AdmontMagersdorf, Bez. OberhollabrunnJudenburg
Knappenberg
Saalfelden am Steinernen Meer
Oberösterreich
Sambir
Hallein
Friesach
Salzburg
Leoben
Rovereto
Czernowitz
Przemyśl
Ivano-Frankivs’k
Chyriw
Stara Wieś
Bludenz District
Abbildung 5. Filtern auf die Orte der Communities {Graz, Lemberg, etc.}und {Linz, Salzburg, etc.} und deren unmittelbarer Netzwerk-Nachbarschaft.
Budapest
Italien
Berlin
Wien
Paris
Orte und CommunitiesCommunity2
5
6
8
14
Person
Relation Type
ausgebil..deportie..flüchtet..forschte ..ging ins ..reiste na..wirkte inPolaczek, S..
Politeo, Gio..
Pollák, Chai..
Poparić, Ba..
Popescu, Io..
Prašek, Jus..
Prem, Simon
Pröll, Laure..
Reissenber..
Renner, Vik..
Řezáč, Fran..
Riedl, Frigy..
Riss, Josef
Rolleder, A..
Rowid, Hen..
Rumy, Karl ..
Sacher, Edu..
Šafránek, J..
Saloni, Alek..
Salzer, P. A..
Samolewicz..
Sander, Her..
Sárváry, Pál
Personen und Relationen
Median Degrees12,00
40,00
60,00
81,00
Abbildung 6. Interaktive Verknüpfung der Landkartenansicht von Orten mitden verknüpften Personen. Die gewählte Person hat eine außergewöhnlicheWanderbewegung durch Orte aus fünf Communities vollzogen.
V. RESÜMEEAnders als bei einer nach Zentralitätsmaßen wie Gradzentra-
lität (engl. degree) oder Zwischenzentralität (engl. betweeness)geleiteten Darstellung, lassen sich über die Communities Ge-meinsamkeiten in den Wanderungsbewegungen von Personenhervorheben und identifizieren. Wien war als Hauptstadt derDonaumonarchie bzw. Republik Österreich nicht nur politi-sches und administratives Zentrum, sondern auch für Wirt-schaft, Gesellschaft und Kultur maßgebend. Die beruflichenTätigkeiten der ausgewählten Personen wie „Lehrer“, „Histo-riker“ usw. beschränkten sich hingegen nicht ausschließlich aufdie Metropolregionen. Mit der Auswahl des Samples einerseitsund der Art von Analyse andererseits wird dadurch ein andererBlickwinkel auf die Stadt und ihre Bedeutung ermöglicht.Es kann also zusammenfassend gesagt werden, dass es sichbei dieser Methode um einen vielversprechenden Ansatz zurVisualisierung und Analyse biographischer Daten handelt.
DANKSAGUNGDank aller Autoren gilt dem Organisationsteam des OpenGLAM.at
Kulturhackathons sowie den TeamkollegInnen Christian Erlinger-Schiedlbauer, Janina Hoth und Barbara Kermer. Die Daten wurden im
Communities in biographischen Netzwerken
86
Rahmen des durch den österreichischen Nationalfonds für Forschung,Technologie und Entwicklung geförderten Projekts Mapping histori-cal networks: Building the Austrian Prosopographical/BiographicalInformation System (APIS) gewonnen und bereitgestellt. Die Analysewurde teilweise durch Mittel des vorher genannten APIS-Projekts unddes KAVA-Time Projekts (Austrian Science Fund (FWF): P25489-N23) gefördert.
LITERATUR[1] ,,Deutsche Biographie,” https://www.deutsche-biographie.de, Zugriff
24.10.2017.[2] S. Stotz, V. Stuß, M. Reinert, und M. Schrott, ,,Interpersonal Relations
in Biographical Dictionaries. A Case Study.” in BD2015. BiographicalData in a Digital World 2015. Proceedings of the 1st Conference onBiographical Data in a Digital World, S. ter Braake, A. Fokkens,R. Sluijter, T. Declerck, und E. Wandl-Vogt, Hrsgg., Vol. 1399. CEUR-WS.org, 2015, S. 74–80.
[3] ,,BiographyNet,” http://www.biographynet.nl, Zugriff 24.10.2017.[4] S. ter Braake, A. Fokkens, und F. van Lieburg, ,,Mining Ministers
(1572–1815). Using Semi-structured Data for Historical Research,” inSocial Informatics: SocInfo 2014 International Workshops, Barcelona,Spain, November 11, 2014, Revised Selected Papers, L. M. Aiello undD. McFarland, Hrsgg. Cham: Springer, 2015, S. 279–283.
[5] F. Jannidis, H. Kohle, und M. Rehbein, Hrsgg., Digital Humanities: EineEinführung. Stuttgart: J.B. Metzler, 2017.
[6] Österreichische Akademie der Wissenschaften, Hrsg., ÖsterreichischesBiographisches Lexikon 1815–1950, Wien, 1954ff.
[7] Á. Z. Bernád, ,,Das Österreichische Biographische Lexikon 1815–1950.Ein Nachschlagewerk im Wandel der Zeit,” in Hortus Amicorum. Kös-zöntőkötet Egyed Emese tiszteletére, K. A. Bartha, A. Biró, Z. Demeter,und G. N. Tar, Hrsgg., Kolozsvár, 2017, S. 457–467.
[8] ,,Österreichisches Biographisches Lexikon 1815–1950 Online Edition,”http://www.biographien.ac.at, Zugriff 24.10.2017.
[9] C. Gruber und R. Feigl, ,,Von der Karteikarte zum biografischenInformationsmanagementsystem. Neue Wege am Institut Österreichi-sches Biographisches Lexikon und biographische Dokumentation,” inBiografische Lexika im Internet. Internationale Tagung der „SächsischenBiografie“ in Dresden, 30.–31.05.2008, M. Schattkowsky und F. Me-tasch, Hrsgg., 2009, S. 55–75.
[10] Á. Z. Bernád, M. Kaiser, M. Schlögl, und K. Lejtovicz, ,,APIS Datasethumanities scholars,” Sep. 2017, https://doi.org/10.5281/zenodo.896281,Zugriff 24.10.2017.
[11] Á. Z. Bernád, M. Kaiser, K. Lejtovicz, und M. Schlögl, ,,Mapping his-torical networks. Working with biographical data,” in Entangled Worlds– Vernetzte Welten, J. Preiser-Kapeller, Hrsg., Wien, im Erscheinen.
[12] ,,Testinstanz der Webapplikation APIS,” https://apisdev.eos.arz.oeaw.ac.at, Zugriff 24.10.2017.
[13] K. Lejtovicz und M. Schlögl, ,,APIS – Eine Linked Open Data ba-sierte Datamining-Webapplikation für das Auswerten biographischerDaten,” in DHd 2017. Digitale Nachhaltigkeit, Konferenzabstracts, 13.–18.02.2017, Bern, 2017, S. 220–223.
[14] ,,Gemeinsame Normdatei (GND),” http://dnb.de/gnd, Zugriff24.10.2017.
[15] ,,GeoNames,” http://www.geonames.org/, Zugriff 06.11.2017.
[16] J. L. Moreno, Who shall survive?: A new approach to the problemof human interrelations. Washington: Nervous and Mental DiseasePublishing Co, 1934.
[17] J. F. Padgett und C. K. Ansell, ,,Robust Action and the Rise of theMedici, 1400–1434,” American Journal of Sociology, Vol. 98, Nr. 6, S.1259–1319, 1993.
[18] R. Gramsch, Das Reich als Netzwerk der Fürsten: Politische Struk-turen unter dem Doppelkönigtum Friedrichs II. und Heinrichs (VII.),1225–1235. Ostfildern: Thorbecke, 2013.
[19] M. Stark, ,,Soziale Einbettung eines ländlichen Kreditmarktes im 19.Jahrhundert,” Univ. Dissertation, Trier, 2012.
[20] M. Düring, ,,Hilfe für Verfolgte während des Nationalsozialismus,” inVom Papier zum Laptop. Perspektiven elektronischer Tools zur partizi-pativen Visualisierung und Analyse sozialer Netzwerke, M. Schönhut,M. Gamper, und M. Stark, Hrsgg. Bielefeld: transcript Verlag, 2011.
[21] A. A. Hagberg, D. A. Schult, und P. J. Swart, ,,Exploring networkstructure, dynamics, and function using NetworkX,” in Proceedings ofthe 7th Python in Science Conference (SciPy2008), Pasadena, CA USA,Aug. 2008, S. 11–15.
[22] S. Fortunato und D. Hric, ,,Community detection in networks: A userguide,” Physics Reports, Vol. 659, S. 1–44, 2016.
[23] M. E. Newman und M. Girvan, ,,Finding and evaluating communitystructure in networks,” Physical review E, Vol. 69, Nr. 2, S. 026113,2004.
[24] V. D. Blondel, J.-L. Guillaume, R. Lambiotte, und E. Lefebvre, ,,Fastunfolding of communities in large networks,” Journal of statisticalmechanics: theory and experiment, Vol. 2008, Nr. 10, S. P10008, 2008.
[25] S. Fortunato und M. Barthélemy, ,,Resolution limit in communitydetection,” Proceedings of the National Academy of Sciences, Vol. 104,Nr. 1, S. 36–41, 2007.
[26] M. Newman, ,,Community detection in networks: Modularity optimi-zation and maximum likelihood are equivalent,” arXiv preprint ar-Xiv:1606.02319, 2016.
[27] V. A. Traag, G. Krings, und P. Van Dooren, ,,Significant scales incommunity structure,” Scientific reports, Vol. 3, 2013.
[28] M. Bastian, S. Heymann, und M. Jacomy, ,,Gephi: An Open SourceSoftware for Exploring and Manipulating Networks,” in InternationalAAAI Conference on Weblogs and Social Media, 2009, http://www.aaai.org/ocs/index.php/ICWSM/09/paper/view/154, Zugriff 25.10.2017.
[29] ,,Tableau Desktop,” https://www.tableau.com/products/desktop, Zugriff25.10.2017.
[30] S. K. Card, J. D. Mackinlay, und B. Shneiderman, Hrsgg., Readingsin Information Visualization: Using Vision to Think. San Francisco:Morgan Kaufmann, 1999.
[31] H. Schumann und W. Müller, Visualisierung: Grundlagen und Allge-meine Methoden. Berlin: Springer, 2000.
[32] S. Hadlak, H. Schumann, und H.-J. Schulz, ,,A Survey of Multi-faceted Graph Visualization,” in Proc. Eurographics Conference onVisualization – State of The Art Report, EuroVis STAR, R. Borgo,F. Ganovelli, und I. Viola, Hrsgg. Eurographics, 2015, S. 1–20.
[33] B. Alsallakh, L. Micallef, W. Aigner, H. Hauser, S. Miksch, und P. Rod-gers, ,,The State-of-the-Art of Set Visualization,” Computer GraphicsForum, Vol. 35, Nr. 1, S. 234–260, 2016.
[34] W. Meulemans, N. Henry Riche, B. Speckmann, B. Alper, und T. Dwyer,,,KelpFusion: A Hybrid Set Visualization Technique,” IEEE Trans.Visualization and Computer Graphics, Vol. 19, Nr. 11, S. 1846–1858,Nov. 2013.
Communities in biographischen Netzwerken
87