Historische bronnen & data in het digitale tijdperk
Digital Humanities Bootcamp 13-15 maart 2013Universiteit Utrecht - 14 maart 2013
Gerben Zaagsma | Huygens ING / KNHG
/ 59
“One of the problems confronting data enthusiasts in the humanities is that we feel a need to convince our more old-fashioned colleagues about what can be done. But our role as advocates of data shouldn't mean that we lose our critical sense as scholars.
[....] there is a risk that we look more carefully at the technical components of the datasets than the historical context of the information that they represent.
Andrew Prescott, ‘The Deceptions of Data’, Digital Riffs (13 January 2013). URL http://digitalriffs.blogspot.nl/2013/01/the-deceptions-of-
data.html (accessed March 7, 2013). 2
/ 59
inleiding
1) digital humanities in historische context2) bronnenkritiek 2.0: digitalisering en selectie3) bronnenkritiek 2.0: data en werken met digitale bronnen
3
--> stelling: neiging tot technologisch determinisme in digital humanities: meer aandacht nodig voor methodologische en epistemologische zaken
/ 59
#1 digital humanities in historische context
4
/ 59
digital humanities
„not a unified field but an array of convergent practices that explore a universe in which:
1) print is no longer the exclusive or the normative medium in which knowledge is produced and/or disseminated; instead, print finds itself absorbed into new, multimedia configurations; and
2) digital tools, techniques, and media have altered the production and dissemination of knowledge in the arts, human and social sciences”.
Jeffrey Schnapp and Todd Presner, Digital Humanities Manifesto 2.0 (Los Angeles: UCLA, March, 2009).
5
/ 59
digitale humanities
wat zijn digital humanities:
• array of practices geen veld of discipline• voordeel: focus op practices positioneert DH als integraal
deel van alle geesteswetenschappen• voor historici: meer dan werken met digitale bronnen &
data, met behulp van bepaalde tools -> veranderingen in kennis productie
• geen aparte digital history/ digital philology etc; nadruk op gemeenschappelijke methodologische uitdagingen/problemen
6
/ 59
definities
McCarty: “a methodological commons for all to draw from”
7
/ 59
definities
John Unsworth’s scholarly primitives: “some basic functions common to scholarly activity across disciplines, over time, and independent of theoretical orientation”
• Discovering • Annotating • Comparing • Referring • Sampling • Illustrating • Representing
8
/ 59
historische achtergrond
hoe nieuw? --> digital humanities hebben een 60-jarige geschiedenis, geschiedenis als moderne academische discipline 19e eeuw
9
1949: Roberto Busa en de Index Thomisticus.
/ 59
“To repeat: the use of computers in the humanities has as its principal aim the enhancement of the quality, depth and extension of research and not merely the lessening of human effort and time.”
Roberto Busa, ‘The Annals of Humanities Computing: The Index Thomisticus’, Computers and the Humanities 14/2 (1980) 83-90, 89.
“understanding the computer as a machine to think with”.Willard McCarty, ‘In the Age of Explorations’, Closing keynote for Exploring the
Archive in the Digital Age, King’s College London, 8 May 2010.
10
historische achtergrond
/ 59
Fasering digital humanities/history:
• 1940s-1950s: eerste kwantitatieve fase in VS, Busa• 1960s-1980s: social science history/ kwantitatief • 1980s-1990s: opkomst PC & Internet >
• elektronische communicatie en online informatie & bronnen zoals databases en elektronische tekstedities
• 2000s -nu: schaalvergroting en uitbouw:• online archives/libraries en ‘big data’• andere publicatie- en communicatievormen: blogs, etc.• collaboratie
11
historische achtergrond
/ 59
Algemene trend (sterk gesimplificeerd): Focus op tekst analyse in humanities computing en
databases history and computing
Niettemin sterk verschillende trajecten in Europa en VS afhankelijk van o.m. historiografisch trends waarbij computer al dan niet ingezet kon worden
zie voor uitstekende analyse: Greenstein, Daniel. "Bringing Bacon Home: The Divergent Progress of Computer-
Aided Historical Research in Europe and the United States." Computers and the Humanities 30/5 (1996) 351-364.!
12
historische achtergrond
/ 59
terminologie
Verschuiving in terminologie:• humanities computing --> digital humanities• history and computing• computational history• historische informatiekunde• digital history/ digitale geschiedenis• history in the digital age
N.B.: In Nederland wordt vaak ehumanities gebruikt ipv digital humanities en soms ook computational humanities: dit laatste ten onrechte want reductionistisch pars pro toto.
13
/ 59
terminologie
14
/ 59
terminologie
Overgang humanities computing / history and computing naar digital humanities / digital history
--> meer dan discursieve verschuiving:
• traditioneel: focus op tekst analyse (humanities computing) en databases (history and computing)
• nu: born digital bronnen, online archieven, etc.
• traditioneel: duidelijk afgebakende groep gebruikers• nu: nieuwe influx van deelnemers zonder ‘traditionele’
humanities computing achtergrond
15
/ 59
Geschiedenis in digitale tijdperk = hybride:• balans tussen analoog en digitaal• misverstand dat er gekozen zou moeten of kunnen worden
--> we werken allemaal in meer of mindere mate digitaal• de hybride historicus/a• vertrouwheid met nieuwe methodes• werken aan een bronnenkritiek die ook digitaal
toepasbaar is
--> overgangsterm? digitale geschiedenis = geschiedenis
16
historisch onderzoek 2.0
/ 59
Typen bronnen, digitaal en analoog door elkaar:• boeken, tijdschriften• beeldmateriaal• film/video• geluid• born digital: databases, email, web zélf (web archiving)
age of abundance maar the infinite archive bestaat niet
17
historisch onderzoek 2.0
/ 59
Vele vragen en uitdagingen:• onze intellectuele agenda?
18
historisch onderzoek 2.0
/ 59
agenda setting
“But nevertheless I feel confident in my general charge: to judge from the projects it produces, the digital humanities as formally constituted has been party to a concerted attempt to reinstate an outmoded and conservative view of the humanities.”
Andrew Prescott, “Making the Digital Human: Anxieties, Possibilities, Challenges”, Digital.Humanities@Oxford Summer School (6 July 2012).
19
/ 59
Vele vragen en uitdagingen:• onze intellectuele agenda?• hoe verandert de historische onderzoekspraktijk door het
werken met digitale bronnen en big data?• nieuwe type bronnen = nieuw type analyse• historische kennisproductie en representatie
20
historisch onderzoek 2.0
/ 59
hermeneutics of data & historical writing
“historians need to embrace new priorities for research publications that explicate their process of interfacing with, exploring, and then making sense of historical sources in a fundamentally digital form—that is, the hermeneutics of data.This may mean de-emphasizing narrative in favor of illustrating the rich complexities between an argument and the data that supports it..”
Frederick W. Gibbs and Trevor J. Owens, ‘The Hermeneutics of Data and Historical Writing (Spring 2012 Version)’ in: Jack Dougherty and Kristen
Nawrotzki eds.,Writing History in the Digital Age (2012).
21
/ 59
historische kennisproductie
Historisch onderzoek en ‘big data’: meer dan data en tools alleen:
• schaalvergroting en technologische uitdagingen: “data driven history”: aanbod- versus vraag gestuurd?
• samenwerking/ collaboratories/ VREs• gaat ook om verwetenschappelijking historisch onderzoek;
nieuwe claims wat betreft historische kennisproductie, meer “beta” -> patronen en structuren
• angst voor karakter geesteswetenschappen/geschiedenis
--> of-of dichotomie misleidend en simplistisch: meer dan kwantitatie vs. kwalitatief of positivistisch vs. narratief!
22
/ 59
big data
23
/ 5924
#2 bronnenkritiek 2.0: digitalisering en selectie
Source: h"p://ec.europa.eu/informa1on_society/ac1vi1es/digital_libraries/index_en.htm.
Digital Agenda for Europe: Digital Libraries Initiative
Europe's cultural and scientific riches at a click of a mouse
In ancient times, the library of Alexandria was said to contain up to 70% of all human knowledge. The challenge for the digital age is to do even better than
that – and make the result last longer.
25
digitalisering
Source: Study Report Numeric-‐ Sta1s1cs on digi1sa1on of cultural materials in Europe (2009):h/p://cordis.europa.eu/fp7/ict/telearn-‐digicult/numeric-‐study_en.pdf.
27
digitalisering
/ 59
digitalisering
Source: Study Report Numeric- Statistics on digitisation of cultural materials in Europe (2009):http://cordis.europa.eu/fp7/ict/telearn-digicult/numeric-study_en.pdf.
28
Natasha Stroeker and René Vogels, Survey Report on Digitisation in European Cultural Heritage Institutions 2012 (ENUMERATE, May, 2012).
/ 59
digitalisering
• digitalisering wordt voorafgegaan door selectie:• welke collecties of delen binnen collecties worden
gedigitaliseerd?• redenen voor selectie:
• behoud van erfgoed & conservering van kostbaar/fragiel materiaal
• frequentie van gebruik door publiek en onderzoekers• academische onderzoeksagenda’s• publieke debatten over het verleden, herinneringspolitiek,
nationale belangen• selectie is verbonden met financiering
29
/ 59
digitalisering
Hoe verhoudt digitalisering zich tot de natie? Roy Rosenzweig voorzag problemen in 2003:
“If national archives were part of the projects of state-building and nationalism, then why should states support post-national digital archives?”
Roy Rosenzweig, ‘Scarcity or Abundance? Preserving the Past in a Digital Era’, The American Historical Review 108 (2003) 735-762, 752.
--> echter...:
30
/ 59
digitalisering en de natie
• Duitsland: systematisch inspanning om het gedrukte joodse verleden te bewaren voor de digitale toekomst
31
/ 59
digitalisering en de natie
• Duitsland: systematisch inspanning om het gedrukte joodse verleden te bewaren voor de digitale toekomst
• voormalig Oostblok: hervonden nationale trots/onafhankelijkheid en veranderde verhoudingen in het post-communistische tijdperk
33
/ 59
digitalisering en de natie
• Duitsland: systematisch inspanning om het gedrukte joodse verleden te bewaren voor de digitale toekomst
• voormalig Oostblok: hervonden nationale trots/onafhankelijkheid en veranderde verhoudingen in het post-communistische tijdperk
• Europa: creëren bewustzijn Europees verleden via digitalisering erfgoed + economisch belang
36
/ 59
digitalisering en de natie
• Duitsland: systematisch inspanning om het gedrukte joodse verleden te bewaren voor de digitale toekomst
• voormalig Oostblok: hervonden nationale trots/onafhankelijkheid en veranderde verhoudingen in het post-communistische tijdperk
• Europa: creëren bewustzijn Europees verleden via digitalisering erfgoed + economisch belang
--> digitalisering niet puur functionalistisch verklaren maar de natie of supra-natie speelt wel een belangrijke rol in prioritering/onderzoeksagenda’s en/of financiering
39
/ 59
de digitale paradox
Hoe zit het met ‘marginale’ en niet-nationale onderwerpen?
40
/ 59
de digitale paradox
Jiddisch hoort niet bij één land: wie neemt verantwoordelijkheid om transnationaal erfgoed te digitaliseren?
de digitale paradox: wordt marginaliteit versterkt?41
/ 59
digitalisering
Digitalisering = selectie --> wat wordt niet gedigitaliseerd en waarom:
• geen ‘nationaal’ onderwerp• valt buiten bestaande (nationale) master narratives? • frequentie van gebruik
Welke geschiedenis kan met digitale bronnen wel of niet geschreven worden?
Voorbeeld: Compactmemory, Duits-joodse geschiedenis en joodse migranten/Jiddisch
42
/ 59
selectie: the infinite archive?
43
/ 59
selectie: the infinite archive?
44
focus op belangrijkste elites en bewegingen die het Duitse jodendom karakteriseerden en op emancipa8e-‐processen:
• klassieke historiografische visie • versterking master narra8ves
/ 59
digitalisering = curatie
Data curatie:
45
/ 5946
#3 bronnenkritiek 2.0:data en werken met digitale
bronnen
/ 59
digitale bronnen en data
Overvloed aan digitale bronnen en data (“data as computer-processable information”).
Allerlei vragen en claims:• ‘big data’, maar: how big is big data?• veranderende manier van wetenschap bedrijven: beleven
we the end of theory?
47
/ 59
the ‘end of theory’?
“The new availability of huge amounts of data, along with the statistical tools to crunch these numbers, offers a whole new way of understanding the world. Correlation supersedes causation, and science can advance even without coherent models, unified theories, or really any mechanistic explanation at all.”
Chris Anderson, ‘The End of Theory: The Data Deluge Makes the Scientific Method Obsolete’, Wired Magazine (23 June 2008). URL http://www.wired.com/science/
discoveries/magazine/16-07/pb_theory (accessed March 11, 2013).
48
/ 59
the ‘end of theory’?
“What is too often forgotten, though, is that our digital helpers are full of ‘theory’ and ‘judgement’ already. As with any methodology, they rely on sets of assumptions, models, and strategies. Theory is already at work on the most basic level when it comes to defining units of analysis, algorithms, and visualisation procedures.”
Bernhard Rieder and Theo Röhle, ‘Digital Methods: Five Challenges’ in: David M Berry ed., Understanding Digital Humanities (Houndmills, Basingstoke, Hampshire:
Palgrave Macmillan, 2012) 67-85, 70.
49
/ 59
digitale bronnen en data
Overvloed aan digitale bronnen en data (“data as computer-processable information”).
Allerlei vragen en claims:• ‘big data’, maar: how big is big data?• veranderende manier van wetenschap bedrijven: the end
of theory?• hoe verandert de rol van de onderzoeker? verhouding
mens/machine en angst traditionele geestes-wetenschappers voor overbodigheid
50
/ 59
digitale bronnen en data
“Ideally, we want to combine the human ability to understand and interpret— which computers can’t completely match yet—and the computer’s ability to analyze massive data sets using algorithms we create.”
Lev Manovich, ‘Trending: The Promises and the Challenges of Big Social Data’ in: Matthew K Gold ed., Debates in the Digital Humanities
(Minneapolis: Univ Of Minnesota Press, 2012) 460-476, 469.
51
/ 59
Werken met digitale bronnen:• bronnenkritiek: extern versus intern• in digitale context: nadruk vaak op externe kritiek -->
authenticiteit & herkomst • nadruk op websites en niet op interpretatie van bronnen die
aangeboden worden via die websites!
52
digitale bronnen en data
/ 59
digitalisering en de natie
Roy Rosenzweig:• externe/ interne bronnenkritiek• nadruk op extern: beoordelen websites e.d. (
53
/ 59
digitalisering en de natie
Roy Rosenzweig:• externe/ interne bronnenkritiek• nadruk op extern: beoordelen websites e.d. (
54
/ 59
Werken met digitale bronnen:• bronnenkritiek: extern versus intern• in digitale context: nadruk vaak op externe kritiek -->
authenticiteit & herkomst • nadruk op websites en niet op interpretatie van bronnen die
aangeboden worden via die websites!
andere dimensies: • verlies van materialiteit en dus kennis van onze bronnen• materialiteit en de historische verbeelding• bewustzijn van context verandert/ verlies van context
55
digitale bronnen en data
/ 59
context
Historical Jewish Press:Bulle1n de l’Alliance Israélite Universelle: full-‐text search = socialistes 56
/ 59
context
Historical Jewish Press:Bulle1n de l’Alliance Israélite Universelle: full-‐text search = socialistes 56
/ 59
context
56
/ 59
context
57
/ 59
context
58
/ 59
slotopmerkingen
1) digital humanities/ history minder nieuw dan het soms lijkt, wel stroomversnelling laatste 10 jaar
2) digitalisering: kritisch kijken wat wel/niet wordt gedigitaliseerd en welke geschiedenissen verteld kunnen worden
3) werken met digitale bronnen & data: ontwikkelen kritische blik op verschil traditionele en digitale bronnen & data
59