Karl Berglund och Mats Dahllöf: "Litteraturhistoriska analyser genom topic modeling"

  • Datum: –15.00
  • Plats: Engelska parken - Eng9-1017
  • Arrangör: Litteraturvetenskapliga institutionen
  • Kontaktperson: Johan Svedjedal
  • Seminarium

Högre seminariet i litteraturvetenskap

Karl Berglund och Mats Dahllöf, avd. för datorlingvistik, Uppsala: "Litteraturhistoriska analyser av teman och genus genom topic modeling"

Ordf.: Svedjedal


Presentation
Sedan Franco Moretti lanserade begreppet distant reading år 2000 har det talats allt mer om kvantitativa metoder inom litteraturvetenskapen. Även om sådana metoder har använts länge erbjuder de idag stora och snabbt växande digitalt åtkomliga litterära materialen helt nya möjligheter vad gäller storskaliga perspektiv.

Föredraget behandlar potentialen i och användningsområden för metoden topic modeling (TM) för litteraturforskning på svenska material. TM är en statistisk metod som baseras på hur sannolikt det är att ord tenderar att förekomma i närheten av andra ord i ett textmaterial. Metoden kan användas för att hitta både breda och mer specifika teman, och för många litteraturhistoriska ändamål i stor skala, t.ex. identifiering av teman, tematiska analys utan inledande angivelser av vad man letar efter, och spårning av framväxt och tillbakagång av teman sett över längre tidsperioder. TM kan också korsas med andra parametrar och vi visar ett exempel (baserat på könsbestämda pronomen) som identifierar tematiska genusmönster och särskilt könskodade teman.

Utgångspunkten är två korpusar av svensk fiktionsprosa: 121 verk från Litteraturbanken, ca 1890–1940; samt 231 verk från Svensk Bokhandels bästsäljarlistor 2004–2017. I föredraget kommer vi att förklara hur metoden fungerar samt visa på möjliga tillämpningar utifrån konkreta nedslag i dessa material.