Stylometrie
Stylometrie is de toepassing van onderzoek naar de stijl van meestal geschreven taal, maar wordt tevens toegepast op het gebied van muziek[1] en schilderkunst.[2] Stylometrie wordt vaak gebruikt om de auteur van anonieme en/of betwiste documenten te benoemen. Er zijn zowel wettelijke als academische en literaire toepassingen die variëren van de vraag over de authenticiteit van Shakespeares oeuvre tot aan forensische taalkunde.
Geschiedenis
[bewerken | brontekst bewerken]Stylometrie is ontstaan uit eerdere technieken voor tekstanalyse. Een voorbeeld is het bewijs aangeleverd door Lorenzo Valla in 1439 dat de Donatio Constantini een vervalsing betreft was gebaseerd op de vergelijking van het Latijn uit het document met dat uit authentieke documenten uit de 4e eeuw.
De basis van stylometrie is uitgewerkt door de Poolse filosoof Wincenty Lutosławski. Lutosławski heeft de term stylometrie gemunt in zijn Franstalige werk Principes de stylométrie: Appliqués à la chronologie des œuvres de Platon. Hij gebruikte deze techniek om een chronologie te maken van Plato's werk.
Toepassingen
[bewerken | brontekst bewerken]Literatuurwetenschap en historische teksten
[bewerken | brontekst bewerken]Een van de meest bekende toepassingen van de stylometrie is de literatuurwetenschap: het wordt daar onder andere gebruikt om het auteurschap van betwiste of anonieme werken te bepalen.
Een voorbeeld hiervan is het betwiste auteurschap van de toneelstukken van Molière in het begin van de 20e eeuw; in 1919 stelde Pierre Louÿs voor dat Pierre Corneille de auteur van een bepaald aantal werken zou kunnen zijn geweest. Deze theorie kreeg steun van stylometrische analyses die het lexicon, grammaticale structuren en de rijmwoorden in teksten van beide auteurs bestudeerde. Echter, in 2019 is een onderzoek gepubliceerd door Florian Cafiero en Jean-Baptiste Camps waarin door hen geavanceerde stylometrische technieken werden toegepast om deze hypothese te bevestigen. In dit onderzoek bestudeerden ze een grote verzameling werken van Molière, Pierre Corneille, Thomas Corneille en andere theaterauteurs uit die periode. De resultaten toonden dat Molière over een eigen stijlprofiel zou beschikken die niet lijkt op die van Corneille en dat de betwiste werken weldegelijk door Molière zijn geschreven.[3]
Forensische en juridische toepassingen
[bewerken | brontekst bewerken]Stylometrie en stylometrische methoden worden in forensische en juridische gebieden gebruikt om anonieme of verdachte communicatie te onderzoeken, met name in fraudeonderzoeken, bedreigingen en cybercriminaliteit. Door het vergelijken van onbekende bronnen met bronnen met een geïdentificeerde auteur, kan de kans worden bepaald of specifieke berichten door dezelfde persoon zijn gemaakt of geschreven.[4] In rechtszaken kan stylometrie als bewijs worden ingezet, zoals bij onderzoek naar plagiaat of onenigheid over intellectueel eigendom, maar ook bij moordonderzoeken zoals de moord op Grégory Villemin.
Sociolinguïstiek en taalverandering
[bewerken | brontekst bewerken]In sociolinguïstisch onderzoek wordt stylometrie ook toegepast; het helpt hierbij met het bestuderen van veranderingen in taal en schrijfstijlen door de jaren heen. Onderzoekers kunnen bijvoorbeeld door een aanzienlijke hoeveelheid tekst uit diverse tijdperken en periodes te analyseren een duidelijk inzicht verwerven in de ontwikkeling van taalgebruik en de invloeden hierop.
Kunstmatige intelligentie en automatische tekstanalyse
[bewerken | brontekst bewerken]Kunstmatige intelligentie en machine learning is een relatief recente toevoeging van het toepassingsgebied van de stylometrie. Hierbij worden stylometrische methoden en technieken ingezet om AI systemen te begeleiden bij automatische tekstanalyse[5]; denk hierbij onder andere aan het automatisch detecteren van spam. Met name sociale mediaplatformen en zoekmachines gebruiken steeds vaker stylometrie om het (zoek)gedrag van gebruikers te bestuderen en aanbevelingen van inhoud/advertenties op basis hiervan aan te passen.[6]
Externe links
[bewerken | brontekst bewerken]- Je schrijfstijl als vingerafdruk op kennislink.nl (via web.archive.org, 3 juli 2016)
07-03-2015
- Dit artikel of een eerdere versie ervan is een (gedeeltelijke) vertaling van het artikel Stylometry op de Engelstalige Wikipedia, dat onder de licentie Creative Commons Naamsvermelding/Gelijk delen valt. Zie de bewerkingsgeschiedenis aldaar.
- ↑ (en) bbc.co.uk - Making hit music into a science
- ↑ (en) web.archive.org - The Style of Numbers Behind a Number of Styles
- ↑ Cafiero, Florian, Camps, Jean-Baptiste (2019-11). Why Molière most likely did write his plays. Science Advances 5 (11). ISSN:2375-2548. DOI:10.1126/sciadv.aax5489.
- ↑ Post, Matt (2018). [https://doi.org/10.18653/v1/n18-1119 Fast Lexically Constrained Decoding with Dynamic Beam Allocation for Neural Machine Translation]. Proceedings of the 2018 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long Papers) (Association for Computational Linguistics: Stroudsburg, PA, USA). DOI: 10.18653/v1/n18-1119.
- ↑ MERRIAM, T. V. N. (1 januari 1994). Neural Computation in Stylometry II: An Application to the Works of Shakespeare and Marlowe. Literary and Linguistic Computing 9 (1): 1–6. ISSN:0268-1145. DOI:10.1093/llc/9.1.1.
- ↑ Ford, John, Jain, Varsha, Wadhwani, Ketan, Gupta, Damini Goyal (2023-11). AI advertising: An overview and guidelines. Journal of Business Research 166: 114124. ISSN:0148-2963. DOI:10.1016/j.jbusres.2023.114124.