Wer zwitschert denn da? Autorenschaftsattribution mittels stilistischer Merkmale für kurze Social-Media-Nachrichtentexte
dc.contributor.author | Luger, Katharina | |
dc.contributor.author | Schmittwilken, Jörg | |
dc.contributor.editor | Gunnar Auth | |
dc.contributor.editor | Tim Pidun | |
dc.date.accessioned | 2023-11-13T10:19:41Z | |
dc.date.available | 2023-11-13T10:19:41Z | |
dc.date.issued | 2023 | |
dc.description.abstract | Zur Bekämpfung von Computerkriminalität sowie zur Wahrung der Informationssicherheit ist es vielfach notwendig, die Autorenschaft von Texten zu kennen oder zu ermitteln. Gerade die Zuordnung anonymer Texte zu einer möglichen Autorin oder einem möglichen Autor ist in diesem Kontext ein häufig zu lösendes Problem. Beispielsweise muss im Rahmen der Ermittlungsarbeit zu Hass-Kommentaren die Menge möglicher Autor:innen bestenfalls auf eine Person reduziert werden. In diesem Beitrag wird ein Modell zur Autorenschaftsattribution vorgestellt, das mithilfe von maschinellem Lernen aus einem Datensatz mit den Tweets von 915 Twitter-Accounts gelernt wurde. Das Modell basiert auf Support-Vector-Machines. Der Fokus des Beitrags richtet sich auf das Feature-Engineering, also der Erstellung sowie der Auswahl von Merkmalen, auf denen das Modell basiert. Es werden Feature sowie andere Modellparameter vorgestellt, die eine Klassifikationsgenauigkeit von bis zu 63% erzielen. | de |
dc.identifier.doi | 10.18420/rvi2023-025 | |
dc.identifier.isbn | 978-3-88579-735-7 | |
dc.identifier.pissn | 1617-5468 | |
dc.identifier.uri | https://dl.gi.de/handle/20.500.12116/42628 | |
dc.language.iso | de | |
dc.publisher | Gesellschaft für Informatik e.V. | |
dc.relation.ispartof | 6. Fachtagung Rechts- und Verwaltungsinformatik (RVI 2023) | |
dc.relation.ispartofseries | Lecture Notes in Informatics (LNI) - Proceedings, Volume P-341 | |
dc.subject | Informationssicherheit | |
dc.subject | Computerkriminalität | |
dc.subject | Autorenschaftsattribution | |
dc.subject | Maschinelles Lernen | |
dc.subject | Suppport-Vector-Machine | |
dc.subject | stilistische Merkmale | |
dc.title | Wer zwitschert denn da? Autorenschaftsattribution mittels stilistischer Merkmale für kurze Social-Media-Nachrichtentexte | de |
dc.type | Text/Conference Paper | |
gi.citation.endPage | 108 | |
gi.citation.publisherPlace | Bonn | |
gi.citation.startPage | 96 | |
gi.conference.date | 26.-27. October 2023 | |
gi.conference.location | Dresden | |
gi.conference.review | full | |
gi.conference.sessiontitle | Regular Research Papers | |
gi.tag | best student paper |
Dateien
Originalbündel
1 - 1 von 1