Lost in Translation: AI’s Struggles with Scanian – A Study on Language Models’ Attempts to Conquer Swedish and its Dialects
Under de senaste åren har utvecklingen av artificiell intelligens frodats och med sig tagit en förbättrad träffsäkerhet i taligenkänning. Däremot, liksom med alla snabba teknologiska utvecklingar har den sina brister, i det här fallet bristen på dialektal träningsdata. Den här uppsatsen undersöker om AI har en ojämnt fördelad förståelse av regionalt språk, med fokus på försummandet av de sydsvenskThe recent surge in the development of artificial intelligence has greatly improved the accuracy of automatic speech recognition. However, as with all abrupt technical improvements, it will have its weaknesses, in this case the lack of dialectal training data. This thesis investigates if AI has an unevenly distributed understanding of regional speech, focusing on the disregard of southern Swedish