Evaluatie en aanpassing van neurale taalmodellen voor talen met weinig middelen
Promotie: | W. (Wietse) de Vries, MA |
Wanneer: | 06 juni 2024 |
Aanvang: | 12:45 |
Promotors: | M. (Malvina) Nissim, Prof, prof. dr. M.B. (Martijn) Wieling |
Waar: | Academiegebouw RUG |
Faculteit: | Letteren |
Meertalige taalmodellen kunnen standaardtaken verrichten in veel talen
Taalmodellen, en meertalige modellen in het bijzonder, zijn in staat om standaardtaken te verrichten in veel talen. Hoe goed dit werkt is sterk afhankelijk van de gebruikte methode. Dat blijkt uit promotieonderzoek van Wietse de Vries.
Taalmodellen worden tegenwoordig veel gebruikt door onderzoekers, bedrijven en iedereen die hier interesse in heeft. Een beperking van deze modellen is dat nieuwe ontwikkelingen zich richten op de Engelse taal. Andere talen volgen met een vertraging. Wietse de Vries onderzocht voor zijn promotie hoe goed taalmodellen werken voor andere talen. Met een focus op het Nederlands laat hij hoge taaloverschrijdende prestaties zien met verschillende methodes. Hij laat ook zien hoe modellen kunnen worden aangepast naar grotere talen (Nederlands en Italiaans) en ook kleinere talen (Gronings en Fries) met een kleine hoeveelheid data en trainingstijd. Tenslotte toont De Vries aan hoe relaties en overeenkomsten tussen talen bijdragen aan hoe goed modellen kunnen profiteren van taaloverschrijdende training. Daarbij laat hij ook zien hoe eerder aangetoonde slechte prestaties gedeeltelijk komen doordat Engels standaard als trainingstaal wordt gebruikt.