Nieuw Europees rapport met overzicht van bestaande Taaltechnologie voor het Fries

Mercator/ Fryske Akademy ûndersikers Charlie Robinson-Jones en Ydwine Scarse hebben een rapport geschreven over taaltechnologische middelen voor het Fries, in opdracht van het European Language Equality (ELE) project. Het rapport 'Report on the West Frisian Language (Language Technology Support of Europe’s Languages in 2020/2021 - European Language Equality project)' is gratis te downloaden. Het is ûnderdiel van (op dit moment) 39 taalrapporten foar it ELE-projekt

 

Over European Language Equality (ELE)

Met een groot en alomvattend consortium van 52 partners uit alle Europese landen, de onderzoekswereld en het bedrijfsleven en alle belangrijke pan-Europese initiatieven, heeft het project European Language Equality (ELE) een strategische onderzoeks-, innovatie- en implementatieagenda ontwikkeld, evenals een routekaart om tegen 2030 volledige digitale taalgelijkheid in Europa te bereiken. European Language Equality kreeg subsidie van de Europese Unie.

 

Samenvatting

In dit rapport geven we een overzicht van bestaande Taaltechnologie (LT) voor het Fries, met verwijzing naar de taaldata, -hulpmiddelen en -diensten die zijn opgenomen in de European Language Grid. Aangezien LT een centrale plaats inneemt in ons dagelijks leven, zoals in spellingcheckers, zoekmachines, vertaalsoftware, en virtuele assistent-technologie, is het essentieel dat niet alleen nationale of meerderheidstalen, maar ook regionale of minderheidstalen digitale gelijkheid en een hoog niveau van digitale vitaliteit genieten - een kerncomponent van taalbehoud en revitalisatie.

Fries, een autochtone minderheidstaal die wordt gesproken in de officieel tweetalige provincie Fryslân (Friesland) in het noorden van Nederland, loopt het risico geen digitale taalgelijkheid te bereiken. In een poging om de LT situatie voor het Fries te verbeteren, presenteren we een analyse van de huidige data en bronnen, en identificeren we de hiaten en uitdagingen die dringend aandacht behoeven om ervoor te zorgen dat het Fries niet negatief beïnvloed wordt door digitale diglossie (d.w.z. uitsluiting van digitale contexten ten gunste van het Nederlands, de nationale taal). 

Onze analyse van de huidige LT bronnen voor Fries onthulde dat er significante ontwikkelingen zijn geweest op het gebied van automatische vertaling, spellingcheckers, monolinguale en multimodale corpora, en lexicale bronnen in het bijzonder. Crowdsourcingsinspanningen voor initiatieven zoals Mozilla Common Voice zijn relatief succesvol geweest in het verzamelen van data die gebruikt kunnen worden in toekomstige spraaktechnologieprojecten voor het Fries. Er is echter een gebrek aan onder andere tweetalige en meertalige tekstcorpora (parallelle data), taalmodellen, computationele grammatica's, mens-computer interactie diensten, en sociale media data, evenals aan getranscribeerd materiaal dat gebruikt kan worden voor de ontwikkeling van spraakherkenners en andere hulpmiddelen. 

Hoewel er de afgelopen jaren LT-programma's voor het Nederlands zijn geweest, zoals het STEVIN-programma, hebben regionale of minderheidstalen in Nederland (bijv. Fries) tot nu toe geen aandacht gekregen in deze projecten. Er is ook geen tijdschrift of evenement specifiek gewijd aan Fries LT of kunstmatige intelligentie, terwijl deze wel beschikbaar zijn voor het Nederlands. Bovendien hebben we hiaten en uitdagingen geïdentificeerd die de noodzaak benadrukken van meer financiering en verbeterde training en behoud van geschoolde LT ontwikkelaars in de provincie Fryslân. Ondanks de indrukwekkende vooruitgang die tot nu toe is geboekt, is er een duidelijk gebrek aan Friese LT middelen in vergelijking met het Nederlands en andere (officiële EU) talen. 

Om de digitale vitaliteit van het Fries en de LT middelen te verbeteren, bevelen wij onder andere aan dat

  • (a) een centrum of netwerk wordt opgericht door de belangrijkste LT stakeholders in Fryslân om het Fries in het digitale tijdperk te beschermen,
  • (b) de focus nu moet verschuiven naar het verzamelen van gegevens voor de ontwikkeling van meer geavanceerde instrumenten en diensten, zoals automatische ondertiteling en spraakherkenningssoftware, en screenreaders voor visueel gehandicapte Friestaligen, en
  • (c) Friese LT belanghebbenden moeten initiatieven ontwikkelen om jongere generaties bewust te maken van de beschikbare middelen en om de mogelijkheden te vergroten om Fries LT in het dagelijks leven te gebruiken, met als doel de impact van digitale diglossie te verminderen.

Wij stellen verder voor dat onze aanbevelingen worden geïntegreerd in een lange termijn, nationale digitale taalstrategie die de ontwikkeling van meer (meertalige) LT bronnen wil faciliteren, de kwaliteit van de huidige Friese LT wil verbeteren, en verbeterde samenwerking tussen de belangrijkste LT stakeholders in de provincie Fryslân mogelijk wil maken, wat collectief zal bijdragen aan het bereiken van digitale taalgelijkheid voor Fries.