Nij Europeesk rapport mei oersjoch fan besteande Taaltechnology foar it Frysk

Mercator/ Fryske Akademy ûndersikers Charlie Robinson-Jones en Ydwine Scarse hawwe in rapport skreaun oer taaltechnologyske middels foar it Frysk, yn opdracht fan it European Language Equality (ELE) projekt. It rapport 'Report on the West Frisian Language (Language Technology Support of Europe’s Languages in 2020/2021 - European Language Equality project)' is fergees te downloaden. It is ûnderdiel fan (op it stuit) 39 taalrapporten foar it ELE-projekt

 

Oer European Language Equality (ELE)

Mei in grut en folslein konsortium fan 52 partners út alle Europeeske lannen, de ûndersykswrâld en it bedriuwslibben en alle wichtige pan-Europeeske inisjativen, hat it projekt European Language Equality (ELE) in strategyske ûndersyks -, ynnovaasje - en ymplemintaasjeaginda ûntwikkele, lykas in rûtekaart om tsjin 2030 folsleine digitale taalgelikensens yn Europa te berikken. European Language Equality hat subsydzje krigen fan de Europeeske Uny.

 

Gearfetting

Yn dit rapport jouwe wy in oersjoch fan besteande Taaltechnology (LT) foar Frysk (ek Westerlauwersk Frysk of - yn it Ingelsk - West-Frysk / West-Frisian), mei ferwizing nei de taaldata, -helpmiddels en -tsjinsten dy ’t opnommen binne yn de European Language Grid. Om ’t LT in sintraal plak ynnimt yn ús deistich libben, lykas yn staveringshifkers, sykmasines, fertaalsoftware en firtuele assistint-technology, is it essinsjeel dat net allinne nasjonale of meerderheidstalen, mar ek regionale of minderheidstalen digitale gelikens en in heech nivo fan digitale fitaliteit genietsje - in kearnkomponint fan taalbehâld en refitalisaasje.

Frysk, in autochtoane minderheidstaal dy 't praat wurdt yn de offisjeel twatalige provinsje Fryslân (Fryslân) yn it noarden fan Nederlân, rint it risiko om gjin digitale taalgelikensens te berikken. Yn in besykjen om de LT-situaasje foar it Frysk te ferbetterjen, presintearje wy in analyze fan de hjoeddeistige data en boarnen, en identifisearje wy de hiaten en útdagings dy 't driuwend omtinken hoege om derfoar te soargjen dat it Frysk net negatyf beynfloede wurdt troch digitale diglosje (d.w.s., útsluting fan digitale konteksten ten geunste fan it Nederlânsk, de nasjonale taal).

Us analyze fan de hjoeddeiske LT boarnen foar Frysk ûntbleate dat der signifikante ûntwikkelings west hawwe op it mêd fan automatyske oersetting, staveringshifkers, monolingale en multymodale korpora, en leksikale boarnen yn it bysûnder. Crowdsourcings-ynspanningen foar inisjativen lykas Mozilla Common Voice hawwe relatyf suksesfol west yn it sammeljen fan data dy 't brûkt wurde kinne yn takomstige spraaktechnologyprojekten foar it Frysk. Der is lykwols in tekoart oan ûnder oare twatalige en meartalige tekstkorpora (parallelle data), taalmodellen, kompjûter-grammatika, minske-kompjûter ynteraksje tsjinsten, en sosjale media data, lykas oan transkribearre materiaal dat brûkt wurde kin foar de ûntwikkeling fan spraakherkenners en oare helpmiddels.

Hoewol ’t der de ôfrûne jierren LT-programma’s foar it Nederlânsk west hawwe, lykas it STEVIN-programma, hawwe regionale of minderheidstalen yn Nederlân (bgl. Frysk) oant no ta gjin omtinken krigen yn dy projekten. Der is ek gjin tydskrift of evenemint spesifyk wijd oan Frysk LT of keunstmjittige yntelliginsje, wylst dy wol beskikber binne foar it Nederlânsk. Boppedat hawwe wy hiaten en útdagingen identifisearre dy ’t de needsaak beklamje fan mear finansiering en ferbettere training en behâld fan skoalle-LT-ûntwikkelers yn de provinsje Fryslân.

Nettsjinsteande de yndrukwekkende foarútgong dy 't oant no ta boekt is, is der in dúdlik gebrek oan Fryske LT-middels yn ferliking mei it Nederlânsk en oare (offisjele EU) talen. Om de digitale fitaliteit fan it Frysk en de LT middels te ferbetterjen, befelje wy ûnder oaren oan dat

  • (a) in sintrum of netwurk oprjochte wurdt troch de wichtichste LT stakeholders yn Fryslân om it West-Frysk yn it digitale tiidrek te beskermjen,
  • (b) de fokus no ferskowe moat nei it sammeljen fan gegevens foar de ûntwikkeling fan mear avansearre ynstruminten en tsjinsten, lykas automatyske ûndertiteling en spraakwerreadige persoanen,
  • Fryske LT belanghawwenden moatte inisjativen ûntwikkelje om jongere generaasjes bewust te meitsjen fan de beskikbere middels en om de mooglikheden te fergrutsjen om Frysk LT yn it deistich libben te brûken, mei as doel de impact fan digitale diglosje te ferminderjen.

Wy stelle fierder foar dat ús oanrikkemedaasjes yntegrearre wurde yn in lange termyn, nasjonale digitale taalstrategy dy ’t de ûntwikkeling fan mear (meartalige) LT-boarnen fasilitearje wol, de kwaliteit fan de hjoeddeistige Fryske LT ferbetterje wol, en ferbettere gearwurking tusken de wichtichste LT belanghawwenden yn de provinsje Fryslân mooglik meitsje wol, wat kollektyf bydrage sil oan it berikken fan digitale taalgelikens foar Frysk.