Uztaro 101 (2017)

Euskal hizkeren azterketarako bi baliabide informatiko

Laburpena:

Euskal Herrian leku batetik bestera eta garai batetik bestera modu, forma edota egitura desberdinak erabili izan ditugu euskaraz gauza berdinak adierazteko. Adibidez, gaur egun, Euskal Herriko leku batzuetan Jon artzaina da esaten da; beste batzuetan, Jean artzain da (garai batean, artikulurik gabeko forma hori hedatuagoa zen gaur egun baino). XVI. mendean aginterazko forma sintetikoak zuzenean ezeztatuak izan zitezkeen (ze eikek maurtuti oanean, eder eztanik kalean (Lakarra, 1996)), egungo euskaran ezinezkoa dena. Euskalkiak edo hizkerak modu sistematiko batean biltzeak aukera emango liguke euskal hizkeren panoramika bat izateko, hau da, euskal hizkeren bilakaera ezagutzeko, euskara leku eta garai jakin batean nolakoa izan den jakiteko. Hala, gure ikerketa-lanaren xedeetako bat euskal hizkerak aztertzeko baliabide informatikoak garatzea da, ikerketa-alor honetan tresna informatikoek aukera handiak eskaini ahal dizkigutela uste baitugu. Artikulu honetan euskara ez-estandarra aztergai duten bi proiekturen berri eman nahi dugu: 2009an abiarazi genuen BASYQUE aplikazioa eta diseinu-fasean dagoen euskarazko corpus historikoaren arakatzaile sintaktikoa.

Gako-hitzak: Dialektologia -- Aldakortasun sintaktikoa -- Hizkuntzalaritza Konputazionala -- Corpusak

[Title]

Two NLP based resources for the analysis of Basque dialects

[Abstract]

In the Basque Country, in different locations and different periods, several structures and forms have been used to say the same thing. Collecting information about Basque dialects across different places and periods in a systematic way, offers us the possibility to build a panoramic view of the Basque dialects and their evolution, that is, to know how our language has been spoken in a given place and in a given period. And this is, precisely, one of our research goals: we intend to develop Natural Language Processing (NLP) based resources focused on the analysis and processing of Basque dialects across time and space, since we believe that current technological applications provide interesting possibilities in this research field. In this article, we present the BASYQUE application and the syntactic parser we intend to develop for the analysis of historical texts.

Key words: Dialectology -- Syntactic alternation -- Computational Linguistics -- Corporal