2 min read

MCA eta Distantzia Linguistikoa harremanetan aztertzeko ahalegina

Pasa den zemendian, MCA eta Dialektometria teknikak batera erabilita, aurkezpen bat egin genuen Arratiako datuak erabilita, Influencia del euskera estándar en el habla de dos generaciones del valle de Arratia: alfabetizada y no alfabetizada. Aurkezpena mentalki birpasatzen genbiltzala, datuei bestelako begirada batez heldu nien. Nahi barik. Begitandu zitzaidan, MCAk kalkulatzen dituen dimentsioak, akaso, bat etorri behar luketela distantzia linguistikoetara iraulitako datuen antolaerarekin.

Ea irudikapen hori zein neurritaraino dagoen ondo bideratuta:

Post hau irudiek osatzen dute, aurrekoetan azalduta daudelako distantzi linguistikoaren edo MCAren inguruko informazioa.

Distantzia Linguistikoen matrizea

Segidan dendograma eregiteko distantzia linguistiko matrizea:

RIV distantzia linguistikoaren araberako matrizea
  Dima Gazte Dima Heldu Euskera estandar Lemoa Gazte Lemoa Heldu Zeanuri Gazte Zeanuri Heldu Zeberio Gazte
Dima Heldu 35.14
Euskera estandar 60.64 66.32
Lemoa Gazte 25.41 35.98 58.55
Lemoa Heldu 35.87 31.55 63.68 31.18
Zeanuri Gazte 27.75 31.64 55.87 23.60 31.79
Zeanuri Heldu 36.22 29.47 62.89 32.63 32.45 29.94
Zeberio Gazte 36.81 33.33 61.58 33.33 34.97 27.75 34.41
Zeberio Heldu 35.68 31.05 64.29 32.46 35.83 29.78 36.98 31.55

Eta goiko hori oinarri hartuta, segidako dendograma oinarrian.

MCA

MCA analisia oinarri hartuta, segidan lehenengo bi dimentsioen mapa, “biplota”, aldakiak zein informatzaile taldeak irudikatzen direalako. DIM 1ek eta DIM 2k bariantzaren erdia baino gutxixeago azaltzen dute.

Goiko irudian ageri-agerian dago puntu berde bat x,y (2.7, 0.1) koordenadetan. Horrek irudikatuko ditu euskara batu gogorreko hitzak, Arratian agertzen ez direanak (eb. igandea, amona, izeba…)

Teknika bera erabilita, hurrengoan irudikatu dira MCAko DIM 3 eta DIM 4, bariantzaren laurdena baino gutxiago.

Clusterrak eta MCAko dimentsioak batera

Tarte honetan, Ward-en arabera sortzen direan clusterrak (gehienez n-1) alderatzen dira MCAk datuen bariazioa azaltzeko kalkulatzen dituan dimentsioak. Bariantzaren % 100 azaltzeko n-1 dimentsio kalkulatu behar dira, horiek direlako oposizio posible guztiak.

Hurrengo irudietan dimentsioak banaka erakusten dira elementuen arteko oposizioaren arabera. Konparagai Warden araberako clusterren kopurua da dimentsioaren zenbakia + 1. Ezkerreko grafikoan nabarmentzen dira kolore gorri eta urdinez, clusterretan sortutako azken bietako elementuak.

Zer pentsa…

zer pentsa eman dit ariketatxuak. DIM2 eta hiru clusterreko alderaketaren kasuan izan ezik, beste guztietan bat etorri dira aztertu oposaketa pareak.

Eta zer pentsa emateaz gain, zer landu ere eman digu:

  • Zer dago 0ren inguruan?
  • Zelan antolatzen dira neurgai hartu ditugun elementu linguistikoak?