10 min read

Zelan azaltzen dugun gure burua...

…edo Iramuteq euskaraz erabiltzen hasita

Lehengo astean aurkeztu genuen, azkenik, Iramuteq-erako euskarazko lexikoa (post honen amaieran daude diapositibak). Horren aitzakiaz, aurkezpen horretan erakutsi genuen analisi bat aztergai dakargu hona. Sakonxeago, ez sakonegi. Zelan edo halan esateko, emaitzaren lau alderdi nagusietan dimentsio bat azaltzen da hemendik haurrera:

Honela egituratu dut testua: hasieran metodologiaz ohartxuren bat; gero, corpusaren deskribapena; hurrengo, tartea egindako sailkapenaren laburpena, emaitzen lagin batzuekin, klaseko mota bat, sailkapenaren azpi atalaren bukaeran ezaugarri kualitatiboen banaketa ere azaltzen da; azken atalean aurkitutako muga batzuk aipatzen dira eta erreferentziak. Eranskintzat, lehengo eguneko aurkezpena

Irakurle! Begira zer agertu den corpus hau aztertuta!

Metodologiaz

Corpusa aztertzeko Iramuteq1 (Ratinaud, 2009) erabili dugu, Beheranzko Sailkatze Hierarkikoa erabilita (CHD, Classification Hierarchique Descendante).

Oinarrizko hipotesia hau da: corpusaren baitako diskurtsoa matematikoki modeliza daitekeela. Corpusa esanahi-unitateetan bana daitekeela eta unitate horretako elementu lexikal bakoitzak bere testuinguruak definitzen duela. Horra iritsita, testuinguru klaseak identifika litezke, lexiko jakin batek zehaztuta; baldin eta unitateen (esaldien) elementuak (lexikoa) taldekatzen baditugu.

Zelan taldekatu, baina? Horra On Reinerten ekarpena: dimentsio anitzeko teknikak erabilita: gorago aipatutako CHD hori; oinarritzat presentzia/absentzia matrize erraldoia du, zutabeetan lexiko unitate bakoitza eta lerroetan testu unitate bakoitza.

❓ 😐

Corpusa

Corpus batek diskurtso baten hegal batzuk osatuko duelako ustean, corpus bat batu behar da: UPV/EHUko Haur Hezkuntzako Graduan eta Lehen Hezkuntzako Graduan eskolak ematen dituztenek euren burua unibertsitatearen aurrean azaltzeko idatzitakoa.

UPV/EHUko Haur Hezkuntza edo Lehen Hezkuntza graduetan klaseak ematen ditugunoi pasa den urtean eskatu ziguten gure azalpen fitxa bat osatzea. Hemen nirea 😯

Table 1: Irakasleria hezkuntza formaleko graduetan
Bilbo Donostia Gasteiz
denera 116 90 92
deskribatuak 80 47 44

Aurreko taula horretan ikusten da irakasle guztiok ez dugula bete eskatutako hori, baina erdiak baino gehiago egin duenez, nahikotzat hartu beharko.

Denera irakasle eta ikertzaile kontratua duten UPV/EHUko 171 deskribapen hartu eta Iramuteq horri eskatu diogu corpus horren barruan dauden ikuskerak identifikatzea. Zehatzago eta hobeto esanda, eskatu diogu lexikoaren erabileraren araberako sailkapena egitea.

Sailkapena

Hona lehenengo sailkapena, Reinertek asmatutako ALCESTE metodoa erabilita (Reinert, 1990).

Dendrograma eta klase bakoitzeko lexiko adierazgarriena

Eta hori 🆙 zelan interpretatu behar da?

Ba, lexiko multzo bakoitzak berori erabilita iradokitzen den mundu-lexikal bati buruz egiten digu berba. Horrela, gorriz agertzen denak gure irakaskuntza-alderdiaz idatzi dugunari buruz dirautsagula ematen du. Izan ere, hor ditugun hitz batzuk beste multzoetan baino nabarmen gehiago agertzen dira multzo horretan. Atxikipen horren balio kuantitatibotzat Iramuteqek ematen dizkigu \(\chi^2\)aren balioa eta horri dagokion p-balioa.

Lehenengo klaseaz… eta lexiko adierazgarria

Segidan lehenengo eremu edo klase horri dagozkion hitzak aurkezten ditugu gordinik, hau da, garbiketarik egin gabe.

Table 2: Lehenengo klaseko lemak
lema ji_karratua p.balioa
irakasle 255.255 0.000
sail 207.802 0.000
fakultate 203.690 0.000
didaktika 161.341 0.000
egun 81.522 0.000
eskola 75.913 0.000
antolakuntza 67.003 0.000
gradu 66.599 0.000
gaur 63.520 0.000
hezkuntza 59.800 0.000
plastika 44.245 0.000
antropologia 43.342 0.000
eman 38.005 0.000
kirol 37.845 0.000
agregatua 37.502 0.000
adierazpen 36.221 0.000
atxiki 32.264 0.000
koordinatzaile 31.272 0.000
irakasgai 30.073 0.000
bilakaera 28.570 0.000
gorputz 26.756 0.000
ikasturte 26.302 0.000
musika 26.237 0.000
irakatsi 24.973 0.000
filosofia 21.550 0.000
klase 19.705 0.000
zuzendariorde 17.499 0.000
idazkari 15.981 0.000
zuzendari 13.971 0.000
dekanordea 13.100 0.000
atal 13.100 0.000
departamentu 12.556 0.000
literatura 12.550 0.000
urte 12.187 0.000
agregatu 10.906 0.001
2015etik 10.906 0.001
zientzien 10.902 0.001
aurrera 10.456 0.001
geroztik 10.127 0.001
haur 10.124 0.001
titular 8.734 0.003
kurtso 8.717 0.003
elkartu 8.717 0.003
asignatura 8.717 0.003
ordezkapen 8.717 0.003
lehenago 8.717 0.003
elektroniko 8.717 0.003
aktore 8.717 0.003
2008tik 8.717 0.003
2007tik 8.717 0.003
magisteritza 7.648 0.006
udal 7.498 0.006
antolatu 7.498 0.006
zerbitzu 7.498 0.006
ibili 7.498 0.006
akademiko 7.213 0.007
amaiera 7.053 0.008
esperimental 6.937 0.008
graduaren 6.532 0.011
kreditu 6.532 0.011
kontratudun 6.532 0.011
hefa 6.532 0.011
ekain 6.532 0.011
dekano 6.532 0.011
akademia 6.532 0.011
2014tik 6.532 0.011
jardun 6.143 0.013
matematika 5.958 0.015
lan 5.197 0.023
gizarte 4.097 0.043

Bistan da lexiko horrek lan egoeraz eta dozentziaz hitz egiten digula; baina zerrenda horretan badira elementu batzuk arrotzak ere ematen dutenak; deigarri egiten dira hurrengoak, behinik behin: urteak, lehenago, eman, ibili

Bigarren klaseaz… eta testu adibideak

Laburki esan dezakegu dendrograma azpiko berbba zerrendak ikusita bigarren eremua, berdezko agertzen dena, formakuntzari dagokiola. Berbok horri buruz ari dira: doktore, lizentziatu, master, unibertsitate, lizentziadun, deustu, filologi, diplomatu, psikodidaktika, pedagogi, herri, euskal, of, zientzia, doktoretza, berariazko, psikologia, ikasketa, graduatu…

Berba zerrendez gain, corpusean esaldirik adierazgarrienak ere aurkitzen ditu, lexikoan oinarrituta beti ere. Bigarren eremu honekin segituta, hauek dira lehenengo laurak, letra lodiak Iramuteqek markatuak, letra etzana nirea:

pedagogian lizentziatua naiz pedagogia terapeutikoko espezialitatea upv ehu 1996 psikopedagogian lizentziatua upv ehu 2002 haur hezkuntzan diplomatua mondragon unibertsitatean 2008 sexologian aditua alcalako unibertsitatean 2005 psikodidaktika eta hezkuntzaren psikologian masterra dut 2010 eta psikodidaktikan doktorea naiz nazioarteko aipamenarekin 2015

filosofia eta hezkuntza zientzietan lizentziatua hezkuntza berezian eta orientazio espezialitateetan 1989 salamanca unibertsitatean eta pedagogia doktorea eta 1998 y master en educación especial 1991 deustobilbao unibertsitatean

psikologian lizentziatua da deustuko unibertsitatean 1998 psikopedagogian lizentziatua uneden 2004 eta psikologian doktorea euskal herriko unibertsitatean upv ehu 2002

Urlia Abizenduna 1972 euskal filologian lizentziatua da eta euskal herriko unibertsitatean literatura konparatuan eta literatur ikasketetan doktorea

Hirugarren eta laugarren klaseak… eta planoan irudikatzea

Besteak beste, beste bi ere sumatzen dira, antzerako diskurtsoaz berba egiteko modu desberdinak.

Beste eremu bi ere identifikatu ditu eta interesekoa da ikustea nola banatzen dituen lema hauen agerrera dimentsio bitan:

Lexiko adierazgarriaren banaketa dimentsio bitan

Goiko grafiko horrek islatzen du corpusaren %78ko aldakortasuna, hor gorriz eta berdez behe eta goi agertzen dira azaldutako klaseok, biak eskumako alderdian.

Ezkerrean multzo bakar baten moduan ikusten dira ikerkuntzarekin lotutako lemak. Horien hurbileko azterketak erakusten ditu ikerkuntzaren alderdi kontrajarri bi: ikertzailea eta bere taldea eta ikertzailea eta ikertua. Hirugarren klasea urdin argiz eta laugarrena morez

Taldeez:

2011 eta 2019 bitartean ias research centre for life mind and society ikerketa taldeko kide izan da bertan eusko jaurlaritzak eta minecok finantzatutako ikerketa proiektuetan parte hartu duelarik

Eta ikertuaz:

ikastegiko kudeaketa karguetan erakutsitako inplikazioak eta esperientziak azken urteotako ikerketa lana metodologia aktiboen erabileraren zentratzea ekarri du eta bereziki pentsamendu kritikoaren ikerketa lerroak jorratzea

… eta berba-hodeia

Laugarren klaseko berba hodeia

… eta antiprofilak

Beste kontu batzuen berri ere ematen digu CHD analisiak; antiprofilak.

Laugarren klasetik aldendu barik, azterketa lexikoaren beste ezaugarri bat nabarmenduko dugu.
Koka gaitezen: Azterketa lexikoak klaseen osagaiak zehazten ditu, hori esanda egon da. Paraleloki, corpusean agertu bai baina klasean ez agertzeko joera duten elementuak ere zehazten ditu. Zerrenda horretan 4. klasean hurrengoak ez agertzeko joera dute:

Table 3: Laugarren klasearen “anti-profila”
lema ji_kar p.balioa
unibertsitate -68.13 0.00
irakasle -49.91 0.00
sail -45.94 0.00
fakultate -38.79 0.00
master -28.04 0.00
lizentziatu -24.26 0.00
doktore -23.97 0.00
kide -21.50 0.00
didaktika -21.09 0.00
talde -15.21 0.00
psikologia -14.88 0.00
gradu -13.31 0.00
euskal -12.41 0.00
filosofia -12.36 0.00
herri -12.07 0.00
antolakuntza -11.19 0.00
zientzia -10.70 0.00
jaurlaritza -8.52 0.00
lizentziadun -8.52 0.00
eusko -8.52 0.00
deustu -8.52 0.00
koordinatzaile -8.14 0.00
egun -8.09 0.00
psikodidaktika -7.39 0.01
magisteritza -7.39 0.01
atxiki -7.39 0.01
plastika -7.39 0.01
kirol -7.07 0.01
filologi -7.01 0.01
diplomatu -7.01 0.01
antropologia -6.70 0.01
gaur -6.64 0.01
pedagogi -6.26 0.01
agregatua -6.26 0.01
zuzendari -5.60 0.02
of -5.51 0.02
gorputz -5.35 0.02
departamentu -4.77 0.03
bilakaera -4.77 0.03
batzorde -4.40 0.04
ikerlari -4.40 0.04
ederr -4.40 0.04
ingeles -4.15 0.04
lortu -4.03 0.04
doktoretza -4.03 0.04
titular -4.03 0.04
teoria -4.03 0.04
derrigorrezko -4.03 0.04
berariazko -4.03 0.04
en -3.86 0.05
nazioarteko -3.86 0.05

Laugarren klase horretako antiprofiletan argi eta garbi ikus ditzakegu bigarren klaseko elementuak (master, lizentziatu, doktore), alderantzizko koadrantean irudikatu da bigarren klase hori; hala eta guztiz ere, beste bi klasetakorik ez dela falta ere bistan da (irakasle, didaktika -1. klasekoak-; kide, talde, 3. klasekoak)

Horietan elementu bat nabarmentzekoa izan daiteke psikodidaktika. Asko nabarmentzen da 2. klasean, horko masterra edo doktoratua egin dutelako askok. Baina, kontrara, ikerketa lerroari dagokion laugarren klase honetan antirpofiletan agertzen da; beraz, oso gutxik aipatzen dugu ikerketa eremu legez, antza.

Etiketak, ezaugarri kualitatibo batzuen banaketaz.

Analizatzeko corpuseko elementuak etiketa ditzakegu gure ikergaiaren arabera. Azterketa xume honetan etiketa deskribatzaile automatiko batzuk baino ez ditugu erabili:

  • Gradua, zein gradutan ematen ditu eskolak; eb: gradua_lh
  • Campusa, zein campusetan ematen dituen eskolak; eb: campus_bilbo
  • Arloa, zein sailetan edo arlotan egiten duen lan; eb: arloa_Musika_adierazpenaren_Didaktika
  • Nor, bakoitzaren abizenaren eta izenaren lehenengo hiru letrak: nor_ABA_JUA, neu, hain zuzen.

Analisia lexikoaren banaketan oinarritzen da; beraz, etiketek ez dute hartzen parte CHDren eraikuntzan, baina bai da aztertzen zelan banatzen diren CHDk zehaztutako klase horietan. Hhurrengo irudian ikus dezakegu nola banatzen diren etiketok, baldin eta klase batekiko \(\chi^2\) balioaren p-balioa 0.1 baino baxuagoa bada (gogoan izan 0.05etik behera hartzen dugula adierazgarritzat).

Etketen banaketa CHD-ren planoan

Eta hor zer ikusten dugun pentsatu duzu?

Idatzi sail batzuetan klase bat besteen gainetik nabarmentzen dela ikusten dugu. Argi eta garbi norbanakoen etiketak gehiago nabarmentzen dira besteen gainean. Eta zenbat eta zabalagoa izan barne hartzen duen ekarpen kopurua, 0,0 koordenadetatik hurbilago egoteak bereizmen kalitate baxuagoa duela ere adierazten digu

  1. klasea, gorrizko markatua:
    Gradua: LH. Planoaren erditik oso hurbil eta tamaina p-balio altua. Gehixeago erabiltzen da klase horri dagokion lexikoa besteena baino. Baina denetarik erabiliko dela pentsatzekoa da (eta hala da) Arloa: Musika Adierazpenaren Didaktika. Letraren tamaina handiagoak adierazten du klasearekiko atxikimendu handiagoa duela bertako lexikoak, baina planoko kokapenak ere laugarren klasearekiko hurbiltasuna adierazten du. Nor: URR-ITZ, KOR-JON Bistan da etiketa hori duten irakasle-ikertzaileek lexiko horrekiko atxikimendu handia dutela, bai letraren tamainak \(\chi^2\)aren balio handia adierazten duelako, baita ere kokapenagatik
  2. klasea, berdezko markatua: Arloa: Euskal Filologia da klase horretan nabarmentzen den arlo bakarra. Kokapenak 3. klasetiko hurbiltasuna ere adierazten du. Nor: MEJ-GAI eta ALO-REB
  3. klasea, urdin argiz markatua:
    Gradua: HH Arloa: Plastika Adierazpenaren Didaktika Nor: GAR-URT eta APE-MAI
  4. klasea, morez markatua:
    Arloa: Matematikaren Didaktika Nor: CAM-TER eta ANA-JON

Aipatzeke ez dadila geratu antiprofilen kalkuluan ere sartzen direla etiketok; beraz, azterketan dena delako etiketak zein klasetan duen presentziarik baxuena ere ikusgai dago:

Esate baterako, laugarren klasean HHko graduan ari diren irakasleek lexiko-atxikimendu baxua erakutsi dutela ere ikusten da.

Mugetan

Euskarazko hiztegi edo lexikoari berari begirakoak dira hurrengook.

Iramuteqek estatistiko deskribatzaile batzuk ematen ditu, analisiei ekin aurretik aztertu eta hobeto prestatzeko analisirako parametroak, esate baterako, erabilgarri izan daiteke informazio hori.

Denera aztertutako testu unitateak 1329 dira, 20238 gertaldi identifikatzen dira eta formak eurak 3918 dira.

Horrez gainera hapax izenez identifikatzen ditu. Hapaxak dira behin baino gehiagotan agertzen ez diren elementuak eta sailkapen honetan 2374 dira.

Hurrengo taulan horren lagin bat dago, elementu batzuei buruzko hausnarketa bideratzeko aitzakiatzat.

Table 4: Behin aurkitutakoak
hapax upos
1 abian adv
2 abierta nom
3 abisal pro_per
4 abuztu nom
5 académico nr
6 ace pro_per
7 acercamiento nr
8 acontecimiento nr
9 acquisiti DET
10 activamente nr
11 actividad nr
12 activo nr
13 actual nom
14 adelaide nr
15 adelaidekin nr
16 adelaiden nr
17 además adj
18 adi adv
19 adibide nom
20 adierazpemaren nr
21 adingabe nr
22 adolescentes nr
23
24 aitortuan nr
25 aitortuta ver
26 aizpuru pro_per
27 akademiaantolakuntzako nr
28 akademikoafilosofian nr
29 akademikoafrantses nr
30 akmeka nr
31 akonpainamendu nr
32 akreditatu ver
33 akreditatua nr
34 akreditatuta nr
35 akreditatutako nr
36 akreditatzen nr
37 akreditazioahizkuntztitulu nr
38
39 argentina pro_per
40 argirtaratu nr
41 argitaletxearen nom
42 argitaragabe adj
43 argitaralpenak nr
44 argitarat nr
45 arguiñano pro_per
46 argumentazio nom
47 argumentaziorako nr
48 aribidean nr
49
  • Euskaraz egon behar lukeen hainbat testu gaztelaniaz idatzia da, bistan denez; horrek eragiten du gaztelaniazko forma guztiak banan banan aztertzea eta horra goiko zerrenda horretako hainbaten azalpena.

  • Lexikoak ondo sailkatu gabeko formak. 32tik 36rainoko forma guztiak, esate baterako akredita lemaren baitan har litezke; baina lexikoan ez daudenez, horien pisua desagertu egiten da analisian. Esan dezakegu akreditazioak gure kasuan garrantzia duen arren, analisiak ez diola eutsi.

  • Lexikoan elementu berriak sartzeko bidea aztertu behar da

Erreferentziak

Ratinaud, P., & Déjean, S. (2009). IRaMuTeQ: implémentation de la méthode ALCESTE d’analyse de texte dans un logiciel libre. Modélisation appliquée aux sciences humaines et sociales MASHS, 8–9.

Reinert, M. (1990). Alceste une méthodologie d’analyse des données textuelles et une application: Aurelia De Gerard De Nerval. Bulletin of Sociological Methodology/Bulletin de Méthodologie Sociologique, 26(1), 24–54. https://doi.org/10/cbhfwp


Erankinak

Lehengo eguneko aurkezpena eta hurrengo pausu batzuk

Tintontzian eta hurrengoetarako

Hemen sailkapen bakarra erakusten da, adierazgarrientzat hartu duguna. Baina sailkapen xeheago batzuk ere egin dira eta emaitza interesgarriak (?) ere aurkitu dira hor.

Blogeko mezu honetan analisi baten alderdi batzuk erakutsi dira, zatika. Baina oraindik erakusteke dago Iramuteq euskaraz erabiltzeko lexikoa bera, eraikuntza prozesua, hobekuntzarako proposamena… Beste baterako.


  1. Interface de R pour l’Analyse Multidimentionel des Textes et Questionaires; hots, testu eta galdetegien dimentsio anitzeko analisia egiteko Rrako interface-a↩︎