Bilbo | Donostia | Gasteiz | |
---|---|---|---|
denera | 116 | 90 | 92 |
deskribatuak | 80 | 47 | 44 |
…edo Iramuteq euskaraz erabiltzen hasita
Lehengo astean aurkeztu genuen, azkenik, Iramuteq-erako euskarazko lexikoa (post honen amaieran daude diapositibak). Horren aitzakiaz, aurkezpen horretan erakutsi genuen analisi bat aztergai dakargu hona. Sakonxeago, ez sakonegi. Zelan edo halan esateko, emaitzaren lau alderdi nagusietan dimentsio bat azaltzen da hemendik haurrera:
Honela egituratu dut testua: hasieran metodologiaz ohartxuren bat; gero, corpusaren deskribapena; hurrengo, tartea egindako sailkapenaren laburpena, emaitzen lagin batzuekin, klaseko mota bat, sailkapenaren azpi atalaren bukaeran ezaugarri kualitatiboen banaketa ere azaltzen da; azken atalean aurkitutako muga batzuk aipatzen dira eta erreferentziak. Eranskintzat, lehengo eguneko aurkezpena
Irakurle! Begira zer agertu den corpus hau aztertuta!
Metodologiaz
Corpusa aztertzeko Iramuteq1 (Ratinaud, 2009) erabili dugu, Beheranzko Sailkatze Hierarkikoa erabilita (CHD, Classification Hierarchique Descendante).
Oinarrizko hipotesia hau da: corpusaren baitako diskurtsoa matematikoki modeliza daitekeela. Corpusa esanahi-unitateetan bana daitekeela eta unitate horretako elementu lexikal bakoitzak bere testuinguruak definitzen duela. Horra iritsita, testuinguru klaseak identifika litezke, lexiko jakin batek zehaztuta; baldin eta unitateen (esaldien) elementuak (lexikoa) taldekatzen baditugu.
Zelan taldekatu, baina? Horra On Reinerten ekarpena: dimentsio anitzeko teknikak erabilita: gorago aipatutako CHD hori; oinarritzat presentzia/absentzia matrize erraldoia du, zutabeetan lexiko unitate bakoitza eta lerroetan testu unitate bakoitza.
❓ 😒
Corpusa
Corpus batek diskurtso baten hegal batzuk osatuko duelako ustean, corpus bat batu behar da: UPV/EHUko Haur Hezkuntzako Graduan eta Lehen Hezkuntzako Graduan eskolak ematen dituztenek euren burua unibertsitatearen aurrean azaltzeko idatzitakoa.
UPV/EHUko Haur Hezkuntza edo Lehen Hezkuntza graduetan klaseak ematen ditugunoi pasa den urtean eskatu ziguten gure azalpen fitxa bat osatzea. Hemen nirea 🤐
Aurreko taula horretan ikusten da irakasle guztiok ez dugula bete eskatutako hori, baina erdiak baino gehiago egin duenez, nahikotzat hartu beharko.
Denera irakasle eta ikertzaile kontratua duten UPV/EHUko 171 deskribapen hartu eta Iramuteq horri eskatu diogu corpus horren barruan dauden ikuskerak identifikatzea. Zehatzago eta hobeto esanda, eskatu diogu lexikoaren erabileraren araberako sailkapena egitea.
Sailkapena
Hona lehenengo sailkapena, Reinertek asmatutako ALCESTE metodoa erabilita (Reinert, 1990).
Eta hori 🆙 zelan interpretatu behar da?
Ba, lexiko multzo bakoitzak berori erabilita iradokitzen den mundu-lexikal bati buruz egiten digu berba. Horrela, gorriz agertzen denak gure irakaskuntza-alderdiaz idatzi dugunari buruz dirautsagula ematen du. Izan ere, hor ditugun hitz batzuk beste multzoetan baino nabarmen gehiago agertzen dira multzo horretan. Atxikipen horren balio kuantitatibotzat Iramuteqek ematen dizkigu \(\chi^2\)aren balioa eta horri dagokion p-balioa.
Lehenengo klaseaz… eta lexiko adierazgarria
Segidan lehenengo eremu edo klase horri dagozkion hitzak aurkezten ditugu gordinik, hau da, garbiketarik egin gabe.
lema | ji_karratua | p.balioa |
---|---|---|
irakasle | 255.255 | 0.000 |
sail | 207.802 | 0.000 |
fakultate | 203.690 | 0.000 |
didaktika | 161.341 | 0.000 |
egun | 81.522 | 0.000 |
eskola | 75.913 | 0.000 |
antolakuntza | 67.003 | 0.000 |
gradu | 66.599 | 0.000 |
gaur | 63.520 | 0.000 |
hezkuntza | 59.800 | 0.000 |
plastika | 44.245 | 0.000 |
antropologia | 43.342 | 0.000 |
eman | 38.005 | 0.000 |
kirol | 37.845 | 0.000 |
agregatua | 37.502 | 0.000 |
adierazpen | 36.221 | 0.000 |
atxiki | 32.264 | 0.000 |
koordinatzaile | 31.272 | 0.000 |
irakasgai | 30.073 | 0.000 |
bilakaera | 28.570 | 0.000 |
gorputz | 26.756 | 0.000 |
ikasturte | 26.302 | 0.000 |
musika | 26.237 | 0.000 |
irakatsi | 24.973 | 0.000 |
filosofia | 21.550 | 0.000 |
klase | 19.705 | 0.000 |
zuzendariorde | 17.499 | 0.000 |
idazkari | 15.981 | 0.000 |
zuzendari | 13.971 | 0.000 |
dekanordea | 13.100 | 0.000 |
atal | 13.100 | 0.000 |
departamentu | 12.556 | 0.000 |
literatura | 12.550 | 0.000 |
urte | 12.187 | 0.000 |
agregatu | 10.906 | 0.001 |
2015etik | 10.906 | 0.001 |
zientzien | 10.902 | 0.001 |
aurrera | 10.456 | 0.001 |
geroztik | 10.127 | 0.001 |
haur | 10.124 | 0.001 |
titular | 8.734 | 0.003 |
kurtso | 8.717 | 0.003 |
elkartu | 8.717 | 0.003 |
asignatura | 8.717 | 0.003 |
ordezkapen | 8.717 | 0.003 |
lehenago | 8.717 | 0.003 |
elektroniko | 8.717 | 0.003 |
aktore | 8.717 | 0.003 |
2008tik | 8.717 | 0.003 |
2007tik | 8.717 | 0.003 |
magisteritza | 7.648 | 0.006 |
udal | 7.498 | 0.006 |
antolatu | 7.498 | 0.006 |
zerbitzu | 7.498 | 0.006 |
ibili | 7.498 | 0.006 |
akademiko | 7.213 | 0.007 |
amaiera | 7.053 | 0.008 |
esperimental | 6.937 | 0.008 |
graduaren | 6.532 | 0.011 |
kreditu | 6.532 | 0.011 |
kontratudun | 6.532 | 0.011 |
hefa | 6.532 | 0.011 |
ekain | 6.532 | 0.011 |
dekano | 6.532 | 0.011 |
akademia | 6.532 | 0.011 |
2014tik | 6.532 | 0.011 |
jardun | 6.143 | 0.013 |
matematika | 5.958 | 0.015 |
lan | 5.197 | 0.023 |
gizarte | 4.097 | 0.043 |
Bistan da lexiko horrek lan egoeraz eta dozentziaz hitz egiten digula; baina zerrenda horretan badira elementu batzuk arrotzak ere ematen dutenak; deigarri egiten dira hurrengoak, behinik behin: urteak, lehenago, eman, ibili…
Bigarren klaseaz… eta testu adibideak
Laburki esan dezakegu dendrograma azpiko berbba zerrendak ikusita bigarren eremua, berdezko agertzen dena, formakuntzari dagokiola. Berbok horri buruz ari dira: doktore, lizentziatu, master, unibertsitate, lizentziadun, deustu, filologi, diplomatu, psikodidaktika, pedagogi, herri, euskal, of, zientzia, doktoretza, berariazko, psikologia, ikasketa, graduatu…
Berba zerrendez gain, corpusean esaldirik adierazgarrienak ere aurkitzen ditu, lexikoan oinarrituta beti ere. Bigarren eremu honekin segituta, hauek dira lehenengo laurak, letra lodiak Iramuteqek markatuak, letra etzana nirea:
pedagogian lizentziatua naiz pedagogia terapeutikoko espezialitatea upv ehu 1996 psikopedagogian lizentziatua upv ehu 2002 haur hezkuntzan diplomatua mondragon unibertsitatean 2008 sexologian aditua alcalako unibertsitatean 2005 psikodidaktika eta hezkuntzaren psikologian masterra dut 2010 eta psikodidaktikan doktorea naiz nazioarteko aipamenarekin 2015
filosofia eta hezkuntza zientzietan lizentziatua hezkuntza berezian eta orientazio espezialitateetan 1989 salamanca unibertsitatean eta pedagogia doktorea eta 1998 y master en educación especial 1991 deustobilbao unibertsitatean
psikologian lizentziatua da deustuko unibertsitatean 1998 psikopedagogian lizentziatua uneden 2004 eta psikologian doktorea euskal herriko unibertsitatean upv ehu 2002
Urlia Abizenduna 1972 euskal filologian lizentziatua da eta euskal herriko unibertsitatean literatura konparatuan eta literatur ikasketetan doktorea
Hirugarren eta laugarren klaseak… eta planoan irudikatzea
Besteak beste, beste bi ere sumatzen dira, antzerako diskurtsoaz berba egiteko modu desberdinak.
Beste eremu bi ere identifikatu ditu eta interesekoa da ikustea nola banatzen dituen lema hauen agerrera dimentsio bitan:
Goiko grafiko horrek islatzen du corpusaren %78ko aldakortasuna, hor gorriz eta berdez behe eta goi agertzen dira azaldutako klaseok, biak eskumako alderdian.
Ezkerrean multzo bakar baten moduan ikusten dira ikerkuntzarekin lotutako lemak. Horien hurbileko azterketak erakusten ditu ikerkuntzaren alderdi kontrajarri bi: ikertzailea eta bere taldea eta ikertzailea eta ikertua. Hirugarren klasea urdin argiz eta laugarrena morez
Taldeez:
2011 eta 2019 bitartean ias research centre for life mind and society ikerketa taldeko kide izan da bertan eusko jaurlaritzak eta minecok finantzatutako ikerketa proiektuetan parte hartu duelarik
Eta ikertuaz:
ikastegiko kudeaketa karguetan erakutsitako inplikazioak eta esperientziak azken urteotako ikerketa lana metodologia aktiboen erabileraren zentratzea ekarri du eta bereziki pentsamendu kritikoaren ikerketa lerroak jorratzea
… eta berba-hodeia
… eta antiprofilak
Beste kontu batzuen berri ere ematen digu CHD analisiak; antiprofilak.
Laugarren klasetik aldendu barik, azterketa lexikoaren beste ezaugarri bat nabarmenduko dugu.
Koka gaitezen: Azterketa lexikoak klaseen osagaiak zehazten ditu, hori esanda egon da. Paraleloki, corpusean agertu bai baina klasean ez agertzeko joera duten elementuak ere zehazten ditu. Zerrenda horretan 4. klasean hurrengoak ez agertzeko joera dute:
lema | ji_kar | p.balioa |
---|---|---|
unibertsitate | -68.13 | 0.00 |
irakasle | -49.91 | 0.00 |
sail | -45.94 | 0.00 |
fakultate | -38.79 | 0.00 |
master | -28.04 | 0.00 |
lizentziatu | -24.26 | 0.00 |
doktore | -23.97 | 0.00 |
kide | -21.50 | 0.00 |
didaktika | -21.09 | 0.00 |
talde | -15.21 | 0.00 |
psikologia | -14.88 | 0.00 |
gradu | -13.31 | 0.00 |
euskal | -12.41 | 0.00 |
filosofia | -12.36 | 0.00 |
herri | -12.07 | 0.00 |
antolakuntza | -11.19 | 0.00 |
zientzia | -10.70 | 0.00 |
jaurlaritza | -8.52 | 0.00 |
lizentziadun | -8.52 | 0.00 |
eusko | -8.52 | 0.00 |
deustu | -8.52 | 0.00 |
koordinatzaile | -8.14 | 0.00 |
egun | -8.09 | 0.00 |
psikodidaktika | -7.39 | 0.01 |
magisteritza | -7.39 | 0.01 |
atxiki | -7.39 | 0.01 |
plastika | -7.39 | 0.01 |
kirol | -7.07 | 0.01 |
filologi | -7.01 | 0.01 |
diplomatu | -7.01 | 0.01 |
antropologia | -6.70 | 0.01 |
gaur | -6.64 | 0.01 |
pedagogi | -6.26 | 0.01 |
agregatua | -6.26 | 0.01 |
zuzendari | -5.60 | 0.02 |
of | -5.51 | 0.02 |
gorputz | -5.35 | 0.02 |
departamentu | -4.77 | 0.03 |
bilakaera | -4.77 | 0.03 |
batzorde | -4.40 | 0.04 |
ikerlari | -4.40 | 0.04 |
ederr | -4.40 | 0.04 |
ingeles | -4.15 | 0.04 |
lortu | -4.03 | 0.04 |
doktoretza | -4.03 | 0.04 |
titular | -4.03 | 0.04 |
teoria | -4.03 | 0.04 |
derrigorrezko | -4.03 | 0.04 |
berariazko | -4.03 | 0.04 |
en | -3.86 | 0.05 |
nazioarteko | -3.86 | 0.05 |
Laugarren klase horretako antiprofiletan argi eta garbi ikus ditzakegu bigarren klaseko elementuak (master, lizentziatu, doktore), alderantzizko koadrantean irudikatu da bigarren klase hori; hala eta guztiz ere, beste bi klasetakorik ez dela falta ere bistan da (irakasle, didaktika -1. klasekoak-; kide, talde, 3. klasekoak)
Horietan elementu bat nabarmentzekoa izan daiteke psikodidaktika. Asko nabarmentzen da 2. klasean, horko masterra edo doktoratua egin dutelako askok. Baina, kontrara, ikerketa lerroari dagokion laugarren klase honetan antirpofiletan agertzen da; beraz, oso gutxik aipatzen dugu ikerketa eremu legez, antza.
Etiketak, ezaugarri kualitatibo batzuen banaketaz.
Analizatzeko corpuseko elementuak etiketa ditzakegu gure ikergaiaren arabera. Azterketa xume honetan etiketa deskribatzaile automatiko batzuk baino ez ditugu erabili:
- Gradua, zein gradutan ematen ditu eskolak; eb:
gradua_lh
- Campusa, zein campusetan ematen dituen eskolak; eb:
campus_bilbo
- Arloa, zein sailetan edo arlotan egiten duen lan; eb:
arloa_Musika_adierazpenaren_Didaktika
- Nor, bakoitzaren abizenaren eta izenaren lehenengo hiru letrak:
nor_ABA_JUA
, neu, hain zuzen.
Analisia lexikoaren banaketan oinarritzen da; beraz, etiketek ez dute hartzen parte CHDren eraikuntzan, baina bai da aztertzen zelan banatzen diren CHDk zehaztutako klase horietan. Hhurrengo irudian ikus dezakegu nola banatzen diren etiketok, baldin eta klase batekiko \(\chi^2\) balioaren p-balioa 0.1 baino baxuagoa bada (gogoan izan 0.05etik behera hartzen dugula adierazgarritzat).
Eta hor zer ikusten dugun pentsatu duzu?
Idatzi sail batzuetan klase bat besteen gainetik nabarmentzen dela ikusten dugu. Argi eta garbi norbanakoen etiketak gehiago nabarmentzen dira besteen gainean. Eta zenbat eta zabalagoa izan barne hartzen duen ekarpen kopurua, 0,0
koordenadetatik hurbilago egoteak bereizmen kalitate baxuagoa duela ere adierazten digu
- klasea, gorrizko markatua:
Gradua:LH
. Planoaren erditik oso hurbil eta tamaina p-balio altua. Gehixeago erabiltzen da klase horri dagokion lexikoa besteena baino. Baina denetarik erabiliko dela pentsatzekoa da (eta hala da) Arloa:Musika Adierazpenaren Didaktika
. Letraren tamaina handiagoak adierazten du klasearekiko atxikimendu handiagoa duela bertako lexikoak, baina planoko kokapenak ere laugarren klasearekiko hurbiltasuna adierazten du. Nor:URR-ITZ
,KOR-JON
Bistan da etiketa hori duten irakasle-ikertzaileek lexiko horrekiko atxikimendu handia dutela, bai letraren tamainak \(\chi^2\)aren balio handia adierazten duelako, baita ere kokapenagatik - klasea, berdezko markatua: Arloa:
Euskal Filologia
da klase horretan nabarmentzen den arlo bakarra. Kokapenak 3. klasetiko hurbiltasuna ere adierazten du. Nor:MEJ-GAI
etaALO-REB
- klasea, urdin argiz markatua:
Gradua:HH
Arloa:Plastika Adierazpenaren Didaktika
Nor:GAR-URT
etaAPE-MAI
- klasea, morez markatua:
Arloa:Matematikaren Didaktika
Nor:CAM-TER
etaANA-JON
Aipatzeke ez dadila geratu antiprofilen kalkuluan ere sartzen direla etiketok; beraz, azterketan dena delako etiketak zein klasetan duen presentziarik baxuena ere ikusgai dago:
Esate baterako, laugarren klasean HHko graduan ari diren irakasleek lexiko-atxikimendu baxua erakutsi dutela ere ikusten da.
Mugetan
Euskarazko hiztegi edo lexikoari berari begirakoak dira hurrengook.
Iramuteqek estatistiko deskribatzaile batzuk ematen ditu, analisiei ekin aurretik aztertu eta hobeto prestatzeko analisirako parametroak, esate baterako, erabilgarri izan daiteke informazio hori.
Denera aztertutako testu unitateak 1329 dira, 20238 gertaldi identifikatzen dira eta formak eurak 3918 dira.
Horrez gainera hapax izenez identifikatzen ditu. Hapaxak dira behin baino gehiagotan agertzen ez diren elementuak eta sailkapen honetan 2374 dira.
Hurrengo taulan horren lagin bat dago, elementu batzuei buruzko hausnarketa bideratzeko aitzakiatzat.
hapax | upos | |
---|---|---|
1 | abian | adv |
2 | abierta | nom |
3 | abisal | pro_per |
4 | abuztu | nom |
5 | académico | nr |
6 | ace | pro_per |
7 | acercamiento | nr |
8 | acontecimiento | nr |
9 | acquisiti | DET |
10 | activamente | nr |
11 | actividad | nr |
12 | activo | nr |
13 | actual | nom |
14 | adelaide | nr |
15 | adelaidekin | nr |
16 | adelaiden | nr |
17 | además | adj |
18 | adi | adv |
19 | adibide | nom |
20 | adierazpemaren | nr |
21 | adingabe | nr |
22 | adolescentes | nr |
23 | … | … |
24 | aitortuan | nr |
25 | aitortuta | ver |
26 | aizpuru | pro_per |
27 | akademiaantolakuntzako | nr |
28 | akademikoafilosofian | nr |
29 | akademikoafrantses | nr |
30 | akmeka | nr |
31 | akonpainamendu | nr |
32 | akreditatu | ver |
33 | akreditatua | nr |
34 | akreditatuta | nr |
35 | akreditatutako | nr |
36 | akreditatzen | nr |
37 | akreditazioahizkuntztitulu | nr |
38 | … | … |
39 | argentina | pro_per |
40 | argirtaratu | nr |
41 | argitaletxearen | nom |
42 | argitaragabe | adj |
43 | argitaralpenak | nr |
44 | argitarat | nr |
45 | arguiñano | pro_per |
46 | argumentazio | nom |
47 | argumentaziorako | nr |
48 | aribidean | nr |
49 | ... | ... |
Euskaraz egon behar lukeen hainbat testu gaztelaniaz idatzia da, bistan denez; horrek eragiten du gaztelaniazko forma guztiak banan banan aztertzea eta horra goiko zerrenda horretako hainbaten azalpena.
Lexikoak ondo sailkatu gabeko formak. 32tik 36rainoko forma guztiak, esate baterako akredita lemaren baitan har litezke; baina lexikoan ez daudenez, horien pisua desagertu egiten da analisian. Esan dezakegu akreditazioak gure kasuan garrantzia duen arren, analisiak ez diola eutsi.
Erreferentziak
Ratinaud, P., & Déjean, S. (2009). IRaMuTeQ: implémentation de la méthode ALCESTE d’analyse de texte dans un logiciel libre. Modélisation appliquée aux sciences humaines et sociales MASHS, 8–9.
Reinert, M. (1990). Alceste une méthodologie d’analyse des données textuelles et une application: Aurelia De Gerard De Nerval. Bulletin of Sociological Methodology/Bulletin de Méthodologie Sociologique, 26(1), 24–54. https://doi.org/10/cbhfwp
Erankinak
Lehengo eguneko aurkezpena eta hurrengo pausu batzuk
Tintontzian eta hurrengoetarako
Hemen sailkapen bakarra erakusten da, adierazgarrientzat hartu duguna. Baina sailkapen xeheago batzuk ere egin dira eta emaitza interesgarriak (?) ere aurkitu dira hor.
Blogeko mezu honetan analisi baten alderdi batzuk erakutsi dira, zatika. Baina oraindik erakusteke dago Iramuteq euskaraz erabiltzeko lexikoa bera, eraikuntza prozesua, hobekuntzarako proposamena… Beste baterako.
Oin oharrak
Interface de R pour l’Analyse Multidimentionel des Textes et Questionaires; hots, testu eta galdetegien dimentsio anitzeko analisia egiteko Rrako interface-a↩︎