MIKKO RAHIKKA

The electrical things have their lives too, paltry as those lives are.


Lukukauden 2025-2026 ylioppilaiden jakaumia – tytöt sokerista ja pojat etanoista

Tytöt menestyvät keskimäärin poikia paremmin ylioppilaskokeessa. Muutamassa harvassa aineessa pojilla on parempi keskiarvo kuin tytöillä. Onko syy koulussa, pojissa, kännyköissä, wokessa, pelaamisessa, opetussuunnitelmassa, opettajissa, yhteiskunnassa, vanhemmuudessa, tähtien asennossa vai missä? Tai sitten tytöt vaan ovat parempia. En tiedä. Silti jotain tarttis varmaan tehdä. Käsittelen tässä syksyn ja kevään eli koko lukuvuoden ylioppilaiden tuloksia.

Olen laskeskellut ylioppilaskokelaiden arvosanajakaumia vuoden 2022 keväästä alkaen. Linkki edellisiin artikkeleihin löytyy artikkelin lopusta. Siellä on myös taulukko oppiainekoodeista. 

lukuVuoden 2025-2026 ylioppilaiden arvosanoista

Ylioppilastutkintolautakunnan julkaisemissa tiedostoissa on paljon ylioppilaskohtaista tietoa: koulu, sukupuoli, opetuskieli, puoltoäänien lukumäärä ja eri oppiaineiden arvosanat.  Kun yhdistin syksyn 25 ja kevään 26 ylioppilasarvosanatiedostot, niin taulukossa oli 31777 riviä ja 51 saraketta. Aineisto sisältää tiedot keväällä ja syksyllä valmistuneista ylioppilaista.

Aiemmasta poiketen lisään kuvaajiin aikasarjoja menneisyydestä, lukuvuodesta 2014-2015 lähtien. Aikasarjakuvaajissa vaaka-akselin vuosiluku on lukukauden päättymisvuosi eli lukuvuosi 2025-2026 merkitään luvulla 2026.

Tänä vuonna valmistui 31776 ylioppilasta. Heistä tyttöjä oli 18316 (58 %) ja poikia 13460 (42 %). Puoltoäänien keskiarvo oli tytöillä 23,8 ja pojilla 22,5. Tytöillä puoltoäänien keskiarvo oli 1,3 arvosanaa parempi kuin pojilla. Tytöt kirjoittivat keskimäärin 5,5 ja pojat 5,3 ainetta. Suurin puoltoäänien määrä pojilla oli 116 (Ressun lukiossa) ja tytöillä 75 (Lahden yhteislyseon lukiossa). Tässä yhteydessä huomasin, että YTL:n tiedostossa tuo luku 116 yht-sarakkeessa oli muuttunut **-merkeiksi. Se aiheutti hieman ongelmia alkuperäisen koodin kanssa. Tämä aiheutti tietysti myös pienen virheen Ressun tulokseen edellisessä artikkelissani. Niinpä puoltoäänet-kuvassa ei vaaka-akseli jatku yli sadan.

Ylioppilasarvosanojen keskiarvo (puoltoäänien summa/kirjoitettujen aineiden määrä) oli tytöillä 4,35 ja pojilla 4,18. Puoltoäänien, kirjoitettujen aineiden lukumäärän ja keskiarvojen erotukset tyttöjen ja poikien välillä olivat tilastollisesti erittäin merkitseviä (p < 0,001).

Stacked histogram comparing half-tone voice counts of male and female university students aged 25-26, with females in red and males in blue and their average values labeled

Alla on listattu 10 suosituinta ainetta. Lisää tietoa eri aineista löytyy lukumäärä, keskiarvo ja erotus -taulukosta.

aineiden arvosanajakaumia

Tein arvosanajakaumat niille aineille, joita oli kirjoitettu yli 5000 kertaa. Tällaisia aineita olivat: EA, A, N, M, YH, TE, PS, BB, BI, HI, FY, KE.

Pitkä englanti on yksi niistä harvoista anineista, joissa pojat menestyvät keskimäärin paremmin kuin tytöt. Tänä vuonna poikien keskiarvo oli 0,38 arvosanaa parempi kuin tytöillä. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001).

Äidinkielessä tyttöjen keskiarvo oli 0,71 arvosanaa parempi kuin pojilla. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001).

Lyhyessä matikassa poikien keskiarvo oli 0,12 arvosanaa suurempi kuin tyttöjen. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001).

Pitkässä matikassa poikien keskiarvo oli 0,32 arvosanaa parempi kuin tytöillä. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001).

Yhteiskuntaopissa tyttöjen keskiarvo oli 0,36 arvosanaa parempi kuin pojilla. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001).

Terveystietoisien tyttöjen keskiarvo oli 0,90 arvosanaa parempi kuin pojilla. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001). Tämä on suurin erotus kirjoitetuissa aineissa. Terveystietoa kirjoitti 6636 tyttöä ja 2818 poikaa.

Psykologiassa tyttöjen keskiarvo oli 0,66 arvosanaa parempi kuin pojilla. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001).

Keskipitkässä ruotsissa tyttöjen keskiarvo oli 0,16 arvosanaa parempi kuin pojilla. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001).

Biologiassa tyttöjen keskiarvo oli 0,05 arvosanaa parempi kuin pojilla eli melkein sama.

Historiassa tyttöjen keskiarvo oli 0,44 arvosanaa parempi kuin pojilla. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001).

Fysiikassa poikien keskiarvo oli 0,09 arvosanaa parempi kuin tytöillä eli arvosanakeskiarvo on lähes sama tytöillä ja pojilla.

Kemiassa poikien keskiarvo oli 0,27 arvosanaa parempi kuin tytöillä. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001).

lukumäärät, keskiarvot ja keskihajonnat aineittain taulukkona

Alla on taulukko eri aineiden kirjoittaneiden lukumääristä, keskiarvoista ja keskihajonnoista. Aineet on järjestetty yhteensä-sarakkeen mukaiseen järjestykseen.

Taulukon vasemman sarakkeen yht tarkoittaa puoltoäänien summaa, lkm kirjoitettujen aineiden lukumäärää ja muut oppiaineita. Oppiainekoodit löytyvät artikkelin lopusta.

p lkmp keskiarvop keskihajontat lkmt keskiarvot keskihajontaerotus
yht1345922,487,681831623,817,941,32
EA129194,581,45167234,201,57-0,38
A116753,751,47160124,461,380,71
N66944,041,4195493,911,42-0,12
M63624,781,4163294,461,39-0,32
YH55764,081,4745184,421,480,35
TE28183,421,3666364,331,470,91
PS14773,651,4977894,311,430,66
BB23784,101,6467824,311,580,21
BI19464,451,5152734,501,490,05
HI41544,141,4926204,571,450,44
FY43824,651,4220254,561,37-0,09
KE26694,861,5032994,601,50-0,27
GE19573,951,4517974,371,480,42
O9963,321,4312204,101,280,78
FF9224,371,5912034,351,45-0,03
UE5563,901,5813974,371,440,46
A57834,161,4310734,461,450,30
EC3763,991,587764,061,540,06
BA3174,831,468044,551,71-0,27
SC4544,581,506514,851,430,27
CA4734,561,275655,021,380,47
PC2314,791,557224,981,400,19
CB4164,661,615074,621,60-0,03
FC1304,761,464504,761,48-0,01
VA2096,300,913316,330,910,03
SA1795,101,302235,341,230,24
ET993,991,672294,141,500,15
FA1004,851,501894,831,48-0,02
VC815,191,561305,281,570,10
PA545,541,161175,671,160,13
TC275,331,52675,601,630,26
L1105,701,49305,501,61-0,20
O5114,181,33194,161,30-0,02
UO93,782,17143,361,39-0,42
GC42,502,08185,331,282,83
DC23,001,41103,101,200,10
Z34,331,1554,400,890,07
I12,0026,500,714,50
IC33,670,580
lkm134605,310,60183165,470,680,16

keskiarvojen erotus ja t-testi koko vuosi

Laskin kaikista aineista Studentin t-testin keskiarvon erotuksista. Sen avulla voi selvittää, missä aineissa keskiarvot poikkeavat toisistaan tilastollisesti merkitsevästi. Minä käytän varmuuden vuoksi merkitsevyyden mittana p-arvoa 0,001, jota pienemmät p-arvot tarkoittavat sitä, että keskiarvojen erotus on tilastollisesti erittäin merkitsevä. 

Tänä lukuvuonna tytöillä oli tilastollisesti erittäin merkitsevästi (p < 0.001) paremmat keskiarvot verrattuna poikiin seuraavissa aineissa: terveystieto (0,91) , äidinkieli ruotsi (0,78), äidinkieli suomi (0,71), psykologia (0,65), suomi pitkä oppimäärä (0,47), evankelis-luterilainen uskonto (0,45), historia (0,44), maantiede (0,42), yhteiskuntaoppi (0,35) ja suomi toisena kielenä (0,30). Lisäksi puoltoäänien määrän erotus (1,32)  ja kirjoitettujen aineiden lukumäärien erotus (0,16) olivat tilastollisesti erittäin merkitseviä.

Pojat menestyivät tyttöjä paremmin tilastollisesti merkitsevästi seuraavissa aineissa: pitkä englanti (0,38), pitkä matematiikka (0,32), kemia (0,26) ja lyhyt matematiikka (0,12).

Alla oleva taulukko on laskettu Pythonin scipy.stats-kirjaston ttest_ind-funktiolla. Mikäli sarakkeen p-arvo on pienempi kuin 0,001 on kyseessä tilastollisesti erittäin merkitsevä ero. P-arvot, joissa on merkintä 0,0000 ovat pienempiä kuin 0,001.

Lisäsin  t-testikoodin tuottamaan taulukkoon keskiarvojen erotukset ja järjestin erotuksen mukaiseen järjestykseen. Vasemmanpuoleisissa aineissa tytöt olivat ”parempia” kuin pojat  ja oikealla  pojat olivat ”parempia”.

Tytöillä parempiPojilla parempi
aineerotusp-arvoaineerotusp-arvo
I4,5000FA-0,01930,9169
GC2,83330,0673O5-0,02390,9623
TE0,90900,0000FF-0,02590,6995
O0,77740,0000CB-0,03490,7425
A0,70840,0000FY-0,08800,0182
PS0,65500,0000N-0,12420,0000
CA0,46700,0000L1-0,20000,7240
UE0,46360,0000KE-0,26570,0000
HI0,43660,0000BA-0,27300,0076
GE0,42140,0000M-0,31890,0000
YH0,34630,0000EA-0,38150,0000
A50,30330,0000UO-0,42060,6139
SC0,27320,0025
TC0,26370,4597
SA0,23580,0645
BB0,21340,0000
PC0,19260,0928
lkm0,15700,0000
ET0,14550,4563
PA0,12960,4987
DC0,10000,9378
VC0,09940,6534
Z0,06670,9364
EC0,06200,5291
BI0,04540,2548
VA0,02790,7293
FC-0,00600,9673

oppiainekoodit

Alla taulukko Ylioppilaslautakunnan käyttämistä oppiainekoodeista. Englannin kielen käännös on toteutettu Google Sheetsin GOOGLETRANSLATE()-funktiolla, toki käännöstä piti korjailla hieman.

koodiaineämnesubject
AÄidinkieli, suomiModersmålet, finskaMother tongue, Finnish
A5Suomi toisena kielenäFinska som andraspråkFinnish as second language
BARuotsi, pitkä oppimääräSvenska, lång lärokursSwedish, long syllabus
BBRuotsi, keskipitkä oppimääräSvenska, medellång lärokursSwedish, medium length syllabus
BIBiologiaBiologiBiology
CASuomi, pitkä oppimääräFinska, lång lärokursFinnish, long syllabus
CBSuomi, keskipitkä oppimääräFinska, medellång lärokursFinnish, medium length syllabus
DCPohjoissaame, lyhyt oppimääräNordsamiska, kort lärokursNorthern Sami, short syllabus
EAEnglanti, pitkä oppimääräEngelska, lång lärokursEnglish, long syllabus
ECEnglanti, lyhyt oppimääräEngelska, kort lärokursEnglish, short syllabus
ETElämänkatsomustietoLivsåskådningskunskapEthics
FARanska, pitkä oppimääräFranska, lång lärokursFrench, a long syllabus
FCRanska, lyhyt oppimääräFranska, kort lärokursFrench, short syllabus
FFFilosofiaFilosofiPhilosophy
FYFysiikkaFysikPhysics
GCPortugali, lyhyt oppimääräPortugisiska, kort lärokursPortuguese, short syllabus
GEMaantiedeGeografiGeography
HIHistoriaHistoriaHistory
IÄidinkieli, inarinsaameModersmålet, enaresamiskaMother tongue, Inari Sámi
ICInarinsaame, lyhyt oppimääräEnaresamiska, kort lärokursInari Sámi, short syllabus
KEKemiaKemiChemistry
L1Latina, lyhyt oppimääräLatin, kort lärokursLatin, short syllabus
L7Latina, pidempi oppimääräLatin, längre lärokursLatin, longer syllabus
MMatematiikka, pitkä oppimääräMatematik, lång lärokursMathematics, a long syllabus
NMatematiikka, lyhyt oppimääräMatematik, kort lärokursMathematics, short syllabus
OÄidinkieli, ruotsiModersmålet, svenskaMother tongue, Swedish
O5Ruotsi toisena kielenäSvenska som andraspråkSwedish as a second language
PAEspanja, pitkä oppimääräSpanska, lång lärokursSpanish, a long syllabus
PCEspanja, lyhyt oppimääräSpanska, kort lärokursSpanish, a short syllabus
PSPsykologiaPsykologiPsychology
QCKoltansaame, lyhyt oppimääräSkoltsamiska, kort lärokursSkolt Sámi, a short syllabus
SASaksa, pitkä oppimääräTyska, lång lärokursGerman, a long syllabus
SCSaksa, lyhyt oppimääräTyska, kort lärokursGerman, short syllabus
TCItalia, lyhyt oppimääräItalienska, kort lärokursItalian, short syllabus
TETerveystietoHälsokunskapHealth education
UEEvankelis-luterilainen uskontoEvangelisk-luthersk religionEvangelical Lutheran religion
UOOrtodoksi uskontoOrtodox religionOrthodox religion
VAVenäjä, pitkä oppimääräRyska, lång lärokursRussian, a long syllabus
VCVenäjä, lyhyt oppimääräRyska, kort lärokursRussian, short syllabus
WÄidinkieli, koltansaameModersmålet, skoltsamiskaMother tongue, Koltsámi
YHYhteiskuntaoppiSamhällsläraSocial studies
ZÄidinkieli, pohjoissaameModersmålet, nordsamiskaMother tongue, Northern Sámi

lopuksi

Kirjoitin Python koodin Google Colabissa. Tämä koodi on uudistettu kokonaan tekoälyn avustuksella syksyllä 2025. Tarkistuslaskennan tein Google Sheets -taulukkolaskentaohjelman Pivot-taulukoilla.

lähteet

Scipy Ttest manuaali
https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_ind.html

YTL:n Oppilaitoskohtaisia tunnuslukuja-sivu ​​https://www.ylioppilastutkinto.fi/fi/tietopalvelut/tilastot/oppilaitoskohtaisia-tunnuslukuja

Aiemmat artikkelini aiheeseen liittyen
https://mikkorahikka.blog/tag/ylioppilaskoe/

Jätä kommentti

This site uses Akismet to reduce spam. Learn how your comment data is processed.