MIKKO RAHIKKA

The electrical things have their lives too, paltry as those lives are.


2025 ylioppilaiden jakaumia – tytöt sokerista ja pojat etanoista

Tytöt menestyvät poikia keskimäärin paremmin ylioppilaskokeessa. Muutamassa harvassa aineessa pojilla on parempi keskiarvo kuin tytöillä. Onko syy koulussa, pojissa, kännyköissä, wokessa, pelaamisessa, opetussuunnitelmassa, opettajissa, yhteiskunnassa, vanhemmuudessa, tähtien asennossa vai missä? Tai sitten tytöt vaan ovat parempia. En tiedä. Silti jotain tarttis varmaan tehdä. Käsittelen tässä syksyn ja ja kevään eli koko vuoden ylioppilaiden tuloksia.

Olen laskeskellut ylioppilaskokelaiden arvosanajakaumia vuoden 2022 keväästä alkaen. Linkki edellisiin artikkeleihin löytyy artikkelin lopusta. Siellä on myös taulukko oppiainekoodeista. 

Vuoden 2025 ylioppilaiden arvosanoista

Ylioppilastutkintolautakunnan julkaisemissa tiedostoissa on paljon ylioppilasoppilaskohtaista tietoa: koulu, sukupuoli, opetuskieli, puoltoäänien lukumäärä ja eri oppiaineiden arvosanat.  Kun yhdistin sekä kevään että syksyn 2025 ylioppilasarvosanatiedostot, niin taulukossa oli 31031 riviä ja 51 saraketta. Käyttämissäni tiedostoissa on tiedot keväällä ja syksyllä valmistuneista ylioppilaista.

Tänä vuonna valmistui 31030 ylioppilasta. Heistä tyttöjä oli 17882 (58%) ja poikia 13148 (42%). Puoltoäänien summien keskiarvo tytöillä 23,8 ja pojilla 22,2. Tytöillä summan keskiarvo oli 1,6 arvosanaa parempi kuin pojilla. Tytöt kirjoittivat keskimäärin 5,5 ja pojat 5,3 ainetta.

Ylioppilasarvosanojen keskiarvo (puoltoäänien summa/kirjoitettujen aineiden määrä) oli tytöillä 4,35 ja pojilla 4,18.

Histogrammi ylioppilaiden puoltöäänistä keväällä 2025, jossa näkyy tyttöjen (punainen) ja poikien (sininen) tulosten jakauma.

Alla 10 suosituinta ainetta, lisää tietoa eri aineista löytyy lukumäärä, keskiarvo, erotus -taulukosta.

Pylväsdiagrammi, joka näyttää kymmenen suosituimman aineen opiskelijoiden lukumäärät tytöille (punainen) ja pojille (sininen) Suomessa.

aineiden arvosanajakaumia

Tein arvosanajakaumat niille aineille, joita oli kirjoitettu yli 5000 kertaa. Tällaisia aineita olivat: EA, A, N, M, BB, YH, PS, TE, HI, BI, FY, KE.

Pitkä englanti on niitä harvoja aineita, joissa pojat menestyvät keskimäärin paremmin kuin tytöt. Tänä vuonna poikien keskiarvo oli 0,33 arvosanaa parempi kuin tytöillä. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001).

Pylväsdiagrammi, joka osoittaa ylioppilaiden arvosanojen jakauman pitkässä englannissa vuonna 2025. Punaiset pylväät kuvaavat tyttöjen keskiarvoa (4.28) ja siniset pylväät poikien keskiarvoa (4.61).

Äidinkielessä tyttöjen keskiarvo oli 0,75 arvosanaa parempi kuin pojilla. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001).

Lyhyessä matikassa poikien keskiarvo oli 0,03 arvosanaa suurempi kuin tyttöjen eli keskiarvot olivat lähes yhtä suuret.

Pitkässä matikassa poikien keskiarvo oli 0,12 arvosanaa parempi kuin tytöillä. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001).

Keskipitkässä ruotsissa tyttöjen keskiarvo oli 0,18 arvosanaa parempi kuin pojilla. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001).

Yhteiskuntaopissa tyttöjen keskiarvo oli 0,36 arvosanaa parempi kuin pojilla. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001).

Psykologiassa tyttöjen keskiarvo oli 0,69 arvosanaa parempi kuin pojilla. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001)

Terveystietoisien tyttöjen keskiarvo oli 0,94 arvosanaa parempi kuin pojilla. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001). Tämä on suurin erotus kirjoitetuissa aineissa. Miksi terveystiedosta on tullut aine, jossa tytöt ovat näin paljon parempia? Terveystietoa kirjoitti 5291 tyttöä ja 2342 poikaa. Noin 2,3 kertainen määrä tyttöjä saa melkein yhden arvosanan paremman tuloksen!? Reilu meininki.

Historiassa tyttöjen keskiarvo oli 0,36 arvosanaa parempi kuin pojilla. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001).

Biologiassa tyttöjen keskiarvo oli 0,22 arvosanaa parempi kuin pojilla. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001).

Fysiikassa poikien keskiarvo oli 0,07 arvosanaa parempi kuin tytöillä.

Kemiassa poikien keskiarvo oli 0,20 arvosanaa parempi kuin tytöillä. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001).

lukumäärät, keskiarvot ja keskihajonnat aineittain taulukkona

Alla on taulukko eri aineiden kirjoittaneiden lukumääristä, keskiarvoista ja keskihajonnoista. Aineet on järjestetty yhteensä-sarakkeen mukaiseen järjestykseen.

Taulukon vasemman sarakkeen yht tarkoittaa puoltoäänien summaa, lkm kirjoitettujen aineiden lukumäärää ja muut oppiaineita. Oppiainekoodit löytyvät artikkelin lopusta.

pojat lkmpojat keskiarvopojat keskihajontatytöt lkmtytöt keskiarvotytöt keskihajontakeskiarvojen erotuskirjoittajia yhteensä
yht1314822,2347,6151788223,7968,0291,56231030
EA125194,6131,403161184,2841,573-0,32928637
A113593,5881,513156934,3351,4390,74727052
N62343,9381,34888723,9061,411-0,03315106
M64364,6191,45366064,4971,398-0,12213042
BB25104,1431,52867754,3211,5740,1789285
YH49854,0011,44140494,3581,4990,3589034
PS13763,6031,48073124,2901,4250,6878688
TE23423,3261,32752914,2661,4660,9417633
HI44374,1491,43130764,5111,4540,3627513
BI20054,2731,54054524,4981,4690,2247457
FY45214,6361,42524584,5661,399-0,0706979
KE26834,7911,51232284,5951,459-0,1965911
GE20533,9261,44018864,3211,5070,3953939
UE6963,9811,57419274,4291,4400,4482623
O10243,2251,45912194,1371,3660,9122243
FF8384,1661,51811214,4021,4400,2361959
A57534,2501,4709624,4801,4260,2311715
EC4864,1751,51310204,0561,524-0,1191506
CA5244,5591,2735985,0791,3480,5191122
SC4864,5431,5215994,7331,4190,1901085
BA2904,6761,5137154,5201,811-0,1561005
CB3694,3931,5764884,5141,6540,121857
PC1714,6611,6096364,9251,4510,264807
FC994,8591,4504204,9001,3830,041519
VA2156,1860,9492936,3380,9710,152508
ET1163,7931,7772884,5381,4010,745404
SA1375,1901,2162095,3641,2640,174346
FA884,8521,4431845,1411,5050,289272
VC825,0241,6701265,3571,5150,333208
PA535,5661,065935,4091,172-0,157146
TC254,8802,186645,6091,4650,72989
UO134,3081,653204,6001,5690,29233
O5154,1330,915173,9411,345-0,19232
L176,1431,864165,8131,797-0,33023
GC55,4000,548135,1541,519-0,24618
Z23,5000,70754,6000,8941,1007
DC23,0001,41444,0002,7081,0006
IC23,5000,70724,0001,4140,5004
L727,0000,00017,0000,0003
lkm131485,3210,598178825,4720,6840,15131030

keskiarvojen erotus ja t-testi koko vuosi

Laskin kaikista aineista Studentin t-testin keskiarvon erotuksista. Sen avulla voi selvittää, missä aineissa keskiarvot poikkeavat toisistaan tilastollisesti merkitsevästi. Minä käytän varmuuden vuoksi merkittävyyden mittana p-arvoa 0,001, jota pienemmät p-arvot tarkoittavat sitä, että keskiarvojen erotus on tilastollisesti erittäin merkitsevä. 

Tänä vuonna tytöillä oli tilastollisesti erittäin merkitsevästi (p < 0.001) paremmat keskiarvot verrattuna poikiin seuraavissa aineissa: terveystieto (0,94) , äidinkieli ruotsi (0,91), äidinkieli suomi (0,75), elämänkatsomustieto (0,75), psykologia (0,69), suomi pitkä oppimäärä (0,52), evankelis-luterilainen uskonto (0,45), maantiede (0,40), historia (0,36), yhteiskuntaoppi (0,36), biologia (0,22) ja ruotsi  keskipitkä oppimäärä (0,18). Lisäksi puoltoäänien määrän erotus (1,6)  ja kirjoitettujen aineiden lukumäärien erotus (0,15) olivat tilastollisesti erittäin merkitseviä.

Pojilla suurempi erotus tyttöjen vastaavaan arvoon oli seuraavien aineiden keskiarvoissa: pitkä englanti (0,33), kemia (0,20) ja pitkä matematiikka (0,12).

Alla oleva taulukko on laskettu Pythonin scipy.test-kirjaston ttest_ind funktiolla. Mikäli sarakkeen p-arvo luku on pienempi kuin 0.001 on kyseessä tilastollisesti erittäin merkitsevä ero. P-arvot, joissa on merkintä 0,000 ovat pienempiä kuin 0,001.

Lisäsin  t-testikoodin tuottamaan taulukkoon keskiarvojen erotukset ja järjestin erotuksen mukaiseen järjestykseen. Vasemman puoleisissa aineissa tytöt olivat ”parempia” kuin pojat  ja oikealla  pojat olivat ”parempia”.

tytöillä parempi keskiarvopojilla parempi keskiarvo
aineerotusp-arvoaineerotusp-arvo
Z1,1000,2049L1-0,3300,7001
DC1,0000,5861EA-0,3290,0000
TE0,9410,0000GC-0,2460,6204
O0,9120,0000KE-0,1960,0000
A0,7470,0000O5-0,1920,6370
ET0,7450,0001PA-0,1570,4096
TC0,7290,1334BA-0,1560,1642
PS0,6870,0000M-0,1220,0000
CA0,5190,0000EC-0,1190,1548
IC0,5000,7117FY-0,0700,0486
UE0,4480,0000N-0,0330,1524
GE0,3950,0000
HI0,3620,0000
YH0,3580,0000
VC0,3330,1474
UO0,2920,6171
FA0,2890,1292
PC0,2640,0534
FF0,2360,0005
A50,2310,0011
BI0,2240,0000
SC0,1900,0356
BB0,1780,0000
SA0,1740,2014
VA0,1520,0783
lkm0,1510,0000
CB0,1210,2747
FC0,0410,7969
L70,000

oppiainekoodit

Alla taulukko Ylioppilaslautakunnan käyttämistä oppiainekoodeista. Englannin kielen käännös on toteutettu Google Sheetsin GOOGLETRANSLATE()-funktiolla, toki käännöstä piti korjailla hieman.

koodiaineämnesubject
AÄidinkieli, suomiModersmålet, finskaMother tongue, Finnish
A5Suomi toisena kielenäFinska som andraspråkFinnish as second language
BARuotsi, pitkä oppimääräSvenska, lång lärokursSweden, long syllabus
BBRuotsi, keskipitkä oppimääräSvenska, medellång lärokursSweden, medium length syllabus
BIBiologiaBiologiBiology
CASuomi, pitkä oppimääräFinska, lång lärokursFinland, long syllabus
CBSuomi, keskipitkä oppimääräFinska, medellång lärokursFinland, medium length syllabus
DCPohjoissaame, lyhyt oppimääräNordsamiska, kort lärokursNorthern Sami, short syllabus
EAEnglanti, pitkä oppimääräEngelska, lång lärokursEnglish, long syllabus
ECEnglanti, lyhyt oppimääräEngelska, kort lärokursEnglish, short syllabus
ETElämänkatsomustietoLivsåskådningskunskapEthics
FARanska, pitkä oppimääräFranska, lång lärokursFrance, a long syllabus
FCRanska, lyhyt oppimääräFranska, kort lärokursFrench, short syllabus
FFFilosofiaFilosofiPhilosophy
FYFysiikkaFysikPhysics
GCPortugali, lyhyt oppimääräPortugisiska, kort lärokursPortugal, short syllabus
GEMaantiedeGeografiGeography
HIHistoriaHistoriaHistory
IÄidinkieli, inarinsaameModersmålet, enaresamiskaMother tongue, Inari Sámi
ICInarinsaame, lyhyt oppimääräEnaresamiska, kort lärokursInari Sámi, short syllabus
KEKemiaKemiChemistry
L1Latina, lyhyt oppimääräLatin, kort lärokursLatin, short syllabus
L7Latina, pidempi oppimääräLatin, längre lärokursLatin, longer syllabus
MMatematiikka, pitkä oppimääräMatematik, lång lärokursMathematics, a long syllabus
NMatematiikka, lyhyt oppimääräMatematik, kort lärokursMathematics, short syllabus
OÄidinkieli, ruotsiModersmålet, svenskaMother tongue, Swedish
O5Ruotsi toisena kielenäSvenska som andraspråkSwedish as a second language
PAEspanja, pitkä oppimääräSpanska, lång lärokursSpain, a long syllabus
PCEspanja, lyhyt oppimääräSpanska, kort lärokursSpanish, a short lesson
PSPsykologiaPsykologiPsychology
QCKoltansaame, lyhyt oppimääräSkoltsamiska, kort lärokursSkolt Sámi, a short syllabus
SASaksa, pitkä oppimääräTyska, lång lärokursGermany, a long syllabus
SCSaksa, lyhyt oppimääräTyska, kort lärokursGermany, short syllabus
TCItalia, lyhyt oppimääräItalienska, kort lärokursItaly, short syllabus
TETerveystietoHälsokunskapHealth information
UEEvankelis-luterilainen uskontoEvangelisk-luthersk religionEvangelical Lutheran religion
UOOrtodoksi uskontoOrtodox religionOrthodox religion
VAVenäjä, pitkä oppimääräRyska, lång lärokursRussia, a long syllabus
VCVenäjä, lyhyt oppimääräRyska, kort lärokursRussia, short syllabus
WÄidinkieli, koltansaameModersmålet, skoltsamiskaMother tongue, Koltsámi
YHYhteiskuntaoppiSamhällsläraSocial studies
ZÄidinkieli, pohjoissaameModersmålet, nordsamiskaMother tongue, Northern Sámi

lopuksi

Kirjoitin Python koodin Google Colabissa. Tämä koodi on uudistettu kokonaan tekoälyn avustuksella verrattuna viime keväiseen. Tarkistuslaskennan tein Collabora Office ja Google Sheets -taulukkolaskentaohjelmilla.

lähteet

Scipy Ttest manuaali
https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_ind.html

YTL:n Oppilaitoskohtaisia tunnuslukuja-sivu ​​https://www.ylioppilastutkinto.fi/fi/tietopalvelut/tilastot/oppilaitoskohtaisia-tunnuslukuja

Aiemmat artikkelini aiheeseen liittyen
https://mikkorahikka.blog/tag/ylioppilaskoe/

Jätä kommentti

This site uses Akismet to reduce spam. Learn how your comment data is processed.