Tytöt menestyvät keskimäärin poikia paremmin ylioppilaskokeessa. Muutamassa harvassa aineessa pojilla on parempi keskiarvo kuin tytöillä. Onko syy koulussa, pojissa, kännyköissä, wokessa, pelaamisessa, opetussuunnitelmassa, opettajissa, yhteiskunnassa, vanhemmuudessa, tähtien asennossa vai missä? Tai sitten tytöt vaan ovat parempia. En tiedä. Silti jotain tarttis varmaan tehdä. Käsittelen tässä syksyn ja kevään eli koko lukuvuoden ylioppilaiden tuloksia.
Olen laskeskellut ylioppilaskokelaiden arvosanajakaumia vuoden 2022 keväästä alkaen. Linkki edellisiin artikkeleihin löytyy artikkelin lopusta. Siellä on myös taulukko oppiainekoodeista.
lukuVuoden 2025-2026 ylioppilaiden arvosanoista
Ylioppilastutkintolautakunnan julkaisemissa tiedostoissa on paljon ylioppilaskohtaista tietoa: koulu, sukupuoli, opetuskieli, puoltoäänien lukumäärä ja eri oppiaineiden arvosanat. Kun yhdistin syksyn 25 ja kevään 26 ylioppilasarvosanatiedostot, niin taulukossa oli 31777 riviä ja 51 saraketta. Aineisto sisältää tiedot keväällä ja syksyllä valmistuneista ylioppilaista.
Aiemmasta poiketen lisään kuvaajiin aikasarjoja menneisyydestä, lukuvuodesta 2014-2015 lähtien. Aikasarjakuvaajissa vaaka-akselin vuosiluku on lukukauden päättymisvuosi eli lukuvuosi 2025-2026 merkitään luvulla 2026.
Tänä vuonna valmistui 31776 ylioppilasta. Heistä tyttöjä oli 18316 (58 %) ja poikia 13460 (42 %). Puoltoäänien keskiarvo oli tytöillä 23,8 ja pojilla 22,5. Tytöillä puoltoäänien keskiarvo oli 1,3 arvosanaa parempi kuin pojilla. Tytöt kirjoittivat keskimäärin 5,5 ja pojat 5,3 ainetta. Suurin puoltoäänien määrä pojilla oli 116 (Ressun lukiossa) ja tytöillä 75 (Lahden yhteislyseon lukiossa). Tässä yhteydessä huomasin, että YTL:n tiedostossa tuo luku 116 yht-sarakkeessa oli muuttunut **-merkeiksi. Se aiheutti hieman ongelmia alkuperäisen koodin kanssa. Tämä aiheutti tietysti myös pienen virheen Ressun tulokseen edellisessä artikkelissani. Niinpä puoltoäänet-kuvassa ei vaaka-akseli jatku yli sadan.
Ylioppilasarvosanojen keskiarvo (puoltoäänien summa/kirjoitettujen aineiden määrä) oli tytöillä 4,35 ja pojilla 4,18. Puoltoäänien, kirjoitettujen aineiden lukumäärän ja keskiarvojen erotukset tyttöjen ja poikien välillä olivat tilastollisesti erittäin merkitseviä (p < 0,001).




Alla on listattu 10 suosituinta ainetta. Lisää tietoa eri aineista löytyy lukumäärä, keskiarvo ja erotus -taulukosta.

aineiden arvosanajakaumia
Tein arvosanajakaumat niille aineille, joita oli kirjoitettu yli 5000 kertaa. Tällaisia aineita olivat: EA, A, N, M, YH, TE, PS, BB, BI, HI, FY, KE.
Pitkä englanti on yksi niistä harvoista anineista, joissa pojat menestyvät keskimäärin paremmin kuin tytöt. Tänä vuonna poikien keskiarvo oli 0,38 arvosanaa parempi kuin tytöillä. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001).


Äidinkielessä tyttöjen keskiarvo oli 0,71 arvosanaa parempi kuin pojilla. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001).


Lyhyessä matikassa poikien keskiarvo oli 0,12 arvosanaa suurempi kuin tyttöjen. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001).


Pitkässä matikassa poikien keskiarvo oli 0,32 arvosanaa parempi kuin tytöillä. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001).


Yhteiskuntaopissa tyttöjen keskiarvo oli 0,36 arvosanaa parempi kuin pojilla. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001).


Terveystietoisien tyttöjen keskiarvo oli 0,90 arvosanaa parempi kuin pojilla. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001). Tämä on suurin erotus kirjoitetuissa aineissa. Terveystietoa kirjoitti 6636 tyttöä ja 2818 poikaa.

Psykologiassa tyttöjen keskiarvo oli 0,66 arvosanaa parempi kuin pojilla. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001).


Keskipitkässä ruotsissa tyttöjen keskiarvo oli 0,16 arvosanaa parempi kuin pojilla. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001).


Biologiassa tyttöjen keskiarvo oli 0,05 arvosanaa parempi kuin pojilla eli melkein sama.


Historiassa tyttöjen keskiarvo oli 0,44 arvosanaa parempi kuin pojilla. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001).


Fysiikassa poikien keskiarvo oli 0,09 arvosanaa parempi kuin tytöillä eli arvosanakeskiarvo on lähes sama tytöillä ja pojilla.


Kemiassa poikien keskiarvo oli 0,27 arvosanaa parempi kuin tytöillä. Erotus on tilastollisesti erittäin merkitsevä (p < 0,001).


lukumäärät, keskiarvot ja keskihajonnat aineittain taulukkona
Alla on taulukko eri aineiden kirjoittaneiden lukumääristä, keskiarvoista ja keskihajonnoista. Aineet on järjestetty yhteensä-sarakkeen mukaiseen järjestykseen.
Taulukon vasemman sarakkeen yht tarkoittaa puoltoäänien summaa, lkm kirjoitettujen aineiden lukumäärää ja muut oppiaineita. Oppiainekoodit löytyvät artikkelin lopusta.
| p lkm | p keskiarvo | p keskihajonta | t lkm | t keskiarvo | t keskihajonta | erotus | |
| yht | 13459 | 22,48 | 7,68 | 18316 | 23,81 | 7,94 | 1,32 |
| EA | 12919 | 4,58 | 1,45 | 16723 | 4,20 | 1,57 | -0,38 |
| A | 11675 | 3,75 | 1,47 | 16012 | 4,46 | 1,38 | 0,71 |
| N | 6694 | 4,04 | 1,41 | 9549 | 3,91 | 1,42 | -0,12 |
| M | 6362 | 4,78 | 1,41 | 6329 | 4,46 | 1,39 | -0,32 |
| YH | 5576 | 4,08 | 1,47 | 4518 | 4,42 | 1,48 | 0,35 |
| TE | 2818 | 3,42 | 1,36 | 6636 | 4,33 | 1,47 | 0,91 |
| PS | 1477 | 3,65 | 1,49 | 7789 | 4,31 | 1,43 | 0,66 |
| BB | 2378 | 4,10 | 1,64 | 6782 | 4,31 | 1,58 | 0,21 |
| BI | 1946 | 4,45 | 1,51 | 5273 | 4,50 | 1,49 | 0,05 |
| HI | 4154 | 4,14 | 1,49 | 2620 | 4,57 | 1,45 | 0,44 |
| FY | 4382 | 4,65 | 1,42 | 2025 | 4,56 | 1,37 | -0,09 |
| KE | 2669 | 4,86 | 1,50 | 3299 | 4,60 | 1,50 | -0,27 |
| GE | 1957 | 3,95 | 1,45 | 1797 | 4,37 | 1,48 | 0,42 |
| O | 996 | 3,32 | 1,43 | 1220 | 4,10 | 1,28 | 0,78 |
| FF | 922 | 4,37 | 1,59 | 1203 | 4,35 | 1,45 | -0,03 |
| UE | 556 | 3,90 | 1,58 | 1397 | 4,37 | 1,44 | 0,46 |
| A5 | 783 | 4,16 | 1,43 | 1073 | 4,46 | 1,45 | 0,30 |
| EC | 376 | 3,99 | 1,58 | 776 | 4,06 | 1,54 | 0,06 |
| BA | 317 | 4,83 | 1,46 | 804 | 4,55 | 1,71 | -0,27 |
| SC | 454 | 4,58 | 1,50 | 651 | 4,85 | 1,43 | 0,27 |
| CA | 473 | 4,56 | 1,27 | 565 | 5,02 | 1,38 | 0,47 |
| PC | 231 | 4,79 | 1,55 | 722 | 4,98 | 1,40 | 0,19 |
| CB | 416 | 4,66 | 1,61 | 507 | 4,62 | 1,60 | -0,03 |
| FC | 130 | 4,76 | 1,46 | 450 | 4,76 | 1,48 | -0,01 |
| VA | 209 | 6,30 | 0,91 | 331 | 6,33 | 0,91 | 0,03 |
| SA | 179 | 5,10 | 1,30 | 223 | 5,34 | 1,23 | 0,24 |
| ET | 99 | 3,99 | 1,67 | 229 | 4,14 | 1,50 | 0,15 |
| FA | 100 | 4,85 | 1,50 | 189 | 4,83 | 1,48 | -0,02 |
| VC | 81 | 5,19 | 1,56 | 130 | 5,28 | 1,57 | 0,10 |
| PA | 54 | 5,54 | 1,16 | 117 | 5,67 | 1,16 | 0,13 |
| TC | 27 | 5,33 | 1,52 | 67 | 5,60 | 1,63 | 0,26 |
| L1 | 10 | 5,70 | 1,49 | 30 | 5,50 | 1,61 | -0,20 |
| O5 | 11 | 4,18 | 1,33 | 19 | 4,16 | 1,30 | -0,02 |
| UO | 9 | 3,78 | 2,17 | 14 | 3,36 | 1,39 | -0,42 |
| GC | 4 | 2,50 | 2,08 | 18 | 5,33 | 1,28 | 2,83 |
| DC | 2 | 3,00 | 1,41 | 10 | 3,10 | 1,20 | 0,10 |
| Z | 3 | 4,33 | 1,15 | 5 | 4,40 | 0,89 | 0,07 |
| I | 1 | 2,00 | 2 | 6,50 | 0,71 | 4,50 | |
| IC | 3 | 3,67 | 0,58 | 0 | |||
| lkm | 13460 | 5,31 | 0,60 | 18316 | 5,47 | 0,68 | 0,16 |
keskiarvojen erotus ja t-testi koko vuosi
Laskin kaikista aineista Studentin t-testin keskiarvon erotuksista. Sen avulla voi selvittää, missä aineissa keskiarvot poikkeavat toisistaan tilastollisesti merkitsevästi. Minä käytän varmuuden vuoksi merkitsevyyden mittana p-arvoa 0,001, jota pienemmät p-arvot tarkoittavat sitä, että keskiarvojen erotus on tilastollisesti erittäin merkitsevä.
Tänä lukuvuonna tytöillä oli tilastollisesti erittäin merkitsevästi (p < 0.001) paremmat keskiarvot verrattuna poikiin seuraavissa aineissa: terveystieto (0,91) , äidinkieli ruotsi (0,78), äidinkieli suomi (0,71), psykologia (0,65), suomi pitkä oppimäärä (0,47), evankelis-luterilainen uskonto (0,45), historia (0,44), maantiede (0,42), yhteiskuntaoppi (0,35) ja suomi toisena kielenä (0,30). Lisäksi puoltoäänien määrän erotus (1,32) ja kirjoitettujen aineiden lukumäärien erotus (0,16) olivat tilastollisesti erittäin merkitseviä.
Pojat menestyivät tyttöjä paremmin tilastollisesti merkitsevästi seuraavissa aineissa: pitkä englanti (0,38), pitkä matematiikka (0,32), kemia (0,26) ja lyhyt matematiikka (0,12).
Alla oleva taulukko on laskettu Pythonin scipy.stats-kirjaston ttest_ind-funktiolla. Mikäli sarakkeen p-arvo on pienempi kuin 0,001 on kyseessä tilastollisesti erittäin merkitsevä ero. P-arvot, joissa on merkintä 0,0000 ovat pienempiä kuin 0,001.
Lisäsin t-testikoodin tuottamaan taulukkoon keskiarvojen erotukset ja järjestin erotuksen mukaiseen järjestykseen. Vasemmanpuoleisissa aineissa tytöt olivat ”parempia” kuin pojat ja oikealla pojat olivat ”parempia”.
| Tytöillä parempi | Pojilla parempi | ||||
| aine | erotus | p-arvo | aine | erotus | p-arvo |
| I | 4,5000 | FA | -0,0193 | 0,9169 | |
| GC | 2,8333 | 0,0673 | O5 | -0,0239 | 0,9623 |
| TE | 0,9090 | 0,0000 | FF | -0,0259 | 0,6995 |
| O | 0,7774 | 0,0000 | CB | -0,0349 | 0,7425 |
| A | 0,7084 | 0,0000 | FY | -0,0880 | 0,0182 |
| PS | 0,6550 | 0,0000 | N | -0,1242 | 0,0000 |
| CA | 0,4670 | 0,0000 | L1 | -0,2000 | 0,7240 |
| UE | 0,4636 | 0,0000 | KE | -0,2657 | 0,0000 |
| HI | 0,4366 | 0,0000 | BA | -0,2730 | 0,0076 |
| GE | 0,4214 | 0,0000 | M | -0,3189 | 0,0000 |
| YH | 0,3463 | 0,0000 | EA | -0,3815 | 0,0000 |
| A5 | 0,3033 | 0,0000 | UO | -0,4206 | 0,6139 |
| SC | 0,2732 | 0,0025 | |||
| TC | 0,2637 | 0,4597 | |||
| SA | 0,2358 | 0,0645 | |||
| BB | 0,2134 | 0,0000 | |||
| PC | 0,1926 | 0,0928 | |||
| lkm | 0,1570 | 0,0000 | |||
| ET | 0,1455 | 0,4563 | |||
| PA | 0,1296 | 0,4987 | |||
| DC | 0,1000 | 0,9378 | |||
| VC | 0,0994 | 0,6534 | |||
| Z | 0,0667 | 0,9364 | |||
| EC | 0,0620 | 0,5291 | |||
| BI | 0,0454 | 0,2548 | |||
| VA | 0,0279 | 0,7293 | |||
| FC | -0,0060 | 0,9673 |
oppiainekoodit
Alla taulukko Ylioppilaslautakunnan käyttämistä oppiainekoodeista. Englannin kielen käännös on toteutettu Google Sheetsin GOOGLETRANSLATE()-funktiolla, toki käännöstä piti korjailla hieman.
| koodi | aine | ämne | subject |
| A | Äidinkieli, suomi | Modersmålet, finska | Mother tongue, Finnish |
| A5 | Suomi toisena kielenä | Finska som andraspråk | Finnish as second language |
| BA | Ruotsi, pitkä oppimäärä | Svenska, lång lärokurs | Swedish, long syllabus |
| BB | Ruotsi, keskipitkä oppimäärä | Svenska, medellång lärokurs | Swedish, medium length syllabus |
| BI | Biologia | Biologi | Biology |
| CA | Suomi, pitkä oppimäärä | Finska, lång lärokurs | Finnish, long syllabus |
| CB | Suomi, keskipitkä oppimäärä | Finska, medellång lärokurs | Finnish, medium length syllabus |
| DC | Pohjoissaame, lyhyt oppimäärä | Nordsamiska, kort lärokurs | Northern Sami, short syllabus |
| EA | Englanti, pitkä oppimäärä | Engelska, lång lärokurs | English, long syllabus |
| EC | Englanti, lyhyt oppimäärä | Engelska, kort lärokurs | English, short syllabus |
| ET | Elämänkatsomustieto | Livsåskådningskunskap | Ethics |
| FA | Ranska, pitkä oppimäärä | Franska, lång lärokurs | French, a long syllabus |
| FC | Ranska, lyhyt oppimäärä | Franska, kort lärokurs | French, short syllabus |
| FF | Filosofia | Filosofi | Philosophy |
| FY | Fysiikka | Fysik | Physics |
| GC | Portugali, lyhyt oppimäärä | Portugisiska, kort lärokurs | Portuguese, short syllabus |
| GE | Maantiede | Geografi | Geography |
| HI | Historia | Historia | History |
| I | Äidinkieli, inarinsaame | Modersmålet, enaresamiska | Mother tongue, Inari Sámi |
| IC | Inarinsaame, lyhyt oppimäärä | Enaresamiska, kort lärokurs | Inari Sámi, short syllabus |
| KE | Kemia | Kemi | Chemistry |
| L1 | Latina, lyhyt oppimäärä | Latin, kort lärokurs | Latin, short syllabus |
| L7 | Latina, pidempi oppimäärä | Latin, längre lärokurs | Latin, longer syllabus |
| M | Matematiikka, pitkä oppimäärä | Matematik, lång lärokurs | Mathematics, a long syllabus |
| N | Matematiikka, lyhyt oppimäärä | Matematik, kort lärokurs | Mathematics, short syllabus |
| O | Äidinkieli, ruotsi | Modersmålet, svenska | Mother tongue, Swedish |
| O5 | Ruotsi toisena kielenä | Svenska som andraspråk | Swedish as a second language |
| PA | Espanja, pitkä oppimäärä | Spanska, lång lärokurs | Spanish, a long syllabus |
| PC | Espanja, lyhyt oppimäärä | Spanska, kort lärokurs | Spanish, a short syllabus |
| PS | Psykologia | Psykologi | Psychology |
| QC | Koltansaame, lyhyt oppimäärä | Skoltsamiska, kort lärokurs | Skolt Sámi, a short syllabus |
| SA | Saksa, pitkä oppimäärä | Tyska, lång lärokurs | German, a long syllabus |
| SC | Saksa, lyhyt oppimäärä | Tyska, kort lärokurs | German, short syllabus |
| TC | Italia, lyhyt oppimäärä | Italienska, kort lärokurs | Italian, short syllabus |
| TE | Terveystieto | Hälsokunskap | Health education |
| UE | Evankelis-luterilainen uskonto | Evangelisk-luthersk religion | Evangelical Lutheran religion |
| UO | Ortodoksi uskonto | Ortodox religion | Orthodox religion |
| VA | Venäjä, pitkä oppimäärä | Ryska, lång lärokurs | Russian, a long syllabus |
| VC | Venäjä, lyhyt oppimäärä | Ryska, kort lärokurs | Russian, short syllabus |
| W | Äidinkieli, koltansaame | Modersmålet, skoltsamiska | Mother tongue, Koltsámi |
| YH | Yhteiskuntaoppi | Samhällslära | Social studies |
| Z | Äidinkieli, pohjoissaame | Modersmålet, nordsamiska | Mother tongue, Northern Sámi |
lopuksi
Kirjoitin Python koodin Google Colabissa. Tämä koodi on uudistettu kokonaan tekoälyn avustuksella syksyllä 2025. Tarkistuslaskennan tein Google Sheets -taulukkolaskentaohjelman Pivot-taulukoilla.
lähteet
Scipy Ttest manuaali
https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_ind.html
YTL:n Oppilaitoskohtaisia tunnuslukuja-sivu https://www.ylioppilastutkinto.fi/fi/tietopalvelut/tilastot/oppilaitoskohtaisia-tunnuslukuja
Aiemmat artikkelini aiheeseen liittyen
https://mikkorahikka.blog/tag/ylioppilaskoe/

Jätä kommentti