Olen piirrellyt ylioppilaskokeiden tyttöjen ja poikien arvosanajakaumia vuoden 2022 keväästä alkaen. Linkit edellisiin aiheen artikkeleihin ja tässä tarinassa käytettyyn Python lähdekoodiin löytyvät artikkelin lopusta. Siellä on myös taulukko oppiainekoodeista.
Tänä vuonna tytöillä oli tilastollisesti erittäin merkitsevästi (p < 0.001) paremmat keskiarvot verrattuna poikiin seuraavissa aineissa (suluissa erotus): terveystieto (0,92), äidinkieli ruotsi (0,88), elämänkatsomustieto (0,82), äidinkieli suomi (0,72), psykologia (0,61), suomi pitkä oppimäärä (0,50) , evankelis-luterilainen uskonto (0,38), maantiede (0,35), yhteiskuntaoppi (0,32), historia (0,32), biologia (0,20) ja ruotsi keskipitkä oppimäärä (0,15). Lisäksi puoltoäänien määrän erotus (1,3) ja kirjoitettujen aineiden lukumäärien erotus (0,14) olivat tilastollisesti erittäin merkitseviä.
Pojilla oli erotus suurempi tyttöjen vastaavaan arvoon tilastollisesti erittäin merkitsevästi, seuraavien aineiden keskiarvoissa: pitkä englanti (0,36), kemia (0,23) ja pitkä matematiikka (0,26).
Olen eläkkeellä oleva opettaja, en tilastotieteilijä tai tutkija. Big datan tutkiminen on minulle harrastus. En tee hypoteeseja, jätän tilastollisen tutkimuksen alan ammattilaisille. Tulkitsemisen taakan jätän lukijoille.
kevään 2025 ylioppilaiden puoltoäänet
Tänä keväänä tyttöjä valmistui 14665, puoltoäänien keskiarvo oli 23,95, keskihajonta 7,9. Poikia valmistui 11236, keskiarvo 22,63, keskihajonta 7,5. Kuvaajakin näyttää tyttöjen olevan parempia puoltoäänissä. Puoltoäänien erotus on noin 1,3, erotus on tilastollisesti erittäin merkitsevä.
Keväällä 24 tyttöjä valmistui 14310, puoltoäänien keskiarvo oli 24,1, keskihajonta 7,9. Poikia valmistui 10717, keskiarvo 23,0, keskihajonta 7,7.

Tytöt kirjoittivat keskimäärin 5,5 ainetta ja pojat 5,3 ainetta. Tämäkin erotus o,3 on tilastollisesti erittäin merkitsevä. Alla olevassa kuvaajassa näkyy sellaiset kirjoitetut aineet, joissa osallistujia oli yli 1000 kokelasta.

eri aineiden arvosanajakaumia
Tein arvosanajakaumat niille aineille, joissa oli yli 4000 ylioppilasta. Tällaisia aineita olivat: EA, A, N, M, BB, YH, PS, HI, BI, FY, TE, KE.
Pitkässä englannissa poikien keskiarvo on 0,36 arvosanaa suurempi kuin tytöillä. Erotus on tilastollisesti erittäin merkitsevä. Good for lads. Ero näyttäisi syntyvän siitä, että huonommissa arvosanoissa tytöt saavat enemmän ”huonompia” arvosanoja.

Äidinkielen arvosanojen keskiarvojen erotus oli 0,72 arvosanaa tyttöjen hyväksi. Erotus on tilastollisesti erittäin merkitsevä.

Lyhyen matematiikan keskiarvojen erotus oli pojilla noin 0,074 arvosanaa parempi eli käytännössä keskiarvot olivat lähes yhtä suuret.

Pitkässä matematiikassa poikien keskiarvo oli 0,16 arvosanaa parempi kuin tytöillä. Ero on tilastollisesti erittäin merkitsevä. Tässä ero näyttää syntyvä ”hyvien” arvosanojen ansiosta.

Keskipitkässä ruotsissa tyttöjen keskiarvo oli 0,15 arvosanaa parempi kuin pojilla. Ero on tilastollisesti erittäin merkitsevä.

Yhteiskuntaopissa keskiarvo tytöillä oli noin 0,32 arvosanaa parempi kuin pojilla. Ero on tilastollisesti erittäin merkitsevä.

Psykologiassa keskiarvo tytöillä oli noin 0,61 arvosanaa parempi kuin pojilla. Ero on tilastollisesti erittäin merkitsevä.

Historiassa keskiarvo tytöillä oli 0,32 arvosanaa parempi kuin pojilla. Erotus on tilastollisesti erittäin merkitsevä.

Biologiassa tyttöjen keskiarvo oli 0,2 arvosanaa parempi kuin pojilla. Erotus on tilastollisesti erittäin merkitsevä.

Fysiikassa pojilla keskiarvo oli noin 0,098 arvosanaa parempi, eli keskiarvot olivat lähes yhtä suuret.

Terveystietoisien tyttöjen keskiarvo oli huimat 0,92 arvosanaa parempi kuin pojilla. Erotus on tilastollisesti erittäin merkitsevä.

Kemiassa poikien keskiarvo oli 0,23 arvosanaa parempi kuin tytöillä. Erotus on tilastollisesti erittäin merkitsevä. Osa erosta selittyy poikien suuremmalla määrällä laudatureissa.

keskiarvot ja keskihajonnat aineittain taulukkona
Alla on eri aineiden kirjoittaneiden lukumäärät, keskiarvot ja keskihajonnat taulukkona. NaN (Not a Number) on Python kielen tapa ilmaista, että kyseistä lukua ei voi laskea. Esimerkiksi, jos listassa on nolla lukua, niin listan alkioista ei voi laskea keskiarvoa tai keskihajontaa. Yht tarkoittaa puoltoäänien summaa ja lkm kirjoitettujen aineiden lukumäärää.
| aine | p lkm | p keskiarvo | p keskihajonta | t lkm | t keskiarvo | t keskihajonta |
| yht | 11236 | 22,63 | 7,51 | 14665 | 23,96 | 7,90 |
| A | 9670 | 3,62 | 1,52 | 12735 | 4,35 | 1,44 |
| O | 964 | 3,27 | 1,44 | 1172 | 4,15 | 1,37 |
| Z | 2 | 3,50 | 0,71 | 4 | 4,75 | 0,96 |
| I | 0 | NaN | NaN | 0 | NaN | NaN |
| W | 0 | NaN | NaN | 0 | NaN | NaN |
| Q | 0 | NaN | NaN | 0 | NaN | NaN |
| A5 | 592 | 4,34 | 1,45 | 751 | 4,54 | 1,39 |
| O5 | 13 | 4,23 | 0,93 | 14 | 4,14 | 1,41 |
| M | 5775 | 4,65 | 1,43 | 5531 | 4,49 | 1,39 |
| N | 5098 | 4,01 | 1,33 | 7253 | 3,94 | 1,39 |
| BI | 1707 | 4,31 | 1,51 | 4428 | 4,51 | 1,44 |
| FF | 677 | 4,23 | 1,48 | 883 | 4,42 | 1,43 |
| FY | 4036 | 4,68 | 1,40 | 2078 | 4,58 | 1,38 |
| HI | 3823 | 4,23 | 1,40 | 2569 | 4,54 | 1,43 |
| PS | 1120 | 3,71 | 1,46 | 5882 | 4,32 | 1,40 |
| UE | 590 | 4,10 | 1,51 | 1598 | 4,48 | 1,43 |
| UO | 11 | 4,73 | 1,10 | 19 | 4,63 | 1,61 |
| ET | 86 | 3,80 | 1,71 | 233 | 4,62 | 1,37 |
| GE | 1764 | 4,02 | 1,41 | 1546 | 4,37 | 1,50 |
| KE | 2369 | 4,84 | 1,48 | 2629 | 4,62 | 1,44 |
| TE | 1824 | 3,39 | 1,35 | 4241 | 4,31 | 1,45 |
| YH | 4260 | 4,08 | 1,41 | 3370 | 4,40 | 1,48 |
| BA | 241 | 4,72 | 1,52 | 595 | 4,55 | 1,78 |
| BB | 2141 | 4,22 | 1,48 | 5502 | 4,37 | 1,53 |
| CA | 486 | 4,57 | 1,28 | 569 | 5,06 | 1,36 |
| CB | 358 | 4,38 | 1,56 | 471 | 4,51 | 1,65 |
| EA | 10695 | 4,67 | 1,37 | 13182 | 4,31 | 1,55 |
| FA | 80 | 4,90 | 1,38 | 157 | 5,18 | 1,46 |
| SA | 116 | 5,21 | 1,25 | 172 | 5,42 | 1,24 |
| PA | 44 | 5,61 | 1,13 | 72 | 5,36 | 1,14 |
| VA | 189 | 6,19 | 0,95 | 239 | 6,38 | 0,97 |
| EC | 418 | 4,28 | 1,50 | 857 | 4,10 | 1,50 |
| FC | 82 | 4,95 | 1,36 | 354 | 4,90 | 1,38 |
| SC | 436 | 4,57 | 1,44 | 509 | 4,72 | 1,40 |
| PC | 146 | 4,66 | 1,63 | 535 | 4,90 | 1,43 |
| VC | 72 | 5,13 | 1,56 | 95 | 5,40 | 1,48 |
| DC | 1 | 4,00 | NaN | 2 | 3,00 | 4,24 |
| IC | 0 | NaN | NaN | 2 | 4,00 | 1,41 |
| QC | 0 | NaN | NaN | 0 | NaN | NaN |
| GC | 5 | 5,40 | 0,55 | 7 | 5,14 | 1,95 |
| TC | 21 | 5,00 | 2,32 | 54 | 5,56 | 1,54 |
| L1 | 6 | 6,17 | 2,04 | 10 | 6,50 | 0,71 |
| L7 | 2 | 7,00 | 0,00 | 1 | 7,00 | NaN |
| lkm | 11236 | 5,33 | 0,60 | 14665 | 5,48 | 0,68 |
keskiarvojen erotus
Keskiarvojen erotus -taulukossa on laskettu poikien ja tyttöjen keskiarvojen erotukset eri aineissa. Miinusmerkkiset erotukset tarkoittavat sitä, että poikien keskiarvo on suurempi kuin tyttöjen.
| tytöt parempia | pojat parempia | ||
| aine | erotus | aine | erotus |
| yht | 1,33 | DC | −1,00 |
| Z | 1,25 | EA | −0,36 |
| TE | 0,92 | GC | −0,26 |
| O | 0,88 | PA | −0,25 |
| ET | 0,82 | KE | −0,23 |
| A | 0,72 | EC | −0,18 |
| PS | 0,61 | BA | −0,17 |
| TC | 0,56 | M | −0,16 |
| CA | 0,50 | FY | −0,10 |
| UE | 0,38 | UO | −0,10 |
| GE | 0,35 | O5 | −0,09 |
| L1 | 0,33 | N | −0,07 |
| YH | 0,32 | FC | −0,06 |
| HI | 0,32 | ||
| FA | 0,28 | ||
| VC | 0,28 | ||
| PC | 0,23 | ||
| SA | 0,21 | ||
| BI | 0,20 | ||
| FF | 0,19 | ||
| VA | 0,19 | ||
| A5 | 0,19 | ||
| SC | 0,15 | ||
| BB | 0,15 | ||
| lkm | 0,14 | ||
| CB | 0,13 | ||
| L7 | 0,00 |
t-testi
Laskin kaikista aineista Studentin t-testin keskiarvon erotuksista. Sen avulla voi selvittää missä aineissa keskiarvot poikkeavat toisistaan tilastollisesti erittäin merkitsevästi (p < 0.001).
Alla oleva taulukko on laskettu Pythonin scipy.test-moduulin ttest_ind funktiolla. Mikäli sarakkeen p-arvo luku on pienempi kuin 0.001 on kyseessä tilastollisesti erittäin merkitsevä ero. P-arvot, joissa on merkintä 0,000 ovat pienempiä kuin 0,001.
Lisäsin t-testikoodin tuottamaan taulukkoon keskiarvojen erotukset ja järjestin taulukon erotuksen mukaiseen järjestykseen. Miinusmerkkiset erotukset tarkoittavat sitä, että poikien keskiarvo on suurempi kuin tyttöjen.
| aine | erotus | p-arvo |
| yht | 1,327037 | 0,0000 |
| Z | 1,25 | 0,1729 |
| TE | 0,921987 | 0,0000 |
| O | 0,880277 | 0,0000 |
| ET | 0,8157 | 0,0001 |
| A | 0,723418 | 0,0000 |
| PS | 0,608396 | 0,0000 |
| TC | 0,555556 | 0,3202 |
| CA | 0,495368 | 0,0000 |
| UE | 0,378541 | 0,0000 |
| GE | 0,353867 | 0,0000 |
| L1 | 0,333333 | 0,7132 |
| YH | 0,320657 | 0,0000 |
| HI | 0,315571 | 0,0000 |
| FA | 0,284713 | 0,1432 |
| VC | 0,275 | 0,2503 |
| PC | 0,234682 | 0,1151 |
| SA | 0,211708 | 0,1592 |
| BI | 0,20149 | 0,0000 |
| FF | 0,194605 | 0,0090 |
| VA | 0,191384 | 0,0413 |
| A5 | 0,190692 | 0,0148 |
| SC | 0,151885 | 0,1029 |
| BB | 0,149253 | 0,0001 |
| lkm | 0,144196 | 0,0000 |
| CB | 0,133912 | 0,2336 |
| L7 | 0 | nan |
| FC | −0,055739 | 0,7393 |
| N | −0,073881 | 0,0029 |
| O5 | −0,087912 | 0,8486 |
| UO | −0,095694 | 0,8486 |
| FY | −0,097505 | 0,0094 |
| M | −0,162698 | 0,0000 |
| BA | −0,172412 | 0,1587 |
| EC | −0,175936 | 0,0490 |
| KE | −0,226935 | 0,0000 |
| PA | −0,252525 | 0,2465 |
| GC | −0,257143 | 0,7501 |
| EA | −0,364489 | 0,0000 |
| DC | −1 | nan |
oppiainekoodit
Alla taulukko Ylioppilaslautakunnan käyttämistä oppiainekoodeista.
| koodi | aine | ämne | subject |
| A | Äidinkieli, suomi | Modersmålet, finska | Mother tongue, Finnish |
| A5 | Suomi toisena kielenä | Finska som andraspråk | Finnish as second language |
| BA | Ruotsi, pitkä oppimäärä | Svenska, lång lärokurs | Sweden, long syllabus |
| BB | Ruotsi, keskipitkä oppimäärä | Svenska, medellång lärokurs | Sweden, medium length syllabus |
| BI | Biologia | Biologi | Biology |
| CA | Suomi, pitkä oppimäärä | Finska, lång lärokurs | Finland, long syllabus |
| CB | Suomi, keskipitkä oppimäärä | Finska, medellång lärokurs | Finland, medium length syllabus |
| DC | Pohjoissaame, lyhyt oppimäärä | Nordsamiska, kort lärokurs | Northern Sami, short syllabus |
| EA | Englanti, pitkä oppimäärä | Engelska, lång lärokurs | English, long syllabus |
| EC | Englanti, lyhyt oppimäärä | Engelska, kort lärokurs | English, short syllabus |
| ET | Elämänkatsomustieto | Livsåskådningskunskap | Ethics |
| FA | Ranska, pitkä oppimäärä | Franska, lång lärokurs | France, a long syllabus |
| FC | Ranska, lyhyt oppimäärä | Franska, kort lärokurs | French, short syllabus |
| FF | Filosofia | Filosofi | Philosophy |
| FY | Fysiikka | Fysik | Physics |
| GC | Portugali, lyhyt oppimäärä | Portugisiska, kort lärokurs | Portugal, short syllabus |
| GE | Maantiede | Geografi | Geography |
| HI | Historia | Historia | History |
| I | Äidinkieli, inarinsaame | Modersmålet, enaresamiska | Mother tongue, Inari Sámi |
| IC | Inarinsaame, lyhyt oppimäärä | Enaresamiska, kort lärokurs | Inari Sámi, short syllabus |
| KE | Kemia | Kemi | Chemistry |
| L1 | Latina, lyhyt oppimäärä | Latin, kort lärokurs | Latin, short syllabus |
| L7 | Latina, pidempi oppimäärä | Latin, längre lärokurs | Latin, longer syllabus |
| M | Matematiikka, pitkä oppimäärä | Matematik, lång lärokurs | Mathematics, a long syllabus |
| N | Matematiikka, lyhyt oppimäärä | Matematik, kort lärokurs | Mathematics, short syllabus |
| O | Äidinkieli, ruotsi | Modersmålet, svenska | Mother tongue, Swedish |
| O5 | Ruotsi toisena kielenä | Svenska som andraspråk | Swedish as a second language |
| PA | Espanja, pitkä oppimäärä | Spanska, lång lärokurs | Spain, a long syllabus |
| PC | Espanja, lyhyt oppimäärä | Spanska, kort lärokurs | Spanish, a short lesson |
| PS | Psykologia | Psykologi | Psychology |
| QC | Koltansaame, lyhyt oppimäärä | Skoltsamiska, kort lärokurs | Skolt Sámi, a short syllabus |
| SA | Saksa, pitkä oppimäärä | Tyska, lång lärokurs | Germany, a long syllabus |
| SC | Saksa, lyhyt oppimäärä | Tyska, kort lärokurs | Germany, short syllabus |
| TC | Italia, lyhyt oppimäärä | Italienska, kort lärokurs | Italy, short syllabus |
| TE | Terveystieto | Hälsokunskap | Health information |
| UE | Evankelis-luterilainen uskonto | Evangelisk-luthersk religion | Evangelical Lutheran religion |
| UO | Ortodoksi uskonto | Ortodox religion | Orthodox religion |
| VA | Venäjä, pitkä oppimäärä | Ryska, lång lärokurs | Russia, a long syllabus |
| VC | Venäjä, lyhyt oppimäärä | Ryska, kort lärokurs | Russia, short syllabus |
| W | Äidinkieli, koltansaame | Modersmålet, skoltsamiska | Mother tongue, Koltsámi |
| YH | Yhteiskuntaoppi | Samhällslära | Social studies |
| Z | Äidinkieli, pohjoissaame | Modersmålet, nordsamiska | Mother tongue, Northern Sámi |
lähteet
Python koodini Colabissa, viimekeväinen 2024 -versio.
https://colab.research.google.com/drive/1Dsv1mQeq6Tw9GCuSaeb8fduotzff50jg?usp=sharing
Scipy Ttest manuaali
https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_ind.html
YTL:n Oppilaitoskohtaisia tunnuslukuja-sivu https://www.ylioppilastutkinto.fi/fi/tietopalvelut/tilastot/oppilaitoskohtaisia-tunnuslukuja
Kevään 24 yo-kokeen jakaumia, tytöt ovat edelleen erilaisia kuin pojat -artikkeli
https://mikkorahikka.blog/2024/11/26/2024-ylioppilaiden-jakaumia-tytot-kukkasia-ja-pojat-koiranhannan-tupsukoita/
Muut artikkelini aiheeseen liittyen
https://mikkorahikka.blog/tag/ylioppilaskoe/

Jätä kommentti