Olen piirrellyt ylioppilaskokeiden tyttöjen ja poikien arvosanajakaumia vuoden 2022 keväästä alkaen. Linkit edellisiin aiheen artikkeleihin ja tässä tarinassa käytettyyn lähdekoodiin löytyvät artikkelin lopusta. Siellä on myös taulukko oppiainekoodeista.
Tänä vuonna tytöillä oli tilastollisesti erittäin merkitsevästi (p < 0.001) paremmat keskiarvot verrattuna poikiin seuraavissa aineissa (suluissa erotus): terveystieto (0,85) , psykologia (0,74), äidinkieli suomi (0,66), äidinkieli ruotsi (0,59), maantiede (0,32), historia 0,30), evankelis-luterilainen uskonto (0,30), yhteiskuntaoppi (0,23), ruotsi keskipitkä oppimäärä (0,18) , suomi pitkä oppimäärä (0,30), saksa lyhyt oppimäärä (0,33), suomi toisena kielenä (0,31). Lisäksi puoltoäänien määrän erotus (1,1) ja kirjoitettujen aineiden lukumäärien erotus (0,16) olivat tilastollisesti erittäin merkitseviä.
Pojilla erotus tyttöjen vastaavaan arvoon oli suurempi tilastollisesti erittäin merkittävästi seuraavien aineiden keskiarvoissa: pitkä englanti (0,45), kemia (0,35), pitkä matematiikka (0,26) ja fysiikka (0,21).
Olen eläkkeellä oleva opettaja, en tilastotieteilijä tai tutkija. Big datan tutkiminen on minulle harrastus. En tee hypoteeseja, jätän tilastollisen tutkimuksen alan ammattilaisille. Tulkitsemisen taakan jätän lukijoille.
kevään 2024 ylioppilaiden puoltoäänet
Tänä keväänä tyttöjä valmistui 14310, puoltoäänien keskiarvo oli 24,1, keskihajonta 7,9. Poikia valmistui 10717, keskiarvo 23,0, keskihajonta 7,7. Kuvaajakin näyttää tyttöjen olevan parempia puoltoäänissä. Puoltoäänien erotus on noin 1,1, erotus on tilastollisesti erittäin merkittävä.
Keväällä 23 tyttöjä valmistui 14553, puoltoäänien keskiarvo oli 24,4, keskihajonta 8,0. Poikia valmistui 10750, keskiarvo 23,0, keskihajonta 7,6.
Tytöt kirjoittivat keskimäärin 5,5 ainetta ja pojat 5,3 ainetta. Viime keväänä tytöt kirjoittivat keskimäärin 5,5 ainetta, pojat 5,2 ainetta. Tämäkin erotus o,3 on tilastollisesti erittäin merkittävä.
Alla olevassa kuvaajassa näkyy sellaiset kirjoitetut aineet, joissa osallistujia oli yli 1000 kokelasta.
eri aineiden arvosanajakaumia
Tein arvosanajakaumat niille aineille, joissa oli yli 4000 kirjoittajaa. Tällaisia aineita olivat: EA, A, N, M, BB, YH, PS, BI, HI, FY, TE, KE.
Pitkää englantia EA kirjoitti 12735 tyttöä ja 10132 poikaa. 2023 keväällä 12132 tyttöä ja 10132 poikaa. Poikien keskiarvo on 0,45 arvosanaa suurempi kuin tytöillä. Erotus on tilastollisesti erittäin merkitsevä. Good for lads.
Äidinkieltä A kirjoitti 12584 tyttöä ja 9310 poikaa. 2023 keväällä vastaavat luvut olivat tytöillä 12920 ja pojilla 9479.
Äidinkielen arvosanojen keskiarvojen erotus oli 0,67 arvosanaa tyttöjen hyväksi. Erotus on tilastollisesti erittäin merkitsevä.
Lyhyttä matematiikkaa N kirjoitti 6973 tyttöä ja 4552 poikaa. Vuoden 23 keväällä 6935 tyttöä ja 4588 poikaa.
Keskiarvojen erotus oli pojilla noin 0,012 arvosanaa parempi eli käytännössä keskiarvot olivat lähes yhtä suuret.
Pitkää matematiikkaa M kirjoitti 5613 tyttöä ja 5752 poikaa. Vuoden 23 keväällä 5791 tyttöä ja 5803 poikaa.
Poikien keskiarvo oli 0,26 arvosanaa parempi kuin tytöillä. Ero on tilastollisesti erittäin merkitsevä.
Keskipitkää ruotsia BB kirjoitti 5497 tyttöä ja 2018 poikaa. Keväällä 23 BB:n kirjoitti 5515 tyttöä ja 1986 poikaa.
Keskipitkässä ruotsissa tyttöjen keskiarvo oli 0,18 arvosanaa parempi kuin pojilla. Ero on tilastollisesti erittäin merkitsevä.
Keväällä 23 yhteiskuntaoppia YH kirjoitti 3011 tyttöä ja 3867 poikaa. Edellisenä keväänä yhteiskuntaopin kirjoitti 2902 tyttöä ja 3710 poikaa.
Keskiarvo tytöillä oli noin 0,23 arvosanaa parempi kuin pojilla. Ero on tilastollisesti erittäin merkitsevä.
Psykologiaa PS kirjoitti tänä keväänä 5725 tyttöä ja 1102 poikaa. Viime vuonna PS:n kirjoitti 5767 tyttöä ja 1114 poikaa.
Keskiarvo tytöillä oli noin 0,77 arvosanaa parempi kuin pojilla. Ero on tilastollisesti erittäin merkitsevä.
Historiaa HI kirjoitti 2525 tyttöä ja 3747 poikaa. Edellisenä keväänä 2625 tyttöä ja 3776 poikaa.
Keskiarvo tytöillä oli 0,3 arvosanaa parempi kuin pojilla. Erotus on tilastollisesti erittäin merkitsevä.
Fysiikkaa FY kirjoitti 2127 tyttöä ja 4088 poikaa. Keväällä 23 luvut olivat tytöillä 2399 ja pojilla 4230. Fysiikan kirjoittaneiden määrä väheni jonkin verran.
Fysiikassa pojilla keskiarvo oli noin 0,21 arvosanaa parempi. Erotus on tilastollisesti erittäin merkitsevä.
Terveystietoa TE kirjoitti 3775 tyttöä ja 1667 poikaa. Keväällä 23 TE:n kirjoittajista oli 3874 tyttöä ja 1552 poikaa.
Terveystietoisien tyttöjen keskiarvo oli huimat 0,85 arvosanaa parempi kuin pojilla. Erotus on tilastollisesti erittäin merkitsevä.
Kemiaa KE kirjoitti 2653 tyttöä ja 2251 poikaa. Keväällä 23 kemiaa kirjoitti 2864 tyttöä ja 2399 poikaa. Poikien keskiarvo oli 0,35 arvosanaa parempi kuin tytöillä. Erotus on tilastollisesti erittäin merkitsevä.
keskiarvot ja keskihajonnat aineittain taulukkona
Alla on eri aineiden kirjoittaneiden lukumäärät, keskiarvot ja keskihajonnat taulukkona. NaN (Not a Number) on Python kielen tapa ilmaista, että kyseistä lukua ei voi laskea. Esimerkiksi, jos listassa on nolla lukua, niin listan alkioista ei voi laskea keskiarvoa tai keskihajontaa. Yht tarkoittaa puoltoäänien summaa ja lkm kirjoitettujen aineiden lukumäärää
aine | plkm | pkeskiarvo | pkeskihajonta | tlkm | tkeskiarvo | tkeskihajonta | yhteensä |
sukup | 10717 | 1,000 | 0,000 | 14310 | 2,000 | 0,000 | 25027 |
yht | 10717 | 23,044 | 7,735 | 14310 | 24,119 | 7,949 | 25027 |
A | 9310 | 3,777 | 1,519 | 12584 | 4,433 | 1,424 | 21894 |
O | 902 | 3,686 | 1,568 | 1079 | 4,279 | 1,422 | 1981 |
Z | 3 | 3,000 | 1,000 | 9 | 4,000 | 1,871 | 12 |
A5 | 499 | 4,253 | 1,455 | 640 | 4,558 | 1,431 | 1139 |
O5 | 6 | 4,167 | 1,329 | 10 | 5,000 | 1,247 | 16 |
M | 5752 | 4,760 | 1,423 | 5613 | 4,501 | 1,365 | 11365 |
N | 4552 | 3,957 | 1,321 | 6973 | 3,941 | 1,385 | 11525 |
BI | 1807 | 4,484 | 1,511 | 4738 | 4,451 | 1,468 | 6545 |
FF | 590 | 4,351 | 1,529 | 825 | 4,462 | 1,443 | 1415 |
FY | 4088 | 4,780 | 1,402 | 2127 | 4,570 | 1,379 | 6215 |
HI | 3747 | 4,298 | 1,459 | 2525 | 4,599 | 1,412 | 6272 |
PS | 1102 | 3,608 | 1,484 | 5725 | 4,353 | 1,402 | 6827 |
UE | 612 | 4,180 | 1,489 | 1825 | 4,477 | 1,410 | 2437 |
UO | 10 | 3,700 | 1,829 | 13 | 3,308 | 1,109 | 23 |
ET | 92 | 4,185 | 1,437 | 240 | 4,600 | 1,434 | 332 |
GE | 1705 | 4,066 | 1,426 | 1580 | 4,392 | 1,433 | 3285 |
KE | 2251 | 4,928 | 1,444 | 2653 | 4,573 | 1,461 | 4904 |
TE | 1667 | 3,470 | 1,316 | 3775 | 4,325 | 1,448 | 5442 |
YH | 3867 | 4,056 | 1,429 | 3011 | 4,284 | 1,370 | 6878 |
BA | 233 | 4,811 | 1,441 | 557 | 4,508 | 1,765 | 790 |
BB | 2018 | 4,227 | 1,585 | 5497 | 4,412 | 1,564 | 7515 |
CA | 510 | 4,676 | 1,249 | 575 | 4,972 | 1,309 | 1085 |
CB | 317 | 4,722 | 1,608 | 435 | 4,828 | 1,555 | 752 |
EA | 10132 | 4,688 | 1,387 | 12735 | 4,234 | 1,531 | 22867 |
FA | 67 | 5,209 | 1,420 | 123 | 5,179 | 1,482 | 190 |
SA | 110 | 5,445 | 1,268 | 189 | 5,354 | 1,335 | 299 |
PA | 35 | 5,829 | 0,954 | 45 | 5,178 | 1,585 | 80 |
VA | 136 | 6,162 | 1,070 | 232 | 6,194 | 1,125 | 368 |
EC | 440 | 4,109 | 1,418 | 958 | 4,061 | 1,487 | 1398 |
FC | 124 | 4,621 | 1,406 | 347 | 4,700 | 1,481 | 471 |
SC | 363 | 4,507 | 1,413 | 575 | 4,833 | 1,278 | 938 |
PC | 127 | 5,071 | 1,624 | 445 | 5,045 | 1,404 | 572 |
VC | 67 | 4,687 | 1,852 | 112 | 4,911 | 1,631 | 179 |
IC | 1 | 2,000 | NaN | 1 | 5,000 | NaN | 2 |
GC | 5 | 5,400 | 0,548 | 5 | 6,200 | 0,447 | 10 |
TC | 15 | 6,133 | 0,915 | 37 | 4,892 | 1,853 | 52 |
L1 | 7 | 5,571 | 1,718 | 8 | 4,125 | 2,475 | 15 |
L7 | 1 | 7,000 | NaN | 4 | 6,250 | 0,957 | 5 |
lkm | 10717 | 5,344 | 0,617 | 14310 | 5,509 | 0,696 | 25027 |
keskiarvon erotus
Keskiarvojen erotustaulukossa on laskettu poikien ja tyttöjen keskiarvojen erotukset eri aineissa. Miinusmerkkiset erotukset tarkoittavat sitä, että poikien keskiarvo on suurempi kuin tyttöjen.
aine | erotus | aine | erotus |
IC | 3,000 | N | -0,016 |
yht | 1,076 | PC | -0,026 |
Z | 1,000 | FA | -0,030 |
TE | 0,854 | BI | -0,033 |
O5 | 0,833 | EC | -0,049 |
GC | 0,800 | SA | -0,091 |
PS | 0,745 | FY | -0,210 |
A | 0,656 | M | -0,258 |
O | 0,593 | BA | -0,303 |
ET | 0,415 | KE | -0,355 |
SC | 0,326 | UO | -0,392 |
GE | 0,326 | EA | -0,454 |
A5 | 0,305 | PA | -0,651 |
HI | 0,301 | L7 | -0,750 |
UE | 0,297 | TC | -1,241 |
CA | 0,296 | L1 | -1,446 |
YH | 0,228 | ||
VC | 0,224 | ||
BB | 0,185 | ||
lkm | 0,165 | ||
FF | 0,111 | ||
CB | 0,105 | ||
FC | 0,079 | ||
VA | 0,032 |
t-testi
Laskin kaikista aineista Studentin t-testin keskiarvon erotuksista. Sen avulla voi selvittää missä aineissa keskiarvot poikkeavat toisistaan tilastollisesti erittäin merkitsevästi (p < 0.001).
Tänä vuonna tytöillä oli tilastollisesti erittäin merkitsevästi (p < 0.001) paremmat keskiarvot verrattuna poikiin seuraavissa aineissa: Terveystieto (0,85) , Psykologia (0,74), Äidinkieli suomi (0,66), Äidinkieli ruotsi (0,59), maantiede (0,32), historia 0,30), evankelis-luterilainen uskonto (0,30), yhteiskuntaoppi (0,23), ruotsi keskipitkä oppimäärä (0,18) , suomi pitkä oppimäärä (0,30), saksa lyhyt oppimäärä (0,33), suomi toisena kielenä (0,31). Lisäksi puoltoäänien määrän erotus (1,1) ja kirjoitettujen aineiden lukumäärien erotus (0,16) olivat tilastollisesti erittäin merkitseviä.
Pojilla erotus tyttöjen vastaavaan arvoon oli seuraavien aineiden keskiarvoissa: Pitkä englanti (0,45), kemia (0,35), pitkä matematiikka (0,26) ja fysiikka (0,21).
Alla oleva taulukko on laskettu Pythonin scipy.test-kirjaston ttest_ind funktiolla. Sarakkeella t-arvo on testisuure, jonka etumerkistä näkee, kumpi keskiarvo on suurempi. Mikäli sarakkeen p-arvo luku on pienempi kuin 0.001 on kyseessä tilastollisesti erittäin merkitsevä ero. P-arvot, joissa on merkintä 0,000 ovat pienempiä kuin 0,001.
Lisäsin t-testikoodin tuottamaan taulukkoon keskiarvojen erotukset ja järjestin taulukon p-arvon mukaiseen järjestykseen. Vasemman puoleisissa aineissa tytöt olivat ”parempia” kuin pojat ja oikealla pojat olivat ”parempia”.
tytöillä parempi keskiarvo | pojilla parempi keskiarvo | |||||
aine | erotus | p-arvo | aine | erotus | p-arvo | |
yht | 1,076 | 0,000 | EA | -0,454 | 0,000 | |
TE | 0,854 | 0,000 | KE | -0,355 | 0,000 | |
PS | 0,745 | 0,000 | M | -0,258 | 0,000 | |
A | 0,656 | 0,000 | FY | -0,210 | 0,000 | |
O | 0,593 | 0,000 | TC | -1,241 | 0,002 | |
GE | 0,326 | 0,000 | BA | -0,303 | 0,012 | |
HI | 0,301 | 0,000 | PA | -0,651 | 0,026 | |
UE | 0,297 | 0,000 | L1 | -1,446 | 0,208 | |
YH | 0,228 | 0,000 | BI | -0,033 | 0,429 | |
BB | 0,185 | 0,000 | N | -0,016 | 0,540 | |
lkm | 0,165 | 0,000 | SA | -0,091 | 0,558 | |
CA | 0,296 | 0,000 | EC | -0,049 | 0,559 | |
SC | 0,326 | 0,000 | UO | -0,392 | 0,559 | |
A5 | 0,305 | 0,000 | PC | -0,026 | 0,871 | |
ET | 0,415 | 0,020 | FA | -0,030 | 0,891 | |
GC | 0,800 | 0,036 | ||||
FF | 0,111 | 0,168 | ||||
O5 | 0,833 | 0,242 | ||||
Z | 1,000 | 0,278 | ||||
CB | 0,105 | 0,370 | ||||
VC | 0,224 | 0,415 | ||||
FC | 0,079 | 0,596 | ||||
VA | 0,032 | 0,785 |
oppiainekoodit
Alla taulukko Ylioppilaslautakunnan käyttämistä oppiainekoodeista.
koe | nimi | koe | nimi |
A | Äidinkieli, suomi | L1 | Latina, lyhyt oppimäärä |
A5 | Suomi toisena kielenä | L7 | Latina, pidempi oppimäärä |
BA | Ruotsi, pitkä oppimäärä | M | Matematiikka, pitkä oppimäärä |
BB | Ruotsi, keskipitkä oppimäärä | N | Matematiikka, lyhyt oppimäärä |
BI | Biologia | O | Äidinkieli, ruotsi |
CA | Suomi, pitkä oppimäärä | O5 | Ruotsi toisena kielenä |
CB | Suomi, keskipitkä oppimäärä | PA | Espanja, pitkä oppimäärä |
DC | Pohjoissaame, lyhyt oppimäärä | PC | Espanja, lyhyt oppimäärä |
EA | Englanti, pitkä oppimäärä | PS | Psykologia |
EC | Englanti, lyhyt oppimäärä | QC | Koltansaame, lyhyt oppimäärä |
ET | Elämänkatsomustieto | SA | Saksa, pitkä oppimäärä |
FA | Ranska, pitkä oppimäärä | SC | Saksa, lyhyt oppimäärä |
FC | Ranska, lyhyt oppimäärä | TC | Italia, lyhyt oppimäärä |
FF | Filosofia | TE | Terveystieto |
FY | Fysiikka | UE | Evankelis-luterilainen uskonto |
GC | Portugali, lyhyt oppimäärä | UO | Ortodoksi uskonto |
GE | Maantiede | VA | Venäjä, pitkä oppimäärä |
HI | Historia | VC | Venäjä, lyhyt oppimäärä |
I | Äidinkieli, inarinsaame | W | Äidinkieli, koltansaame |
IC | Inarinsaame, lyhyt oppimäärä | YH | Yhteiskuntaoppi |
KE | Kemia | Z | Äidinkieli, pohjoissaame |
lähteet
Python koodini Colabissa
https://colab.research.google.com/drive/1Dsv1mQeq6Tw9GCuSaeb8fduotzff50jg?usp=sharing
Scipy Ttest manuaali
https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_ind.html
YTL:n Oppilaitoskohtaisia tunnuslukuja-sivu https://www.ylioppilastutkinto.fi/fi/tietopalvelut/tilastot/oppilaitoskohtaisia-tunnuslukuja
Kevään 23 yo-kokeen jakaumia, tytöt ovat edelleen erilaisia kuin pojat -artikkeli
https://mikkorahikka.blog/2023/06/20/kevaan-23-yo-kokeen-jakaumia-tytot-ovat-edelleen-erilaisia-kuin-pojat/
Aiemmat artikkelini aiheeseen liittyen
https://mikkorahikka.blog/tag/ylioppilaskoe/