2024 kevään ylioppilaiden jakaumia – tytöt on tehty kukkasista ja pojat koiranhännän tupsukoista

Olen piirrellyt ylioppilaskokeiden tyttöjen ja poikien arvosanajakaumia vuoden 2022 keväästä alkaen. Linkit edellisiin aiheen artikkeleihin ja tässä tarinassa käytettyyn lähdekoodiin löytyvät artikkelin lopusta. Siellä on myös taulukko oppiainekoodeista. 

Tänä vuonna tytöillä oli tilastollisesti erittäin merkitsevästi (p < 0.001) paremmat keskiarvot verrattuna poikiin seuraavissa aineissa (suluissa erotus): terveystieto (0,85) , psykologia (0,74), äidinkieli suomi (0,66), äidinkieli ruotsi (0,59), maantiede (0,32),  historia 0,30), evankelis-luterilainen uskonto (0,30), yhteiskuntaoppi (0,23), ruotsi  keskipitkä oppimäärä (0,18) , suomi pitkä oppimäärä (0,30), saksa lyhyt oppimäärä (0,33), suomi toisena kielenä (0,31). Lisäksi puoltoäänien määrän erotus (1,1)  ja kirjoitettujen aineiden lukumäärien erotus (0,16) olivat tilastollisesti erittäin merkitseviä.

Pojilla erotus tyttöjen vastaavaan arvoon oli suurempi tilastollisesti erittäin merkittävästi seuraavien aineiden keskiarvoissa: pitkä englanti (0,45), kemia (0,35), pitkä matematiikka (0,26)  ja fysiikka (0,21).

Olen eläkkeellä oleva opettaja, en tilastotieteilijä tai tutkija. Big datan tutkiminen on minulle harrastus. En tee hypoteeseja, jätän tilastollisen tutkimuksen alan ammattilaisille. Tulkitsemisen taakan jätän lukijoille.

kevään 2024 ylioppilaiden  puoltoäänet

Tänä keväänä tyttöjä  valmistui 14310, puoltoäänien keskiarvo oli 24,1, keskihajonta 7,9. Poikia valmistui 10717, keskiarvo 23,0, keskihajonta 7,7. Kuvaajakin näyttää tyttöjen olevan parempia puoltoäänissä. Puoltoäänien erotus on noin 1,1, erotus on tilastollisesti erittäin merkittävä.

Keväällä 23 tyttöjä valmistui 14553, puoltoäänien keskiarvo oli 24,4, keskihajonta 8,0. Poikia valmistui 10750, keskiarvo 23,0, keskihajonta 7,6.

Tytöt kirjoittivat keskimäärin 5,5 ainetta ja  pojat 5,3 ainetta. Viime keväänä tytöt kirjoittivat keskimäärin 5,5 ainetta, pojat 5,2 ainetta. Tämäkin erotus o,3 on tilastollisesti erittäin merkittävä.

Alla olevassa kuvaajassa näkyy sellaiset kirjoitetut aineet, joissa osallistujia oli yli 1000 kokelasta.

eri aineiden arvosanajakaumia

Tein arvosanajakaumat niille aineille, joissa oli yli 4000 kirjoittajaa. Tällaisia aineita olivat: EA, A, N, M, BB, YH, PS, BI,  HI, FY, TE, KE.

Pitkää englantia EA kirjoitti 12735  tyttöä ja 10132 poikaa. 2023 keväällä 12132  tyttöä ja 10132 poikaa. Poikien keskiarvo on 0,45 arvosanaa suurempi kuin tytöillä. Erotus on tilastollisesti erittäin merkitsevä. Good for lads.

Äidinkieltä A kirjoitti 12584  tyttöä ja 9310 poikaa. 2023 keväällä vastaavat luvut olivat tytöillä 12920 ja pojilla 9479. 

Äidinkielen arvosanojen keskiarvojen erotus oli 0,67 arvosanaa tyttöjen hyväksi. Erotus on tilastollisesti erittäin merkitsevä. 

Lyhyttä matematiikkaa N kirjoitti 6973 tyttöä ja 4552 poikaa. Vuoden 23 keväällä 6935 tyttöä  ja 4588 poikaa.

Keskiarvojen erotus oli pojilla noin 0,012 arvosanaa parempi eli käytännössä keskiarvot olivat lähes yhtä suuret.

Pitkää matematiikkaa M kirjoitti 5613 tyttöä ja 5752 poikaa. Vuoden 23 keväällä 5791 tyttöä ja 5803 poikaa.

Poikien keskiarvo oli 0,26 arvosanaa parempi kuin tytöillä. Ero on tilastollisesti erittäin merkitsevä.

Keskipitkää ruotsia BB kirjoitti 5497 tyttöä ja 2018 poikaa. Keväällä 23 BB:n kirjoitti 5515 tyttöä ja 1986 poikaa.

Keskipitkässä ruotsissa tyttöjen keskiarvo oli 0,18 arvosanaa parempi kuin pojilla. Ero on tilastollisesti erittäin merkitsevä.

Keväällä 23 yhteiskuntaoppia YH kirjoitti 3011 tyttöä ja 3867 poikaa. Edellisenä keväänä yhteiskuntaopin kirjoitti 2902 tyttöä ja 3710 poikaa. 

Keskiarvo tytöillä oli noin 0,23 arvosanaa parempi kuin pojilla. Ero on tilastollisesti erittäin merkitsevä.

Psykologiaa PS kirjoitti tänä keväänä  5725 tyttöä ja 1102 poikaa. Viime vuonna PS:n kirjoitti 5767 tyttöä ja 1114 poikaa.

Keskiarvo tytöillä oli noin 0,77 arvosanaa parempi kuin pojilla. Ero on tilastollisesti erittäin merkitsevä.

Historiaa HI kirjoitti 2525 tyttöä ja 3747 poikaa. Edellisenä keväänä 2625 tyttöä ja 3776 poikaa. 

Keskiarvo tytöillä oli 0,3 arvosanaa parempi kuin pojilla. Erotus on tilastollisesti erittäin merkitsevä.

Fysiikkaa FY kirjoitti 2127 tyttöä ja 4088 poikaa. Keväällä 23 luvut olivat tytöillä 2399 ja pojilla 4230. Fysiikan kirjoittaneiden määrä väheni jonkin verran. 

Fysiikassa pojilla keskiarvo oli noin 0,21 arvosanaa parempi. Erotus on tilastollisesti erittäin merkitsevä.

Terveystietoa TE  kirjoitti 3775 tyttöä ja 1667 poikaa. Keväällä 23 TE:n kirjoittajista oli 3874 tyttöä ja 1552 poikaa. 

Terveystietoisien tyttöjen keskiarvo oli huimat 0,85 arvosanaa parempi kuin pojilla. Erotus on tilastollisesti erittäin merkitsevä.

Kemiaa KE  kirjoitti 2653 tyttöä ja 2251 poikaa. Keväällä 23 kemiaa kirjoitti 2864 tyttöä ja 2399 poikaa. Poikien keskiarvo oli 0,35 arvosanaa parempi kuin tytöillä.  Erotus on tilastollisesti erittäin merkitsevä.

keskiarvot ja keskihajonnat aineittain taulukkona

Alla on eri  aineiden kirjoittaneiden lukumäärät, keskiarvot ja keskihajonnat taulukkona. NaN (Not a Number) on Python kielen tapa ilmaista, että kyseistä lukua ei voi laskea. Esimerkiksi, jos listassa on nolla lukua, niin listan alkioista ei voi laskea keskiarvoa tai keskihajontaa. Yht tarkoittaa puoltoäänien summaa ja lkm kirjoitettujen aineiden lukumäärää

aineplkmpkeskiarvopkeskihajontatlkmtkeskiarvotkeskihajontayhteensä
sukup107171,0000,000143102,0000,00025027
yht1071723,0447,7351431024,1197,94925027
A93103,7771,519125844,4331,42421894
O9023,6861,56810794,2791,4221981
Z33,0001,00094,0001,87112
A54994,2531,4556404,5581,4311139
O564,1671,329105,0001,24716
M57524,7601,42356134,5011,36511365
N45523,9571,32169733,9411,38511525
BI18074,4841,51147384,4511,4686545
FF5904,3511,5298254,4621,4431415
FY40884,7801,40221274,5701,3796215
HI37474,2981,45925254,5991,4126272
PS11023,6081,48457254,3531,4026827
UE6124,1801,48918254,4771,4102437
UO103,7001,829133,3081,10923
ET924,1851,4372404,6001,434332
GE17054,0661,42615804,3921,4333285
KE22514,9281,44426534,5731,4614904
TE16673,4701,31637754,3251,4485442
YH38674,0561,42930114,2841,3706878
BA2334,8111,4415574,5081,765790
BB20184,2271,58554974,4121,5647515
CA5104,6761,2495754,9721,3091085
CB3174,7221,6084354,8281,555752
EA101324,6881,387127354,2341,53122867
FA675,2091,4201235,1791,482190
SA1105,4451,2681895,3541,335299
PA355,8290,954455,1781,58580
VA1366,1621,0702326,1941,125368
EC4404,1091,4189584,0611,4871398
FC1244,6211,4063474,7001,481471
SC3634,5071,4135754,8331,278938
PC1275,0711,6244455,0451,404572
VC674,6871,8521124,9111,631179
IC12,000NaN15,000NaN2
GC55,4000,54856,2000,44710
TC156,1330,915374,8921,85352
L175,5711,71884,1252,47515
L717,000NaN46,2500,9575
lkm107175,3440,617143105,5090,69625027

keskiarvon erotus

Keskiarvojen erotustaulukossa on laskettu poikien ja tyttöjen keskiarvojen erotukset eri aineissa. Miinusmerkkiset  erotukset tarkoittavat sitä, että poikien keskiarvo on suurempi kuin tyttöjen.

aineerotusaineerotus
IC3,000N-0,016
yht1,076PC-0,026
Z1,000FA-0,030
TE0,854BI-0,033
O50,833EC-0,049
GC0,800SA-0,091
PS0,745FY-0,210
A0,656M-0,258
O0,593BA-0,303
ET0,415KE-0,355
SC0,326UO-0,392
GE0,326EA-0,454
A50,305PA-0,651
HI0,301L7-0,750
UE0,297TC-1,241
CA0,296L1-1,446
YH0,228
VC0,224
BB0,185
lkm0,165
FF0,111
CB0,105
FC0,079
VA0,032

t-testi

Laskin kaikista aineista Studentin t-testin keskiarvon erotuksista. Sen avulla voi selvittää missä aineissa keskiarvot poikkeavat toisistaan tilastollisesti erittäin merkitsevästi  (p < 0.001). 

Tänä vuonna tytöillä oli tilastollisesti erittäin merkitsevästi (p < 0.001) paremmat keskiarvot verrattuna poikiin seuraavissa aineissa: Terveystieto (0,85) , Psykologia (0,74), Äidinkieli suomi (0,66), Äidinkieli ruotsi (0,59), maantiede (0,32),  historia 0,30), evankelis-luterilainen uskonto (0,30), yhteiskuntaoppi (0,23), ruotsi  keskipitkä oppimäärä (0,18) , suomi pitkä oppimäärä (0,30), saksa lyhyt oppimäärä (0,33), suomi toisena kielenä (0,31). Lisäksi puoltoäänien määrän erotus (1,1)  ja kirjoitettujen aineiden lukumäärien erotus (0,16) olivat tilastollisesti erittäin merkitseviä.

Pojilla erotus tyttöjen vastaavaan arvoon oli seuraavien aineiden keskiarvoissa: Pitkä englanti (0,45), kemia (0,35), pitkä matematiikka (0,26)  ja fysiikka (0,21).

Alla oleva taulukko on laskettu Pythonin scipy.test-kirjaston ttest_ind funktiolla. Sarakkeella t-arvo on testisuure, jonka etumerkistä näkee, kumpi keskiarvo on suurempi. Mikäli sarakkeen p-arvo luku on pienempi kuin 0.001 on kyseessä tilastollisesti erittäin merkitsevä ero. P-arvot, joissa on merkintä 0,000 ovat pienempiä kuin 0,001.

Lisäsin  t-testikoodin tuottamaan taulukkoon keskiarvojen erotukset ja järjestin taulukon p-arvon mukaiseen järjestykseen. Vasemman puoleisissa aineissa tytöt olivat ”parempia” kuin pojat  ja oikealla  pojat olivat ”parempia”.

tytöillä  parempi keskiarvopojilla parempi keskiarvo
aineerotusp-arvoaineerotusp-arvo
yht1,0760,000 EA-0,4540,000
TE0,8540,000 KE-0,3550,000
PS0,7450,000 M-0,2580,000
A0,6560,000 FY-0,2100,000
O0,5930,000 TC-1,2410,002
GE0,3260,000 BA-0,3030,012
HI0,3010,000 PA-0,6510,026
UE0,2970,000 L1-1,4460,208
YH0,2280,000 BI-0,0330,429
BB0,1850,000 N-0,0160,540
lkm0,1650,000 SA-0,0910,558
CA0,2960,000 EC-0,0490,559
SC0,3260,000 UO-0,3920,559
A50,3050,000 PC-0,0260,871
ET0,4150,020FA-0,0300,891
GC0,8000,036
FF0,1110,168
O50,8330,242
Z1,0000,278
CB0,1050,370
VC0,2240,415
FC0,0790,596
VA0,0320,785

oppiainekoodit

Alla taulukko Ylioppilaslautakunnan käyttämistä oppiainekoodeista.

koenimikoenimi
AÄidinkieli, suomiL1Latina, lyhyt oppimäärä
A5Suomi toisena kielenäL7Latina, pidempi oppimäärä
BARuotsi, pitkä oppimääräMMatematiikka, pitkä oppimäärä
BBRuotsi, keskipitkä oppimääräNMatematiikka, lyhyt oppimäärä
BIBiologiaOÄidinkieli, ruotsi
CASuomi, pitkä oppimääräO5Ruotsi toisena kielenä
CBSuomi, keskipitkä oppimääräPAEspanja, pitkä oppimäärä
DCPohjoissaame, lyhyt oppimääräPCEspanja, lyhyt oppimäärä
EAEnglanti, pitkä oppimääräPSPsykologia
ECEnglanti, lyhyt oppimääräQCKoltansaame, lyhyt oppimäärä
ETElämänkatsomustietoSASaksa, pitkä oppimäärä
FARanska, pitkä oppimääräSCSaksa, lyhyt oppimäärä
FCRanska, lyhyt oppimääräTCItalia, lyhyt oppimäärä
FFFilosofiaTETerveystieto
FYFysiikkaUEEvankelis-luterilainen uskonto
GCPortugali, lyhyt oppimääräUOOrtodoksi uskonto
GEMaantiedeVAVenäjä, pitkä oppimäärä
HIHistoriaVCVenäjä, lyhyt oppimäärä
IÄidinkieli, inarinsaameWÄidinkieli, koltansaame
ICInarinsaame, lyhyt oppimääräYHYhteiskuntaoppi
KEKemiaZÄidinkieli, pohjoissaame

lähteet

Python koodini Colabissa
https://colab.research.google.com/drive/1Dsv1mQeq6Tw9GCuSaeb8fduotzff50jg?usp=sharing

Scipy Ttest manuaali
https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_ind.html

YTL:n Oppilaitoskohtaisia tunnuslukuja-sivu ​​https://www.ylioppilastutkinto.fi/fi/tietopalvelut/tilastot/oppilaitoskohtaisia-tunnuslukuja

Kevään 23 yo-kokeen jakaumia, tytöt ovat edelleen erilaisia kuin pojat -artikkeli
https://mikkorahikka.blog/2023/06/20/kevaan-23-yo-kokeen-jakaumia-tytot-ovat-edelleen-erilaisia-kuin-pojat/

Aiemmat artikkelini aiheeseen liittyen
https://mikkorahikka.blog/tag/ylioppilaskoe/

Jätä kommentti

This site uses Akismet to reduce spam. Learn how your comment data is processed.