Kirjoitin pari päivää sitten artikkelin ”Istumapaikkanumeroiden arpominen Excelillä”. Päätin sitten luoda samankaltaisen sovelluksen myös Google Sheetsillä. Varsinkin kun Excel-versioni toimii vain uusilla 365 Exceleillä.
Alun perin aloitin sovelluksen teon Sheetsillä, mutta en saanut SORTN()-funktiota toimimaan haluamallani tavalla. Ongelma ratkesi helpommin Excelillä ja sen SORTBY() ja SEQUENCE() -funktioilla. Excel-versiossa koko homma onnistui yhdellä pitkähköllä komennolla, Google Sheetsissä pitää (ainakin tässä minun ratkaisussani) luoda pari ylimääräistä saraketta, jotka voi lopuksi piilottaa.
Sovellus toimii seuraavasti.
Laitetaan oppilaiden nimet soluun C2 ja siitä alaspäin. Sarakkeelle A luodaan satunnaislukuja saman verran kuin on oppilaiden nimiäkin solun A2 kaavalla =RANDARRAY(COUNTA(C2:C201))
Kun soluun D2 kirjoitetaan kaava =SORTN(A2:B200;COUNTA(C2:C200);A2:A200) ilmestyy sarakkeelle D sarakkeen A satunnaisluvut suuruusjärjestyksessä ja niiden avulla luotu satunnainen järjestysluku sarakkeelle E.
Kun sarakkeet A, B ja D piilotetaan, on sovellus valmis.
Yhdistin Ylioppilastutkintolautakunnan julkaisemat kevään ja syksyn 2022 ylioppilastulostiedostot. Näin sain tietoa kaikista vuoden 2022 ylioppilaista. Piirtelin jakaumakuvaajia aika monesta suositusta (N > 1000) aineesta, jakaumissa näkyy poikien ja tyttöjen tulokset erikseen.
Suurimman osan laskennasta ja kuvaajien piirrosta tein Google Sheetsin Pivot-toiminnalla, osan tilastomatikasta ja joitakin tarkistuksia GeoGebran Yhden muuttujan analyysillä ja Todennäköisyyslaskurilla. Tein myös tarkistuksen vuoksi taulukon eri aineiden keskiarvoista yms. Pythonilla.
pientä pohdiskelua
Minusta näistä kuvaajista ja taulukoista näkyy selvästi, että ylioppilaskokeessa tytöt menestyvät merkittävästi paremmin kuin pojat. Hyvin monessa aineessa tyttöjen yo-arvosanakeskiarvo on parempi kuin poikien. Esimerkiksi äidinkielessä keskiarvojen erotus on noin 0.7 arvosanaa, terveystiedossa 0,8, psykologiassa 0.6 arvosanaa parempi kuin pojilla. Sellaisia paljon kirjoitettuja aineita (N > 5000) joissa poikien tulos on tilastollisesti merkitsevästi (P arvo < 0.001) suurempi kuin tytöillä ovat: pitkä englanti sekä pitkä ja lyhyt matematiikka.
Joku voisi miettiä, onko tämä ongelma vai vaan hyvä juttu. Pitääkö nuorten muuttua tai koulun? Vai pitääkö sen muuttua mitä arvioidaan ja miten?
vuoden 2022 ylioppilaat
Yhteensä vuonna 2022 saimme 29378 ylioppilasta. Puoltoäänien keskiarvo oli 23.51, mediaani 22, keskihajonta 8.26. Kirjoitettujen aineiden lukumäärän keskiarvo oli 5.4.
Keväällä valmistuneita oli 24911 ja syksyllä 4467, yhteensä 29378.
Poikia (sininen) oli 11990 (40.8 %), puoltoäänien keskiarvo 22.4 ja keskihajonta 7.83. Kirjoitettujen aineiden lukumäärän keskiarvo oli pojilla 5.3.
Tyttöjä (punainen) oli 17388 (59,2%), puoltoäänien keskiarvo 24.3, keskihajonta 8,45. Kirjoitettujen aineiden lukumäärän keskiarvo oli tytöillä 5.5.
Seuraavassa taulukossa näkyy eri aineiden kirjoittajien lukumäärät suuruusjärjestyksessä. Enpä ollut ennen tajunnut, että pitkää englantia kirjoitetaan enemmän kuin äidinkieltä. Kaikkea sitä oppii, kun laskee. Taulukon koodien tulkinta löytyy tämän artikkelin lopusta.
aine
kirjoittajia
aine
kirjoittajia
aine
kirjoittajia
EA
27212
FF
1675
PA
63
A
26047
SC
1219
UO
26
N
13276
A5
1204
L1
21
M
13085
CA
1162
O5
15
BB
9378
EC
1134
Z
12
BI
8897
BA
878
GC
9
PS
7801
PC
641
L7
3
FY
7572
CB
617
DC
2
YH
7225
FC
566
I
1
HI
6523
VA
428
W
0
TE
6325
SA
405
Q
0
KE
6178
VC
335
IC
0
GE
3627
ET
296
QC
0
UE
2823
FA
247
O
2061
TC
77
Poikien ja tyttöjen lukumäärät, keskiarvot ja keskihajonnat aineittain
Rivi yht on puoltoäänien määrä ja lkm kirjoitettujen aineiden lukumäärä. NaN tarkoittaa, että keskiarvoa tai keskihajontaa ei voi laskea, koska kirjoittajia on liian vähän.
Alla edellisen taulukon tyttöjen keskiarvon ja poikien keskiarvon erotus.
äidinkieli
Kaikissa kuvaajissa tästä eteenpäin sininen viittaa poikiin/miehiin ja punainen tyttöihin/naisiin. Arvosanoissa 0 vastaa arvosanaa improbatur, 2 arvosanaa approbatur, … ja 7 arvosanaa laudatur.
Äidinkieli, suomi – A
Katsotaan kolmea ylintä arvosanaa M, E ja L. Voisi ajatella, että noilla arvosanoilla on suhteellisen helppo tuottaa yliopistoissa vaadittavia kirjoituksia. Tytöillä näitä arvosanoja on 7080 ja pojilla 2755 eli tyttöjen määrä on yli kaksi ja puoli kertainen verrattuna poikien lukumäärään. Saman tyyppinen ero näkyy myös S2:n ja Äidinkieli ruotsin arvosanoissa.
Suomi toisena kielenä, S2 – A5
Äidinkieli, ruotsi – O
matematiikka
Matikoissa poikien keskiarvot ovat pikkaisen parempia kuin tytöillä.
Pitkä matematiikka – M
Lyhyt matematiikka – N
reaaliaineet
Fysiikka – FY
Kemia – KE
Biologia – BI
Maantiede – GE
Psykologia – PS
Historia – HI
Yhteiskuntaoppi – YH
Evankelis-luterilainen uskonto – UE
Terveystieto – TE
Tyttöjen keskiarvo on 0.83 suurempi kuin poikien. Tämä on suurin näissä kuvaajissa.
Filosofia – FF
Kielet
Ruotsi pitkä – BA
Ruotsi keskipitkä – BB
Englanti pitkä – EA
Pitkässä englannissa poikien keskiarvo on 0.4 suurempi kuin tyttöjen, tämä on ainoa aine, jossa poikien keskiarvo on reilusti suurempi kuin tyttöjen.
Google Sheets-taulukkolaskennassa on jännä funktio GOOGLETRANSLATE. Sen avulla voi kääntää sanoja tai virkkeitä eri kielestä toiseen taulukkolaskennan soluissa. Veikkaan, että tästä voisi olla hyötyä joillekin oppilaille ja opettajille Suomi toisena kielenä kursseilla. Ja monelle muullekin kielten parissa puuhastavalle.
Teen pienen esimerkin, jossa käännän fysiikan ja matikan sanoja englannin, viron, ruotsin, ukrainan ja venäjän kieleen.
Sheets
Google Sheets taulukkoni ensimmäisellä rivillä on kielien nimet otsikkoina. A-sarakkeeseen lisään suomen sanoja. Solussa B2 on solun A2 käännös suomesta englantiin.
Kun funktiot on kirjoitettu 2. riville, niin valitaan kyseinen alue ja ja monistetaan kaavoja alaspäin tarvittavan pitkälle alueen valinnan oikean alareunan kahvasta.
Alla valmis käännöstaulukko. Googlen äly ei aina ymmärrä kirjoittamaani suomen sanaa. Esimerkiksi solun A11 ”säde” ei ole englanniksi ”rain”.