[edit 11.6.24 korjasin ChatGPT:n, kiitos Janne.]
Jotkut opiskelijat ovat kirjoittaneet jostain syystä ylioppilastutkinnossaan sekä pitkän että lyhyen matikan. Päätinpä tutkia tätä ilmiötä, samalla sain vastauksen otsikon kysymykseen kaikilla ainepareilla. Prosenttiosuuksia katsellessa huomasin pienen kummallisuuden kemian kirjoittaneiden ainevalinnoissa.
Tein Python koodinpätkän, joka teki taulukon. Taulukkoon on laskettu keväällä 24 valmistuneiden ylioppilaiden ainepareittain molemmat aineet kirjoittaneiden lukumäärät. Koska taulukko on suurehko, siirsin sen Google Sheetsiin. Näin suuren taulukon tutkiminen on helpompaa taulukkolaskennassa.
lukumäärät taulukkona
Taulukko on alla. Klikkaa kuvaa hiiren oikealla painikkeella, niin saat avattua sen suuremmaksi. Linkki Sheets-tiedostoon on lähteet-luvussa. Oppiainekoodit ovat tarinan lopussa.
Sarake (ja rivi) yht kertoo kuinka monta kevään 24 ylioppilaista kirjoitti kyseisen aineen. Esimerkiksi solun B8 (ja H2) arvo kertoo, että biologiaa kirjoitti 6545 ylioppilasta.
Taulukon solusta F7 (ja G6) nähdään, että sekä pitkän (M), että lyhyen matikan (N) kirjoittajia oli 185 ylioppilasta.
Taulukosta löytyy muutamia mielenkiintoisia lukuja. Suomen (A) ja ruotsin äidinkielenä (O) kirjoitti kolme ylioppilasta. Suomen äidinkielenä (A) ja toisena kielenä (A5) kirjoitti yksi kokelas. Yksikään suomen toisena kielenä (A5) kirjoittanut opiskelija ei kirjoittanut ruotsia äidinkielenään (O).
Englannin pitkänä (EA) ja lyhyenä oppimääränä (EC) kirjoitti 121 nuorta. Ruotsin pitkänä (BA) ja keskipitkänä (BB) kielenä kirjoitti 44 ylioppilasta. 168 kokelasta kirjoitti suomen pitkänä (CA) ja keskipitkänä kielenä (CB). Ranskan pitkänä (FA) ja lyhyenä (FC) oppimääränä kirjoitti 11 nuorta ja saksan pitkänä (SA) ja lyhyenä (SC) kielenä kirjoitti 17 kokelasta. Pitkän (VA) ja lyhyen venäjän (VC) kirjoitti 9 nuorta.
prosenttiosuudet
Edellä lasketut lukumäärät kertovat meille jotain nuorten valinnoista. Lisää tietoa saadaan, kun lasketaan prosenttiosuuksia. Seuraava taulukko on laskettu Google Sheetsissä.
Taulukossa on jaettu kukin solu sitä vastaavan rivin yht-sarakkeen arvolla. Esimerkiksi solussa C37 (suomi äidinkielenä A sarake ja pitkä matikka M rivi) on kaava =C6/$B6 eli suomi äidinkielenä ja pitkän matikan kirjoittaneiden määrä jaettuna pitkän matikan kirjoittaneiden lukumäärällä.
Miten tätä taulukko luetaan. Jos minua kiinnostaa tietää kuinka monta prosenttia fysiikan (FY) kirjoittaneista kirjoitti kemian (KE), niin vastaus löytyy solusta P41. Näin ollen 49,8% fysiikan kirjoittaneista kirjoitti kemian. Vastaavasti kemian kirjoittaneista 63,1% kirjoitti fysiikan.
Pitkän matikan kirjoittaneista kirjoitti 1,6% lyhyen, prosenttiosuus on tällä tarkkuudella sama kuin niillä lyhyen kirjoittaneilla, jotka kirjoittivat pitkän. Lukija varmaan pystyy päättelemään miksi.
Kemian kirjoittaneista havaitaan, että he tuntuvat olevan luonnontieteisiin kallellaan. Heistä 88,3% kirjoitti pitkän matikan, 61,6% biologian ja 63,1% fysiikan. Lisäksi he tietysti kirjoittivat paljon äidinkieltä (87,4 %) ja pitkää englantia (86, 5%). Kemian lisäksi missään muussa aineessa ei ole viittä muuta ainetta, joiden kaikkien osuus olisi yli 60%.
oppiainekoodit
Alla taulukko Ylioppilaslautakunnan käyttämistä oppiainekoodeista.
koe | nimi | koe | nimi |
A | Äidinkieli, suomi | L1 | Latina, lyhyt oppimäärä |
A5 | Suomi toisena kielenä | L7 | Latina, pidempi oppimäärä |
BA | Ruotsi, pitkä oppimäärä | M | Matematiikka, pitkä oppimäärä |
BB | Ruotsi, keskipitkä oppimäärä | N | Matematiikka, lyhyt oppimäärä |
BI | Biologia | O | Äidinkieli, ruotsi |
CA | Suomi, pitkä oppimäärä | O5 | Ruotsi toisena kielenä |
CB | Suomi, keskipitkä oppimäärä | PA | Espanja, pitkä oppimäärä |
DC | Pohjoissaame, lyhyt oppimäärä | PC | Espanja, lyhyt oppimäärä |
EA | Englanti, pitkä oppimäärä | PS | Psykologia |
EC | Englanti, lyhyt oppimäärä | QC | Koltansaame, lyhyt oppimäärä |
ET | Elämänkatsomustieto | SA | Saksa, pitkä oppimäärä |
FA | Ranska, pitkä oppimäärä | SC | Saksa, lyhyt oppimäärä |
FC | Ranska, lyhyt oppimäärä | TC | Italia, lyhyt oppimäärä |
FF | Filosofia | TE | Terveystieto |
FY | Fysiikka | UE | Evankelis-luterilainen uskonto |
GC | Portugali, lyhyt oppimäärä | UO | Ortodoksi uskonto |
GE | Maantiede | VA | Venäjä, pitkä oppimäärä |
HI | Historia | VC | Venäjä, lyhyt oppimäärä |
I | Äidinkieli, inarinsaame | W | Äidinkieli, koltansaame |
IC | Inarinsaame, lyhyt oppimäärä | YH | Yhteiskuntaoppi |
KE | Kemia | Z | Äidinkieli, pohjoissaame |
Aluksi en osannut koodata Pythonilla aineparien lukumäärien laskemista Pandas-kirjaston dataframesta (taulukosta). Onneksi on tekoäly, joka osaa neuvoa tällaisissa tarkasti määritellyissä ongelmissa. Sekä ChatGPT ja Copilot tuottivat erilaiset toimivat koodit. Palaan Python koodiin ja tekoälyjen tuottamiin koodeihin seuraavassa artikkelissani, kunhan ensin varmistan, että oikeasti ymmärrän mitä vieraan älyn tuottamassa koodissa tapahtuu.
lähteet
Google Sheets taulukko
https://docs.google.com/spreadsheets/d/1Cwl5oQzHCyhJ3MDX_kxT2_2XlLw8mzarcm9iJ-ZPA9U/edit?usp=sharing
Ylioppilatutkintolautakunnan OPPILAITOSKOHTAISIA TUNNUSLUKUJA -sivu
https://www.ylioppilastutkinto.fi/fi/tietopalvelut/tilastot/oppilaitoskohtaisia-tunnuslukuja
aiemmat ylioppilastutkintoon liittyvät artikkelini
https://mikkorahikka.blog/tag/ylioppilaskoe/