[edit. 25.5. Korjasin pari kirjoitus vihrettä ja muutin yo-tiedoston otsikkorivi-kohdan luettavammaksi.]
Tein tämän alunperin Excelillä, niinpä päätin tuottaa saman Google Sheetsin Pivot toiminnolla, jotta oppisin uutta. Tulevassa tarinassa teen saman Excelillä.
Mielestäni kaikkien matikan opettajien tulisi osata käyttää Pivot-toimintoa taulukkolaskennossa ja opettaa se oppilailleen. Näin monen taulukkoja käyttävien henkilöiden työ muuttuisi helpommaksi ja maamme kansantalous kasvaisi :o)
Ylioppilaslautakunnan sivulla Oppilaitoskohtaisia tunnuslukuja https://www.ylioppilastutkinto.fi/tietopalvelut/tilastot/koulukohtaisia-tunnuslukuja on ohjeet miten ladata kevään 19 ylioppilaskirjoitusten tulokset csv-tiedostona. Myös aiempien tutkintokertojen tiedostot ovat ladattavissa. Tiedostoja on kahta eri tyyppiä riippuen niiden päivitettävyydestä. D3000-sarjan tiedostot eivät päivity. D4000-sarjan tiedostot päivittyvät kun ylioppilastutkinnon tiedot täsmentyvät esimerkiksi tarkistusarvostelun takia.
Kevään 19 pakollisten aineiden (ei päivittyvät) tulokset löytyvät tiedostosta https://www.ylioppilastutkinto.fi/ext/data/FT2019KD3002.csv
Kun klikkaat tuohon osoitteeseen, niin selaimesi lataa tiedoston lataukset-kansioosi. Käytän tätä tiedostoa mallina siitä, miten tietoa voi käsitellä Google Sheetsin ja Excelin Pivot-taulukkotoiminnolla (myöhemmin).
Tavoitteena on tuottaa samankaltainen lista koulujen menestymisessä pakollisissa aineissa kuin lehdet ovat tuottaneet. Samoilla menetelmillä voi helposti laittaa kouluja järjestykseen vaikkapa eri oppiaineiden tulosten perusteella tai vertailla tyttöjen ja poikien (vaikka sukupuolella ei ole väliä) menestymistä eri aineissa.
Google Sheets
Koska Google on luonut Google Sheetsin, käytän Googlen Chrome selainta. Mene omaan Driveesi ja luo tyhjä Google Sheets-taulukko. Valise Tiedosto-valikosta Tuo ja Tuo tiedosto-ikkunassa Lähetä. Klikkaa Valitse tiedosto ja hae ladattu Ytl:n tiedosto Lataukset-kansiosta. Laita Erotintyypiksi puolipiste ”;”.

Jos kaikki meni oikein meillä on 29574 riviä dataa eli 29573 oppilaan pakollisten aineiden tulokset. Tässä vaiheessa tiedostolle on syytä antaa nimi vaikka 19Kpakolliset.

Otsikkorivinä näyttää olevan seuraavanlaista:
tutkintokerta koulun_nro koulun_nimi opetuskieli tyyppi sukup yht A O Z I W Q A5 O5 M N BI FF FY HI PS UE UO ET GE KE TE YH BA BB CA CB EA FA SA PA VA EC FC SC PC VC DC IC QC GC TC L1 L7 opintotausta
Ytl:n sivulla on ohje muuttujanimistä:
- [koekoodi] – Arvosanapisteet; I=0, A=2, B=3, C=4, M=5, E=6, L=7
- yht – Tutkinnon arvosanapisteet yhteensä
- sukup – Sukupuoli 1=mies, 2=nainen
- ka_pak – Pakollisten aineiden keskiarvo
- ka – Oppilaitoksen keskiarvo kokelaiden kaikken kokeiden keskiarvosta
- n – Vastaavasti kokeiden lukumäärä (oppilatoksen keskiarvo)
- ka_pkr – Oppilaitoksen keskiarvo kokelaiden ”pitkien aineiden” keskiarvosta; mukana pitkä matematiikka, pitkät kielet, pitkä toinen kotimainen, äidinkieli ja kaikki reaalikokeet
- n_pkr – Vastaavasti kokeiden lukumäärä (oppilaitoksen keskiarvo)
- ylioppilas – niiden kokelaiden lukumäärä, jotka ovat kyseisellä tutkintokerralla saaneet hyväksytyn tutkintokokonaisuuden ja joilla lisäksi on julkaisuajankohtana lukion päättötodistus.
- opintotausta:
- 1 – Lukion opiskelija
- 2 – Ammatillisten opintojen pohjalta tutkintoa suorittava kokelas
- 3 – Lukion oppimäärää ja ammatillista tutkintoa suorittava kokelas
- 4 – Muu opiskelija/tuntematon
Ytl:n sivulta löytyy linkki sivulle https://www.ylioppilastutkinto.fi/ext/data/FT2016KD0010.csv, sieltä löytyvät yo-kokeiden koodit.
koe nimi namn
A Äidinkieli, suomi Modersmålet, finska
A5 Suomi toisena kielenä Finska som andraspråk
BA Ruotsi, pitkä oppimäärä Svenska, lång lärokurs
BB Ruotsi, keskipitkä oppimäärä Svenska, medellång lärokurs
BI Biologia Biologi
CA Suomi, pitkä oppimäärä Finska, lång lärokurs
CB Suomi, keskipitkä oppimäärä Finska, medellång lärokurs
DC Pohjoissaame, lyhyt oppimäärä Nordsamiska, kort lärokurs
EA Englanti, pitkä oppimäärä Engelska, lång lärokurs
EC Englanti, lyhyt oppimäärä Engelska, kort lärokurs
ET Elämänkatsomustieto Livsåskådningskunskap
FA Ranska, pitkä oppimäärä Franska, lång lärokurs
FC Ranska, lyhyt oppimäärä Franska, kort lärokurs
FF Filosofia Filosofi
FY Fysiikka Fysik
GC Portugali, lyhyt oppimäärä Portugisiska, kort lärokurs
GE Maantiede Geografi
HI Historia Historia
I Äidinkieli, inarinsaame Modersmålet, enaresamiska
IC Inarinsaame, lyhyt oppimäärä Enaresamiska, kort lärokurs
KE Kemia Kemi
L1 Latina, lyhyt oppimäärä Latin, kort lärokurs
L7 Latina, pidempi oppimäärä Latin, längre lärokurs
M Matematiikka, pitkä oppimäärä Matematik, lång lärokurs
N Matematiikka, lyhyt oppimäärä Matematik, kort lärokurs
O Äidinkieli, ruotsi Modersmålet, svenska
O5 Ruotsi toisena kielenä Svenska som andraspråk
PA Espanja, pitkä oppimäärä Spanska, lång lärokurs
PC Espanja, lyhyt oppimäärä Spanska, kort lärokurs
PS Psykologia Psykologi
Q – ei käytössä – – ej i bruk –
QC Koltansaame, lyhyt oppimäärä Skoltsamiska, kort lärokurs
SA Saksa, pitkä oppimäärä Tyska, lång lärokurs
SC Saksa, lyhyt oppimäärä Tyska, kort lärokurs
TC Italia, lyhyt oppimäärä Italienska, kort lärokurs
TE Terveystieto Hälsokunskap
UE Evankelis-luterilainen uskonto Evangelisk-luthersk religion
UO Ortodoksi uskonto Ortodox religion
VA Venäjä, pitkä oppimäärä Ryska, lång lärokurs
VC Venäjä, lyhyt oppimäärä Ryska, kort lärokurs
W Äidinkieli, koltansaame Modersmålet, skoltsamiska
YH Yhteiskuntaoppi Samhällslära
Z Äidinkieli, pohjoissaame Modersmålet, nordsamiska
Minä itse koen vastenmielisenä laittaa kouluja johonkin ”paremmuusjärjestykseen” mutta pitkin hampain esitän tässä, miten se tehdään.
Google Sheets-taulukossa valitse kaikki rivit klikkaamalla vasemmalla riviin 1 ja sitten Vaihto pohjassa riviin 25974. Tämä on kohta hankala muistaa, jos on tottunut käyttämään Exceliä. Valitaan Tiedot-valikosta Pivot-taulukko.
(Google Sheets-taulukossa valitse ensin koko taulukko
klikkaamalla taulukon rivien ja sarakkeiden nurkkaan tai ctrl -A (Macissa
cmd-A). Ei toimi sillä se tuottaa tyhjän rivin alkuun joka haittaa
suuruusjärjestystä myöhemmin.)

Sheets luo uuden lomakkeen nimeltä Pivot-taulukko.

Valitse Pivot-taulukon editorissa Rivit -> Lisää -> Lajitteluperuste -> Koulun nimi ja Arvot ->Lisää -> yht sekä Yhteenvedon peruste -> Average. Jätä myös Kokonaismäärä pois.
Näin saatiin koulukohtaiset keskiarvot laskettua pakollisista kirjoitetuista aineista.

Jostain kumman syystä en saanut suuruusjärjestystä toimimaan Pivot-taulukossa. Niinpä valitsin koko taulukon ctrl-A:lla (cmd-A Macissä) loin uuden lomakkeen ja Muokkaa valikosta Liitä määräten ->Liitä vain Arvoja.
Valitaan koko taulukko ja Tiedot-valikosta Lajitteluväli.

Näin saatiin koulut järjestykseen.

Kuvittelin, että tämä olisi ollut helpompaa. Se muuten on Excelillä. Niinpä seuraavassa tarinassa tehdään sama Execlissä ja siirretään dataa GeoGebraan.
Lisätään loppuun bonuksena Google Sheetsin lähes ilmaiseksi tuottama histogrammi.

2 Replies to “Ylioppilasdatan louhimista Pivot-taulukoilla”