Edellisessä tarinassani esitin miten YTL:n jakamaa oppilaskohtaista dataa voi käsitellä Google Sheetsissä. Tässä esitän saman MS Excelillä. Käytän tarinassani edellisen tarinan virkkeitä laiskuuksissani, joten älä ihmettele jos tarina tuntuu tutulta.
Ylioppilaslautakunnan sivulla Oppilaitoskohtaisia tunnuslukuja https://www.ylioppilastutkinto.fi/tietopalvelut/tilastot/koulukohtaisia-tunnuslukuja on ohjeet miten ladata kevään 19 ylioppilaskirjoitusten tulokset csv-tiedostona. Myös aiempien tutkintokertojen tiedostot ovat ladattavissa. Tiedostoja on kahta eri tyyppiä riippuen niiden päivitettävyydestä. D3000-sarjan tiedostot eivät päivity. D4000-sarjan tiedostot päivittyvät kun ylioppilastutkinnon tiedot täsmentyvät esimerkiksi tarkistusarvostelun takia.
Tehdään tämä versio eri tiedostosta kuin edellinen Google Sheets -versio. Sheets-versiossa tutkittiin pakollisten aineiden keskiarvoa. Tässä käytetään kaikkien aineiden dataa. Kevään 19 kaikkien aineiden aineiden (ei päivittyvät) tulokset löytyvät tiedostosta https://www.ylioppilastutkinto.fi/ext/data/FT2019KD3001.csv. Käytän tässä Excelin Mac-versiota koska olen omenaihminen. Testailen lähipäivinä onko Windows-versiossa niin paljon eroa, että sitä pitäisi kommentoida.
Kun klikkaat tuohon osoitteeseen, niin selaimesi lataa tiedoston lataukset-kansioosi. Käytän tätä tiedostoa mallina siitä, miten tietoa voi käsitellä Excelin Pivot-taulukkotoiminnolla.
Avaa Excelillä ladattu csv-tiedosto. Excel avaa tiedoston Ohjattu tiedoston luominen-ikkunaan.

Valitse seuraavassa ikkunassa Erottimeksi puolipiste ”:”. Jos kaikki meni oikein, niin Excel avaa suuren taulukon.

Tässä vaiheessa tiedostolle on syytä antaa nimi vaikka 19Kkaikki. Taulukon otsikkoriveinä on:
tutkintokerta koulun_nro koulun_nimi opetuskieli tyyppi sukup yht A O Z I W Q A5 O5 M N BI FF FY HI PS UE UO ET GE KE TE YH BA BB CA CB EA FA SA PA VA EC FC SC PC VC DC IC QC GC TC L1 L7 opintotausta
Ytl:n sivulla on ohje muuttujanimistä:
- [koekoodi] – Arvosanapisteet; I=0, A=2, B=3, C=4, M=5, E=6, L=7
- yht – Tutkinnon arvosanapisteet yhteensä
- sukup – Sukupuoli 1=mies, 2=nainen
- ka_pak – Pakollisten aineiden keskiarvo
- ka – Oppilaitoksen keskiarvo kokelaiden kaikken kokeiden keskiarvosta
- n – Vastaavasti kokeiden lukumäärä (oppilatoksen keskiarvo)
- ka_pkr – Oppilaitoksen keskiarvo kokelaiden ”pitkien aineiden” keskiarvosta; mukana pitkä matematiikka, pitkät kielet, pitkä toinen kotimainen, äidinkieli ja kaikki reaalikokeet
- n_pkr – Vastaavasti kokeiden lukumäärä (oppilaitoksen keskiarvo)
- ylioppilas – niiden kokelaiden lukumäärä, jotka ovat kyseisellä tutkintokerralla saaneet hyväksytyn tutkintokokonaisuuden ja joilla lisäksi on julkaisuajankohtana lukion päättötodistus.
- opintotausta:
- 1 – Lukion opiskelija
- 2 – Ammatillisten opintojen pohjalta tutkintoa suorittava kokelas
- 3 – Lukion oppimäärää ja ammatillista tutkintoa suorittava kokelas
- 4 – Muu opiskelija/tuntematon
Ytl:n sivulta löytyy linkki sivulle https://www.ylioppilastutkinto.fi/ext/data/FT2016KD0010.csv, sieltä löytyvät yo-kokeiden koodit.
koe nimi namn
A Äidinkieli, suomi Modersmålet, finska
A5 Suomi toisena kielenä Finska som andraspråk
BA Ruotsi, pitkä oppimäärä Svenska, lång lärokurs
BB Ruotsi, keskipitkä oppimäärä Svenska, medellång lärokurs
BI Biologia Biologi
CA Suomi, pitkä oppimäärä Finska, lång lärokurs
CB Suomi, keskipitkä oppimäärä Finska, medellång lärokurs
DC Pohjoissaame, lyhyt oppimäärä Nordsamiska, kort lärokurs
EA Englanti, pitkä oppimäärä Engelska, lång lärokurs
EC Englanti, lyhyt oppimäärä Engelska, kort lärokurs
ET Elämänkatsomustieto Livsåskådningskunskap
FA Ranska, pitkä oppimäärä Franska, lång lärokurs
FC Ranska, lyhyt oppimäärä Franska, kort lärokurs
FF Filosofia Filosofi
FY Fysiikka Fysik
GC Portugali, lyhyt oppimäärä Portugisiska, kort lärokurs
GE Maantiede Geografi
HI Historia Historia
I Äidinkieli, inarinsaame Modersmålet, enaresamiska
IC Inarinsaame, lyhyt oppimäärä Enaresamiska, kort lärokurs
KE Kemia Kemi
L1 Latina, lyhyt oppimäärä Latin, kort lärokurs
L7 Latina, pidempi oppimäärä Latin, längre lärokurs
M Matematiikka, pitkä oppimäärä Matematik, lång lärokurs
N Matematiikka, lyhyt oppimäärä Matematik, kort lärokurs
O Äidinkieli, ruotsi Modersmålet, svenska
O5 Ruotsi toisena kielenä Svenska som andraspråk
PA Espanja, pitkä oppimäärä Spanska, lång lärokurs
PC Espanja, lyhyt oppimäärä Spanska, kort lärokurs
PS Psykologia Psykologi
Q – ei käytössä – – ej i bruk –
QC Koltansaame, lyhyt oppimäärä Skoltsamiska, kort lärokurs
SA Saksa, pitkä oppimäärä Tyska, lång lärokurs
SC Saksa, lyhyt oppimäärä Tyska, kort lärokurs
TC Italia, lyhyt oppimäärä Italienska, kort lärokurs
TE Terveystieto Hälsokunskap
UE Evankelis-luterilainen uskonto Evangelisk-luthersk religion
UO Ortodoksi uskonto Ortodox religion
VA Venäjä, pitkä oppimäärä Ryska, lång lärokurs
VC Venäjä, lyhyt oppimäärä Ryska, kort lärokurs
W Äidinkieli, koltansaame Modersmålet, skoltsamiska
YH Yhteiskuntaoppi Samhällslära
Z Äidinkieli, pohjoissaame Modersmålet, nordsamiska
Valitse Excelin Lisää valikosta Pivot-taulukko

ja paina OK.

Valitse Pivot—taulukon kentät ikkunasta koulun_nimi ja yht.

Vedä ∑ Arvot-laatikosta koulun nimi Rivit laatikkoon ja klikkaa ∑ Arvot-laatikossa i-pompulaan. Muuta Summa Keskiarvoksi.

Valitse alue B4:B404 eli koulujen keskiarvot ilman otsikkoa ja Tiedot-valikosta Lajittele ja suodata Ö:stä A:han.

Näin saatiin koulut järjestykseen. Miksi, ainakin minä kysyn?
Kun pisteiden arvot kopioi ja liittää uuteen lomakkeeseen, niin Excel piirtää oletusarvoilla (hyvä on, oli pakko lisätä otsikko) seuraavanlaisen kuvaajan.

Kun tätä vertaa Google Sheetsin piirtämään histogrammiin pakollisista aineista, niin pohdituttaa, miksi siinä on tuo kyhmy oikealla ja mitä se tarkoittaa.

Tätä kirjoitettaessa havaitsin, että ainakin minulla Excel toimi jouhevammin. Se voinee johtua siitä, että olen käyttänyt Exceliä 30 v ja Sheetsiä 5 v.
Palaan aiheeseen lähiaikoina. Tiedon louhinta on kivaa, kun sitä osaa. Vasitenkin se oppimispuoli on aina hauskaa.