Pivot ja Excel YTL:n datasta

Edellisessä tarinassani esitin miten YTL:n jakamaa oppilaskohtaista dataa voi käsitellä Google Sheetsissä. Tässä esitän saman MS Excelillä. Käytän tarinassani edellisen tarinan virkkeitä laiskuuksissani, joten älä ihmettele jos tarina tuntuu tutulta.

Ylioppilaslautakunnan sivulla Oppilaitoskohtaisia tunnuslukuja https://www.ylioppilastutkinto.fi/tietopalvelut/tilastot/koulukohtaisia-tunnuslukuja on ohjeet miten ladata kevään 19 ylioppilaskirjoitusten tulokset csv-tiedostona. Myös aiempien tutkintokertojen tiedostot ovat ladattavissa. Tiedostoja on kahta eri tyyppiä riippuen niiden päivitettävyydestä. D3000-sarjan tiedostot eivät päivity. D4000-sarjan tiedostot päivittyvät kun ylioppilastutkinnon tiedot täsmentyvät esimerkiksi tarkistusarvostelun takia.

Tehdään tämä versio eri tiedostosta kuin edellinen Google Sheets -versio. Sheets-versiossa tutkittiin pakollisten aineiden keskiarvoa. Tässä käytetään kaikkien aineiden dataa. Kevään 19 kaikkien aineiden aineiden (ei päivittyvät) tulokset löytyvät tiedostosta https://www.ylioppilastutkinto.fi/ext/data/FT2019KD3001.csv. Käytän tässä Excelin Mac-versiota koska olen omenaihminen. Testailen lähipäivinä onko Windows-versiossa niin paljon eroa, että sitä pitäisi kommentoida.

Kun klikkaat tuohon osoitteeseen, niin selaimesi lataa tiedoston lataukset-kansioosi. Käytän tätä tiedostoa mallina siitä, miten tietoa voi käsitellä Excelin Pivot-taulukkotoiminnolla.

Avaa Excelillä ladattu csv-tiedosto. Excel avaa tiedoston Ohjattu tiedoston luominen-ikkunaan.

Valitse seuraavassa ikkunassa Erottimeksi puolipiste ”:”. Jos kaikki meni oikein, niin Excel avaa suuren taulukon.

Tässä vaiheessa tiedostolle on syytä antaa nimi vaikka 19Kkaikki. Taulukon otsikkoriveinä on:

tutkintokerta koulun_nro   koulun_nimi opetuskieli    tyyppi           sukup            yht                A                   O                   Z                   I                      W                  Q                   A5                 O5                 M                  N                   BI                  FF                 FY                 HI                      PS                 UE                 UO                ET                 GE                KE                TE                 YH                BA                BB                      CA                CB                 EA                FA                 SA                 PA                VA                EC                 FC                 SC                      PC                 VC                DC                IC                  QC                GC                TC                 L1                 L7                      opintotausta

Ytl:n sivulla on ohje muuttujanimistä:

  • [koekoodi] – Arvosanapisteet; I=0, A=2, B=3, C=4, M=5, E=6, L=7
  • yht – Tutkinnon arvosanapisteet yhteensä
  • sukup – Sukupuoli 1=mies, 2=nainen
  • ka_pak – Pakollisten aineiden keskiarvo
  • ka – Oppilaitoksen keskiarvo kokelaiden kaikken kokeiden keskiarvosta
  • n – Vastaavasti kokeiden lukumäärä (oppilatoksen keskiarvo)
  • ka_pkr – Oppilaitoksen keskiarvo kokelaiden ”pitkien aineiden” keskiarvosta; mukana pitkä matematiikka, pitkät kielet, pitkä toinen kotimainen, äidinkieli ja kaikki reaalikokeet
  • n_pkr – Vastaavasti kokeiden lukumäärä (oppilaitoksen keskiarvo)
  • ylioppilas – niiden kokelaiden lukumäärä, jotka ovat kyseisellä tutkintokerralla saaneet hyväksytyn tutkintokokonaisuuden ja joilla lisäksi on julkaisuajankohtana lukion päättötodistus.
  • opintotausta:
    • 1 – Lukion opiskelija
    • 2 – Ammatillisten opintojen pohjalta tutkintoa suorittava kokelas
    • 3 – Lukion oppimäärää ja ammatillista tutkintoa suorittava kokelas
    • 4 – Muu opiskelija/tuntematon

Ytl:n sivulta löytyy linkki sivulle https://www.ylioppilastutkinto.fi/ext/data/FT2016KD0010.csv, sieltä löytyvät yo-kokeiden koodit.

koe                nimi              namn

A                   Äidinkieli, suomi                Modersmålet, finska

A5                 Suomi toisena kielenä        Finska som andraspråk

BA                Ruotsi, pitkä oppimäärä     Svenska, lång lärokurs

BB                Ruotsi, keskipitkä oppimäärä                  Svenska, medellång lärokurs

BI                  Biologia        Biologi

CA                Suomi, pitkä oppimäärä     Finska, lång lärokurs

CB                Suomi, keskipitkä oppimäärä                  Finska, medellång lärokurs

DC                Pohjoissaame, lyhyt oppimäärä               Nordsamiska, kort lärokurs

EA                Englanti, pitkä oppimäärä  Engelska, lång lärokurs

EC                 Englanti, lyhyt oppimäärä  Engelska, kort lärokurs

ET                 Elämänkatsomustieto         Livsåskådningskunskap

FA                 Ranska, pitkä oppimäärä    Franska, lång lärokurs

FC                 Ranska, lyhyt oppimäärä    Franska, kort lärokurs

FF                 Filosofia       Filosofi

FY                 Fysiikka        Fysik

GC                Portugali, lyhyt oppimäärä Portugisiska, kort lärokurs

GE                Maantiede     Geografi

HI                 Historia         Historia

I                    Äidinkieli, inarinsaame      Modersmålet, enaresamiska

IC                  Inarinsaame, lyhyt oppimäärä                  Enaresamiska, kort lärokurs

KE                Kemia           Kemi

L1                 Latina, lyhyt oppimäärä     Latin, kort lärokurs

L7                 Latina, pidempi oppimäärä Latin, längre lärokurs

M                  Matematiikka, pitkä oppimäärä               Matematik, lång lärokurs

N                   Matematiikka, lyhyt oppimäärä               Matematik, kort lärokurs

O                   Äidinkieli, ruotsi                Modersmålet, svenska

O5                 Ruotsi toisena kielenä        Svenska som andraspråk

PA                 Espanja, pitkä oppimäärä   Spanska, lång lärokurs

PC                 Espanja, lyhyt oppimäärä   Spanska, kort lärokurs

PS                 Psykologia    Psykologi

Q                   – ei käytössä –                     – ej i bruk –

QC                Koltansaame, lyhyt oppimäärä                Skoltsamiska, kort lärokurs

SA                 Saksa, pitkä oppimäärä      Tyska, lång lärokurs

SC                 Saksa, lyhyt oppimäärä      Tyska, kort lärokurs

TC                 Italia, lyhyt oppimäärä       Italienska, kort lärokurs

TE                 Terveystieto  Hälsokunskap

UE                Evankelis-luterilainen uskonto                Evangelisk-luthersk religion

UO                Ortodoksi uskonto              Ortodox religion

VA                Venäjä, pitkä oppimäärä    Ryska, lång lärokurs

VC                Venäjä, lyhyt oppimäärä    Ryska, kort lärokurs

W                  Äidinkieli, koltansaame     Modersmålet, skoltsamiska

YH                Yhteiskuntaoppi                 Samhällslära

Z                   Äidinkieli, pohjoissaame    Modersmålet, nordsamiska

Valitse Excelin Lisää valikosta Pivot-taulukko

ja paina OK.

Valitse Pivot—taulukon kentät ikkunasta koulun_nimi ja yht.

Vedä ∑ Arvot-laatikosta koulun nimi Rivit laatikkoon ja klikkaa ∑ Arvot-laatikossa i-pompulaan. Muuta Summa Keskiarvoksi.

Valitse alue B4:B404 eli koulujen keskiarvot ilman otsikkoa ja Tiedot-valikosta Lajittele ja suodata Ö:stä A:han.

Näin saatiin koulut järjestykseen. Miksi, ainakin minä kysyn?

Kun pisteiden arvot kopioi ja liittää uuteen lomakkeeseen, niin Excel piirtää oletusarvoilla (hyvä on, oli pakko lisätä otsikko) seuraavanlaisen kuvaajan.

kevään 19 yo-kokeiden kaikkien aineiden koulukohtainen keskiarvo exelillä

Kun tätä vertaa Google Sheetsin piirtämään histogrammiin pakollisista aineista, niin pohdituttaa, miksi siinä on tuo kyhmy oikealla ja mitä se tarkoittaa.

kevään 19 yo-kokeiden pakollisten aineiden koulukohtainen keskiarvo sheetsillä

Tätä kirjoitettaessa havaitsin, että ainakin minulla Excel toimi jouhevammin. Se voinee johtua siitä, että olen käyttänyt Exceliä 30 v ja Sheetsiä 5 v.

Palaan aiheeseen lähiaikoina. Tiedon louhinta on kivaa, kun sitä osaa. Vasitenkin se oppimispuoli on aina hauskaa.

Advertisement

Ylioppilasdatan louhimista Pivot-taulukoilla

[edit. 25.5. Korjasin pari kirjoitus vihrettä ja muutin yo-tiedoston otsikkorivi-kohdan luettavammaksi.]

Tein tämän alunperin Excelillä, niinpä päätin tuottaa saman Google Sheetsin Pivot toiminnolla, jotta oppisin uutta. Tulevassa tarinassa teen saman Excelillä.

Mielestäni kaikkien matikan opettajien tulisi osata käyttää Pivot-toimintoa taulukkolaskennossa ja opettaa se oppilailleen. Näin monen taulukkoja käyttävien henkilöiden työ muuttuisi helpommaksi ja maamme kansantalous kasvaisi :o)

Ylioppilaslautakunnan sivulla Oppilaitoskohtaisia tunnuslukuja https://www.ylioppilastutkinto.fi/tietopalvelut/tilastot/koulukohtaisia-tunnuslukuja on ohjeet miten ladata kevään 19 ylioppilaskirjoitusten tulokset csv-tiedostona. Myös aiempien tutkintokertojen tiedostot ovat ladattavissa. Tiedostoja on kahta eri tyyppiä riippuen niiden päivitettävyydestä. D3000-sarjan tiedostot eivät päivity. D4000-sarjan tiedostot päivittyvät kun ylioppilastutkinnon tiedot täsmentyvät esimerkiksi tarkistusarvostelun takia.

Kevään 19 pakollisten aineiden (ei päivittyvät) tulokset löytyvät tiedostosta https://www.ylioppilastutkinto.fi/ext/data/FT2019KD3002.csv

Kun klikkaat tuohon osoitteeseen, niin selaimesi lataa tiedoston lataukset-kansioosi. Käytän tätä tiedostoa mallina siitä, miten tietoa voi käsitellä Google Sheetsin ja Excelin Pivot-taulukkotoiminnolla (myöhemmin).

Tavoitteena on tuottaa samankaltainen lista koulujen menestymisessä pakollisissa aineissa kuin lehdet ovat tuottaneet. Samoilla menetelmillä voi helposti laittaa kouluja järjestykseen vaikkapa eri oppiaineiden tulosten perusteella tai vertailla tyttöjen ja poikien (vaikka sukupuolella ei ole väliä) menestymistä eri aineissa.

Google Sheets

Koska Google on luonut Google Sheetsin, käytän Googlen Chrome selainta. Mene omaan Driveesi ja luo tyhjä Google Sheets-taulukko. Valise Tiedosto-valikosta Tuo ja Tuo tiedosto-ikkunassa Lähetä. Klikkaa Valitse tiedosto ja hae ladattu Ytl:n tiedosto Lataukset-kansiosta. Laita Erotintyypiksi puolipiste ”;”.

Jos kaikki meni oikein meillä on 29574 riviä dataa eli 29573 oppilaan pakollisten aineiden tulokset. Tässä vaiheessa tiedostolle on syytä antaa nimi vaikka 19Kpakolliset.

Otsikkorivinä näyttää olevan seuraavanlaista:

tutkintokerta koulun_nro koulun_nimi opetuskieli tyyppi sukup yht A O Z I W Q A5 O5 M N BI FF FY HI PS UE UO ET GE KE TE YH BA BB CA CB EA FA SA PA VA EC FC SC PC VC DC IC QC GC TC L1 L7 opintotausta

Ytl:n sivulla on ohje muuttujanimistä:

  • [koekoodi] – Arvosanapisteet; I=0, A=2, B=3, C=4, M=5, E=6, L=7
  • yht – Tutkinnon arvosanapisteet yhteensä
  • sukup – Sukupuoli 1=mies, 2=nainen
  • ka_pak – Pakollisten aineiden keskiarvo
  • ka – Oppilaitoksen keskiarvo kokelaiden kaikken kokeiden keskiarvosta
  • n – Vastaavasti kokeiden lukumäärä (oppilatoksen keskiarvo)
  • ka_pkr – Oppilaitoksen keskiarvo kokelaiden ”pitkien aineiden” keskiarvosta; mukana pitkä matematiikka, pitkät kielet, pitkä toinen kotimainen, äidinkieli ja kaikki reaalikokeet
  • n_pkr – Vastaavasti kokeiden lukumäärä (oppilaitoksen keskiarvo)
  • ylioppilas – niiden kokelaiden lukumäärä, jotka ovat kyseisellä tutkintokerralla saaneet hyväksytyn tutkintokokonaisuuden ja joilla lisäksi on julkaisuajankohtana lukion päättötodistus.
  • opintotausta:
    • 1 – Lukion opiskelija
    • 2 – Ammatillisten opintojen pohjalta tutkintoa suorittava kokelas
    • 3 – Lukion oppimäärää ja ammatillista tutkintoa suorittava kokelas
    • 4 – Muu opiskelija/tuntematon

Ytl:n sivulta löytyy linkki sivulle https://www.ylioppilastutkinto.fi/ext/data/FT2016KD0010.csv, sieltä löytyvät yo-kokeiden koodit.

koe                nimi              namn

A                   Äidinkieli, suomi                Modersmålet, finska

A5                 Suomi toisena kielenä        Finska som andraspråk

BA                Ruotsi, pitkä oppimäärä     Svenska, lång lärokurs

BB                Ruotsi, keskipitkä oppimäärä                  Svenska, medellång lärokurs

BI                  Biologia        Biologi

CA                Suomi, pitkä oppimäärä     Finska, lång lärokurs

CB                Suomi, keskipitkä oppimäärä                  Finska, medellång lärokurs

DC                Pohjoissaame, lyhyt oppimäärä               Nordsamiska, kort lärokurs

EA                Englanti, pitkä oppimäärä  Engelska, lång lärokurs

EC                 Englanti, lyhyt oppimäärä  Engelska, kort lärokurs

ET                 Elämänkatsomustieto         Livsåskådningskunskap

FA                 Ranska, pitkä oppimäärä    Franska, lång lärokurs

FC                 Ranska, lyhyt oppimäärä    Franska, kort lärokurs

FF                 Filosofia       Filosofi

FY                 Fysiikka        Fysik

GC                Portugali, lyhyt oppimäärä Portugisiska, kort lärokurs

GE                Maantiede     Geografi

HI                 Historia         Historia

I                    Äidinkieli, inarinsaame      Modersmålet, enaresamiska

IC                  Inarinsaame, lyhyt oppimäärä                  Enaresamiska, kort lärokurs

KE                Kemia           Kemi

L1                 Latina, lyhyt oppimäärä     Latin, kort lärokurs

L7                 Latina, pidempi oppimäärä Latin, längre lärokurs

M                  Matematiikka, pitkä oppimäärä               Matematik, lång lärokurs

N                   Matematiikka, lyhyt oppimäärä               Matematik, kort lärokurs

O                   Äidinkieli, ruotsi                Modersmålet, svenska

O5                 Ruotsi toisena kielenä        Svenska som andraspråk

PA                 Espanja, pitkä oppimäärä   Spanska, lång lärokurs

PC                 Espanja, lyhyt oppimäärä   Spanska, kort lärokurs

PS                 Psykologia    Psykologi

Q                   – ei käytössä –                     – ej i bruk –

QC                Koltansaame, lyhyt oppimäärä                Skoltsamiska, kort lärokurs

SA                 Saksa, pitkä oppimäärä      Tyska, lång lärokurs

SC                 Saksa, lyhyt oppimäärä      Tyska, kort lärokurs

TC                 Italia, lyhyt oppimäärä       Italienska, kort lärokurs

TE                 Terveystieto  Hälsokunskap

UE                Evankelis-luterilainen uskonto                Evangelisk-luthersk religion

UO                Ortodoksi uskonto              Ortodox religion

VA                Venäjä, pitkä oppimäärä    Ryska, lång lärokurs

VC                Venäjä, lyhyt oppimäärä    Ryska, kort lärokurs

W                  Äidinkieli, koltansaame     Modersmålet, skoltsamiska

YH                Yhteiskuntaoppi                 Samhällslära

Z                   Äidinkieli, pohjoissaame    Modersmålet, nordsamiska

Minä itse koen vastenmielisenä laittaa kouluja johonkin ”paremmuusjärjestykseen” mutta pitkin hampain esitän tässä, miten se tehdään.

Google Sheets-taulukossa valitse kaikki rivit klikkaamalla vasemmalla riviin 1 ja sitten Vaihto pohjassa riviin 25974. Tämä on kohta hankala muistaa, jos on tottunut käyttämään Exceliä. Valitaan Tiedot-valikosta Pivot-taulukko.

(Google Sheets-taulukossa valitse ensin koko taulukko klikkaamalla taulukon rivien ja sarakkeiden nurkkaan tai ctrl -A (Macissa cmd-A). Ei toimi sillä se tuottaa tyhjän rivin alkuun joka haittaa suuruusjärjestystä myöhemmin.)

Sheets luo uuden lomakkeen nimeltä Pivot-taulukko.

Valitse Pivot-taulukon editorissa Rivit -> Lisää -> Lajitteluperuste -> Koulun nimi ja Arvot ->Lisää -> yht sekä Yhteenvedon peruste -> Average. Jätä myös Kokonaismäärä pois.

Näin saatiin koulukohtaiset keskiarvot laskettua pakollisista kirjoitetuista aineista.

Jostain kumman syystä en saanut suuruusjärjestystä toimimaan Pivot-taulukossa. Niinpä valitsin koko taulukon ctrl-A:lla (cmd-A Macissä) loin uuden lomakkeen ja Muokkaa valikosta Liitä määräten ->Liitä vain Arvoja.

Valitaan koko taulukko ja Tiedot-valikosta Lajitteluväli.

Näin saatiin koulut järjestykseen.

Kuvittelin, että tämä olisi ollut helpompaa. Se muuten on Excelillä. Niinpä seuraavassa tarinassa tehdään sama Execlissä ja siirretään dataa GeoGebraan.

Lisätään loppuun bonuksena Google Sheetsin lähes ilmaiseksi tuottama histogrammi.