Kevään 21 yo-kirjoitusten korrelaatiomatriisi

[edit 28.5. korjasin kirjoitusvihreitä ja lisäsin linkin originaalitiedostoon]

Toissa vuonna laskin LibreOfficella korrelaatiomatriisin kevään 19 ylioppilaskirjoitustuloksista. Silloin minua ihmetytti, että äidinkielellä ei ollut kovinkaan suuria korrelaatiokertoimia muiden aineiden kanssa. Biologialla ja maantieteellä oli huomattava tai voimakas yhdeksän eri aineen kanssa. Katso https://mikkorahikka.blog/2020/01/20/korrelaatiomatriisi-libreofficella-ytln-datasta/

Tänä keväänä tuotin saman matriisin käyttäen Exceliä. Sopivasti kopiomalla ja liittämällä transpoosin sain aikaan koko matriisin. Samalla muokkasin tietoja sen verran, että merkkasin korrelaation nollaksi niille ainepareille, joilla ei ollut vähintään kahta kirjoittajaa molemmissa aineissa. Laskin mukaan vain sellaiset aineet, joissa kirjoittajia oli yli 100.

Tällä kertaa laskin myös korrelaation kokonaispisteiden kanssa ja vielä lisäksi selitysasteiden eli korrelaatiokertoimien neliöiden summan kaikille aineille (kolmanneksi oikean puoleisin sarake). Toiseksi oikeanpuoleisella sarakkeella on laskettu niiden solujen lukumäärä, joissa r > 0,6 kyseisellä rivillä.

Avaa kuva suurena omaan välilehteen.

Tänä keväänä ihmetyttää se, että elämänkatsomustiedolla on korrelaatiokerroin huomattava tai voimakas ( > 0,6) 14 eri oppiaineen kanssa. Lukumäärän perusteella myös uskonto, yhteiskuntaoppi, biologia, psykologia ja ranskan lyhyt oppimäärä ovat sellaisia aineita, että niillä r > 0,6 usean muun aineen kanssa.

Kun tutkitaan selitysasteen summia, niin suurimmat summat ovat elämänkatsomustiedolla, yhteiskuntaopilla, uskonnolla, lyhyellä saksalla ja biologialla. 

Elämänkatsomustietoa kirjoitti vain 171 kokelasta, se voi selittä jonkin verran tätä tulosta.

Mitäköhän tämä tarkoittaa? Mitä se kertoo lukiostamme ja ylioppilaskokeesta yleensä?

Alla kuva aineiden lyhenteistä.

Alkuperäinen csv-tiedosto löytyy osoitteesta https://www.ylioppilastutkinto.fi/ext/data/FT2021KD3001.csv

Hiihtodata GeoGebraan

[edit 18.2. Lisäsin huomion (aika, korkeus, matka) -toimivuudesta ja muokkasin komentojen ulkoasut.]

Hiihtäminen on mukavaa. Varsinkin, jos on hyvä keli ja kunto. Kävin Nurmijärven Alhonniitun/Mutaanmäen ladulla ja tallensin suoritukseni :o) iPhoneni Walkmeter-appiin. Walkmeter tallentaa paljon tietoa, jonka se laskee GPS-datasta. Päätin tutkia, miten tuon datan saa GeoGebraan, ja mitä sillä voisi tehdä.

data iPhonesta LibreOfficeen, Google Sheetsiin tai Exceliin

Lähetin Walkmeter-appista csv-muotoisen tiedoston sähköpostilla itselleni. Päätin kokeilla sen avaamista Excelissä, Google Docsissa LibreOfficen Calcissa. Excel avasi tiedoston automaattisesti OK ja Google Sheets sotki tiedoston avatessaan sen. LibreOffisessa piti Tekstin tuonti -asetusikkunassa oletusasetuksesta poistaa pilkku, niin sarakkeet ja otsikot menivät oikein.

Tietoa oli S sarakkeelle asti.

Kuva, joka sisältää kohteen pöytä

Kuvaus luotu automaattisesti

Poistin turhan datan, palaan joskus paikkatiedon käyttämiseen taulukkolaskennassa.

Kuva, joka sisältää kohteen pöytä

Kuvaus luotu automaattisesti

data GeoGebraan

Kopioin desimaalipilkullisen datan ja sijoitin GeoGebran taulukkolaskentaan. Onneksi luvut muuttuivat automaattisesti desimaalipisteellisiksi. 

Kuva, joka sisältää kohteen pöytä

Kuvaus luotu automaattisesti

Luvuista saisi helposti erilaisia pistelistoja valitsemalla alueita ja käyttämällä Lue pistelista -työkalua. Esitän tässä toisen menetelmän pistelistojen luomiseen. Se soveltuu esimerkiksi sellaisissa tilanteissa, joissa valinnan tekeminen GeoGebran taulukkolaskennasta on hankalaa.

Luodaan taulukkolaskennan sarakkeiden arvoista listoja kirjoittamalla syöttökenttään

aika= A2:A447
korkeus=B2:B447
matkakm=C2:C447

Muutetaan matkan kilometrit metreiksi uuteen listaan.

matka = 1000*matkakm
Kuva, joka sisältää kohteen teksti

Kuvaus luotu automaattisesti

ts-koordinaatisto

Luodaan aika-paikka -pistelista 

ts = (aika, matka)

Kuvaajasta nähdään, miten hiihtoni on sujunut. Välillä olen näköjään pitänyt taukoa ja muutamassa kohdassa vauhti on ollut aika suuri.

xh-koordinaatisto

Luodaan Piirtoalueelle 2 paikka-korkeus -kuvaaja. Sitä varten avataan Näytä-valikosta Piirtoalue 2. Sitten näppäillään Syöttökenttään

sh = (matka, korkeus)

Mikäli kuvaaja syntyykin Piirtoalue 1:lle, niin sh-pistelista asetuksista kohdasta Lisäasetukset saa säädettyä, kummalla piirtoalueella pisteet näkyvät. Samalla kannattaa poistaa pisteet 3D-alueelta.

Kuva, joka sisältää kohteen teksti

Kuvaus luotu automaattisesti

Kuvaajasta näkee, että korkeusdatassa on jonkin verran virhettä. Aloitin ja lopetin hiihdon samasta paikasta, korkeusdatan alku ja loppukorkeuden välillä on kuuden metrin ero.

Kuvaajasta näkyy myös, että latuprofiili on aika rankka. Taisin seisahdella noissa ylämäissä muutaman kerran. Toisaalta pitkissä alamäissä vauhti nousi aika suureksi. Nopeusdata kertoo, että huippunopeus oli yli 25 km/h. Onneksi en kaatunut.

3D

Tehdään vielä datasta 3D-kuvaaja. Poistetaan aluksi 3D-piirtoalueelta ts-kuvaaja, kuten edelliseessä kuvassa. Näin se ei häiritse varsinaista kuvaajaa.

Luodaan 3D pistelista. Minun järkeni sanoisi, että 3D-listan pitäisi syntyä kuten 2D-listankin eli komennolla (aika, matka, korkeus). Tämä ei toiminutkaan. (Tätä pitää tutkia, sillä omasta mielestäni tämä on aiemmin toiminut. [Huomasinpa julkaisun jälkeen, että komento (aika, korkeus, matka) toimiikin. Mystistä.] Käytetään apuna Zip-komentoa.

tsh= Zip((aa, bb, cc), aa, aika, bb, matka, cc, korkeus)

Komennossa aa, bb ja cc ovat apumuuttujia, aa poimitaan aikalistasta, bb matkalistasta ja cc  korkeuslistasta. Zip käy läpi järjestyksessä kaikki listojen alkiot ja muodostaa niistä 3D pisteitä yhdeksi listaksi.

3D-piirtoalueen akseleita saa skaalattua näppärästi, kun vetää akseleita Vaihto-näppäin pohjassa. Vastaavasti xy-taso liikkuu, kun sitä vetää Vaihto-näppäin pohjassa. 

Valmista 3D-kuvaa voi pyöritellä mielensä mukaan. Ehkäpä tästä saisi jonkin mielekkään fysiikan ongelman. Pitääpä pohtia.

Valmis appi löytyy GeoGebra-materiaaleista https://www.geogebra.org/m/ntkjzskn

Palaan tähän aiheeseen tulevaisuudessa. Pitää tutkia tuota nopeusdataa ja myös paikkadataa. Onneksi olen kuunnellut ystäväni Andersin luennon GPS paikkadatan muuntamisesta suorakulmaiseen koordinaatistoon. 

Hyvää hiihtolomaa kaikille.

Koronavirus – mallintamista GeoGebralla

[14.3.20 Katso uusi artikkeli Korona GeoGebra-kirjasta.
9.3.20 Viimeisin päivitys Korona – GeoGebra -sivulla https://www.geogebra.org/m/yw9yfa68 , jouduin luomaan uuden kopion, vanha meni rikki päivityksen yhteydessä.]

Tutkitaan koronaviruksen ajallista kehittymistä GeoGebran avulla. Käytän tässä linlog -menetelmää, jonka esittelin artikkelissani nimeltä Miksi kuvaajissa esitetään tietoa logaritmisella asteikolla? Tavoitteena on tuottaa GeoGebra-Materiaaleihin sivu tai ehkä GeoGebra-kirja liittyen aiheeseen.

Luodaan appletti kuolleisuuteen liittyen. Worldometers-sivustolla on taulukko, jossa näkyy päivittäinen kuolleisuus. Käsittääkseni kyseinen sivusto tuottaa luotettavasti tiedon ”virallisista” lähteistä.

Koska taulukossa viimeinen päivä on ylinnä, niin haluan kääntää taulukon arvot toisinpäi siten, että vanhin päiväys on ylhäällä. Toisaalta suora kopioiminen ja sijoittaminen ei toimi aivan täydellisesti, niin tässä välissä käytän apuna Google Sheets-taulukkolaskentoa. Tavoitteena on tuottaa GeoGebralla taulukko, jota on helppoa päivittää tulevaisuudessa, vaikkapa kerran viikossa.

Tässä tutkin pelkästään koko Maailman tilastoa, en keskity yksittäisiin valtioihin. Eri valtioihin liittyvä data löytyy sivustolta John Hopkins CSSE -sivulta. Aiheesta kiinnostuneen lukijan kannattaa tutustua tuohon!

GeoGebralla Google Sheetsin avustuksella

Kopioin sivulta https://www.worldometers.info/coronavirus/coronavirus-death-toll/ päivittäisen kuolleisuustaulukon Chrome-selaimella, loin uuden Google Sheets-taulukon ja sijoitin taulukon arvot B1 soluun. Lisäsin päivän järjestysnumeron vasempaan sarakkeeseen kirjoittamalla luvun 1 viimeiselle riville A-sarakkeessa ja 2 soluun toiseksi viimeisessä sarakkeessa. Valitsin nuo luvut ja vedin kahvasta ylöspäin. Lopulta järjestin koko taulukon A-sarakkeen mukaan. Muokkasin sarakkeiden otsikoita siten, että ne ovat solujensa sisällä samalla rivillä poistamalla rivinsiirtoja (muutoin GeoGebraan tulee ylimääräisiä rivejä). Kopioin taulukon Sheetsistä ja sijoitin GeoGebran taulukkolaskentaan.

Tässä artikkelissa käytän GeoGebra 6 -ohjelmaa, sillä tavoitteenani on tuottaa appletti, joka toimii verkkoympäristössä ja jota on helppo ylläpitää suoraan Internetin kautta. Samalla opin paremmin GeoGebra 6:n ominaisuuksia. Tosin näiden artikkeleiden kirjoittaminen on haastavampaa, sillä GeoGebra 6:ssa kopiointi on usein haastavaa.

Perinteisesti valitsisin alueen A1:A23 ja Cmd-näppäin pohjassa (Windowsissa Ctrl) C2:C23 ja loisin niistä pistelistan. Nyt haluan varautua ja haluan valita pisteitä myös tulevaisuutta varten. Niinpä käytän komentoa Solualue kirjoittamalla syöttökenttään

pv = Solualue(A2,A1000)
-> {16, 15, 24,….

ja

kuolleet = Solualue(C2,C1000)
-> {16, 15, 24, …

Taas opin uutta, taulukkolaskennan alueen saa suoraan listaksi kirjoittamalla alkusolu:loppusolu.

Kuva, joka sisältää kohteen näyttökuva

Kuvaus luotu automaattisesti

Pessimisti kun olen, niin varaudun vajaaseen kolmeen vuoteen tässä tarinassa. Toivottavasti näin ei käy. Kun tässä vaiheessa katsoo listaa pv, niin siinä näkyy luvut {1, 2, …, 35}. Kun lisään arvon 36 soluun A37, niin pv-lista muuttuu muutoksen mukaisesti {1, 2, …, 35, 36}. Näin voi tulevaisuudessa helposti lisätä lukuja taulukkoon siten, että ei tarvitse aloittaa joka kerta alusta, jos taulukko muuttuu.

Tässä vaiheessa kiinnostaa miltä kuolleisuus näyttää kuvaajana. Jotta kuvaajassa ei näkyisi kaikille pisteille nimiä, niin pitää vaihtaa asetuksista ”Nimeäminen pois”.Luodaan pistelista nimellä linlin (oletuksena nimeksi olisi tullut l1) komennolla

linlin = (pv, kuolleet)

-> {(1, 16, …

Kuva, joka sisältää kohteen näyttökuva

Kuvaus luotu automaattisesti

Eihän tässä näin pitänyt käydä. Kuvaaja näyttää, että Maan laajuinen kuolleisuus on vähentymässä. Tai sitten tuossa alkuperäisessä datassa on jotain vikaa. Tyyliin jokin iso valtio ei jaa tietoa tai tieto tulee viiveellä tai ….

Jos kuitenkin varaudutaan siihen, että jossain vaiheessa tapahtuu jotain pahempaa.

Tutkitaan, miltä kasvu näyttää, kun otetaan logaritmi kuolleitten määrästä ja luodaan pistelista piirtoalue2:lle. Se saadaan näkyville hampurilaisvalikon Näytä -> Piirtoalue 2 ruksilla.

Kuva, joka sisältää kohteen näyttökuva

Kuvaus luotu automaattisesti

Jos haluat, että kuvaaja syntyy Piirtoalueelle 2, niin klikkaa ensin siihen ja

linlog= (pv,lg(kuolleet))
-> {1, 1.2, (2, 1.18), …

Jos pisteet eivät mene oikealle piirtoalueelle, niin valitse linlog  hiiren oikealla painikkeella ja Lisäasetuksista Piirtoalue2.

Kuva, joka sisältää kohteen näyttökuva

Kuvaus luotu automaattisesti

Tähän tarinaan liittyvä GeoGebra-tiedosto löytyy osoitteesta https://www.geogebra.org/m/vns8jfeg

Tällä hetkellä tuo kuolleisuus ei näytä pahalta, palataan aiheeseen myöhemmin.

Linkit

Worldodometer Data https://www.worldometers.info/coronavirus/coronavirus-death-toll/

Data isommassa mittakaavassa https://gisanddata.maps.arcgis.com/apps/opsdashboard/index.html#/bda7594740fd40299423467b48e9ecf6

GeoGebra-tiedosto, tulen päivittämään sitä noin viikoittain https://www.geogebra.org/m/vns8jfeg