Tilastotieteen sanasto Suomen Tilastoseura (2021) 181 s., https://tilastoseura.fi
Englanti on vakiintunut kansainvälisten luonnontieteellisten julkaisujen kieleksi. Ajattelussa ja käytännön vuorovaikutuksessaan ihminen toimii kuitenkin parhaiten ja mieluiten äidinkielellään. Siksi myös perusopetuksessa on mielestäni syytä käyttää lähinnä äidinkieltä. Yliopistotasolla on useimpien kansakuntien siis pystyttävä puhumaan asioista täsmällisin termein vähintään kahdella kielellä.
Matemaattisten tieteiden alueella käsitteistö on erittäin runsasta ja järjestään epäkalevalaista. Varsin suurelle osalle matemaattistakin sanastoa on kuitenkin syntynyt suomalaisempaa terminologiaa kuin i:n lisääminen vieraskielisten sanojen loppuun. Tämä ilmenee myös Suomen Tilastoseuran viime vuonna julkaisemasta Tilastotieteen sanastosta, jonka ovat laatineet professorit Juha Alho, Elja Arjas, Esa Läärä ja Pekka Pere.
Kirjassa on aakkosellinen sanasto sekä suuntaan englanti-suomi että suomi-englanti. Sanojen lukumäärä on suurempi kuin olisit arvannut: yli 3000! Mukana laskussa on tosin samojen peruskäsitteiden variantteja, kuten kuusi versiota autoregressivisiä prosesseja. Sanaluetteloita edeltää neljä kiinnostavaa johdantolukua, joissa käsitellään sanaston periaatteita, esimerkkejä pulmallisista termeistä, tilastotieteen termien suomentamisen historiaa sekä vertailuja viron tilastosanaston kanssa – viimeksi mainittu lienee useimmille aivan uutta asiaa, vaikka naapureita ollaan. Soveltajien tiuhaan tarvitsemasta termistä significance (merkitsevyys) ja sen pulmallisuudesta keskustellaan yli kahden sivun verran.

Suomenkielinen tilastotiede on nuorta. Kirja kertoo, että termi ”tilasto” esiintyi ensimmäisen kerran painettuna Paavo Tikkasen ilmestyneessä kirjassa 1848 ”Suomen Suuriruhtinaanmaan Nykynen Tilasto: Yritös Alkeis- ja Rahwaan-kouluin tarpeeksi”. Tikkanen johti ”tilaston” sanasta ”tila”, ajatellen termin statistik suhdetta latinan sanaan status. Hänen vuonna 1859 ilmestynyt väitöskirjansa esitteli myös sanat ”tilastotiede” ja ”tilastollinen”.
Lopuksi hieman näytteitä suomenkielisestä terminologiasta:
adjusted estimator vakioitu estimaattori,
rukattu estimaattori
backpropagation algorithm vastavirta-algoritmi
Bayesian bayesiläinen, bayesläinen
clustering ryvästys
ensemble kooste
Gibbs sampler Gibbsin poimija
hazard rate uhkatiheys, uhkafunktio
Ilkka Norros