-
Tämä on The Rundown, minä olen Hari Sreenivasan, tänään puhutaan sanoista.
-
Seurassani on leksikografi Erin McKean, joka on Wordnik.comin perustaja ja toimitusjohtaja.
-
Kiitos kun liityit seuraamme.
-
Eipä kestä. Kiitoksia.
-
Google julkaisi vastikään websivuston tai ikään kuin tietokannan, yhdessä muutamien harvardilaisten kanssa, -
-
NGRAMin, jolla ihmiset voivat etsiä sanoja useista sadoista ja tuhansista -
-
kirjoista ja aikakausjulkaisuista ja niin edelleen, vuosikymmenien ajalta.
-
Mitä te teitte kun ensi kertaa kuulitte siitä?
-
Olimme hyvin innoissamme kun oivalsimme, että Google julkaisi NGRAM-datan hyvin avoimella lisenssillä, -
-
koska siitä seuraa, että monet ihmiset voivat ottaa datan ja tehdä siistejä asioita sillä.
-
Ja meillä Wordnikissä on juuri kyse sanojen hyödyntämisestä jännillä tavoilla.
-
Datan pohjalla on siis kutakuinkin 5 prosenttia Google-kirjojen kokonaismäärästä, -
-
mikä ei ole paljon, mutta sanoina se on paljon.
-
Mitä opimme englannin kielestä nyt kun meillä on pääsy sanojen esiintymistaajuuksiin ajan kuluessa?
-
Nyt NGRAMin taustalla olevaa tiedettä voidaan ajatella sellaisena kuin vaikkapa -
-
varhaiset antibiootit olivat.
-
Se ei ole kovin täsmällistä, joten on esimerkiksi vaikea erottaa sanaa "pretty", -
-
sen "hyvännäköistä" tarkoittavaa merkitystä -
-
siitä, kun sitä käytetään osana ilmaisua kuten, "That was a pretty neat thing."
-
Käytämmekö nykyisin enemmän uusia sanoja? Laajeneeko englannin kieli yhä nopeammin?
-
Tällä hetkellä pystymme mittaamaan sitä paremmin kuin koskaan aikaisemmin, joten esseessä jonka -
-
Googlen ja Harvardin tutkijat julkaisivat Science-lehdessä, kerrottiin -
-
kuinka he olivat havainnneet uusia sanoja ilmestyvän ajan myötä yhä enemmän.
-
Olin myös ilahtunut siitä, kun Googlen ja Harvardin tutkijat tukivat näkemystäni siitä, -
-
että he arvioivat että 52 prosenttia tarkastelluista sanoista -
-
ei löytynyt heidän käyttämistään sanakirjoista.
-
Kuinka se on ylipäänsä mahdollista?
-
No on paljon sellaisia sanoja, joita käytetään vain kerran, tilapäissanoja, -
-
että kun tehdään painettua sanakirjaa, niille ei vain yksinkertaisesti ole tilaa.
-
Ja entä jos joku ei ole käynyt Wordnikissa, mitä eroa on -
-
Wordnikilla ja muilla verkkosanakirjoilla?
-
Wordnikissa on noin kuusinkertainen määrä sanoja muihin verkkosanakirjoihin verrattuna.
-
Tarjoamme niin paljon tietoa niin monista sanoista kuin vain voimme.
-
Eli jos on perinteinen sanakirjamääritelmä, näytämme sen.
-
Mutta jos meillä on vain kolme hyvää virkettä vaikkapa -
-
Wall Street Journalista, tai Forbesista, tai Huffington Postista, näytämme ne ja -
-
sanomme: "hei, oikeat toimittajat käyttävät tätä sanaa. Voit käyttää heidän virkkeitään mallina."
-
Nyt kun vuodenvaihde alkaa lähestyä, -
-
mitkä ovat vuoden 2010 tai 2011 kärjessä olevia sanoja?
-
Se on mielenkiintoista, ihmiset haluavat aina vuoden kärjessä olevia sanoja, mutta -
-
tavallisesti sanat ikään kuin itävät maan alla siementen lailla ja sitten ponnahtavat tietoisuuteen.
-
Pari sanaa, joista olen ollut viime aikoina tosi kiinnostunut, ovat kaikki -
-
teknologian negatiivisia seurauksia kuten "geoslavery".
-
Ja mitä "geoslavery" tarkoittaa?
-
No "geo-orjuus" on se ajatus, että kun on kaikkea GPS-toiminnallisuutta ja matkapuhelimenjäljitystä, -
-
törkeät kumppanit ja puolisot voivat käyttää niitä kytätäkseen kumppaniaan.
-
Ideana siis, että he yrittävät rajoittaa toisen käyttäytymistä.
-
Mitä muuta on ponnahdellut esiin?
-
Pidän tosi paljon sanasta "aftercrimes", joka syntyy "aftershocksin" analogiana.
-
Eli se tarkoittaa pikkurikoksia, joita tapahtuu alueella, jolla on tapahtunut iso rikos.
-
Mikä siis on Wordnikin päämääränä? Tuleeko siitä kaikkien suosikkisanakirja?
-
Pyrimme kartoittamaan koko englannin kielen.
-
Haluaisimme oikeastaan olla sanojen GPS, -
-
ja näyttää mahdollisimman paljon tietoa mahdollisimman monista sanoista.
-
Hyvä on, Erin McKean, Wordnikin perustaja ja toimitusjohtaja, leksikografi.
-
Kiitoksia vierailusta ja hauskaa sanailua!
-
Kiitos paljon.
-
Minä olen Hari Sreenivasan, tämä on The Rundown. Pysykää kanavalla.