WEBVTT 00:00:00.150 --> 00:00:03.680 Tämä on The Rundown, minä olen Hari Sreenivasan, tänään puhutaan sanoista. 00:00:03.680 --> 00:00:09.730 Seurassani on leksikografi Erin McKean, joka on Wordnik.comin perustaja ja toimitusjohtaja. 00:00:09.730 --> 00:00:10.880 Kiitos kun liityit seuraamme. 00:00:10.880 --> 00:00:12.530 Eipä kestä. Kiitoksia. 00:00:12.530 --> 00:00:18.350 Google julkaisi vastikään websivuston tai ikään kuin tietokannan, yhdessä muutamien harvardilaisten kanssa, - 00:00:18.350 --> 00:00:23.530 NGRAMin, jolla ihmiset voivat etsiä sanoja useista sadoista ja tuhansista - 00:00:23.530 --> 00:00:28.420 kirjoista ja aikakausjulkaisuista ja niin edelleen, vuosikymmenien ajalta. 00:00:28.420 --> 00:00:30.250 Mitä te teitte kun ensi kertaa kuulitte siitä? 00:00:30.250 --> 00:00:36.030 Olimme hyvin innoissamme kun oivalsimme, että Google julkaisi NGRAM-datan hyvin avoimella lisenssillä, - 00:00:36.030 --> 00:00:41.180 koska siitä seuraa, että monet ihmiset voivat ottaa datan ja tehdä siistejä asioita sillä. 00:00:41.180 --> 00:00:44.950 Ja meillä Wordnikissä on juuri kyse sanojen hyödyntämisestä jännillä tavoilla. 00:00:44.950 --> 00:00:50.320 Datan pohjalla on siis kutakuinkin 5 prosenttia Google-kirjojen kokonaismäärästä, - 00:00:50.320 --> 00:00:53.870 mikä ei ole paljon, mutta sanoina se on paljon. 00:00:53.870 --> 00:00:59.960 Mitä opimme englannin kielestä nyt kun meillä on pääsy sanojen esiintymistaajuuksiin ajan kuluessa? 00:00:59.960 --> 00:01:07.810 Nyt NGRAMin taustalla olevaa tiedettä voidaan ajatella sellaisena kuin vaikkapa - 00:01:07.810 --> 00:01:10.690 varhaiset antibiootit olivat. 00:01:10.690 --> 00:01:16.170 Se ei ole kovin täsmällistä, joten on esimerkiksi vaikea erottaa sanaa "pretty", - 00:01:16.170 --> 00:01:19.150 sen "hyvännäköistä" tarkoittavaa merkitystä - 00:01:19.150 --> 00:01:23.670 siitä, kun sitä käytetään osana ilmaisua kuten, "That was a pretty neat thing." 00:01:23.670 --> 00:01:29.230 Käytämmekö nykyisin enemmän uusia sanoja? Laajeneeko englannin kieli yhä nopeammin? 00:01:29.230 --> 00:01:36.760 Tällä hetkellä pystymme mittaamaan sitä paremmin kuin koskaan aikaisemmin, joten esseessä jonka - 00:01:36.760 --> 00:01:40.230 Googlen ja Harvardin tutkijat julkaisivat Science-lehdessä, kerrottiin - 00:01:40.230 --> 00:01:45.120 kuinka he olivat havainnneet uusia sanoja ilmestyvän ajan myötä yhä enemmän. 00:01:45.120 --> 00:01:49.890 Olin myös ilahtunut siitä, kun Googlen ja Harvardin tutkijat tukivat näkemystäni siitä, - 00:01:49.890 --> 00:01:54.080 että he arvioivat että 52 prosenttia tarkastelluista sanoista - 00:01:54.080 --> 00:01:56.750 ei löytynyt heidän käyttämistään sanakirjoista. 00:01:56.750 --> 00:01:58.250 Kuinka se on ylipäänsä mahdollista? 00:01:58.250 --> 00:02:02.970 No on paljon sellaisia sanoja, joita käytetään vain kerran, tilapäissanoja, - 00:02:02.970 --> 00:02:06.740 että kun tehdään painettua sanakirjaa, niille ei vain yksinkertaisesti ole tilaa. 00:02:06.740 --> 00:02:09.720 Ja entä jos joku ei ole käynyt Wordnikissa, mitä eroa on - 00:02:09.720 --> 00:02:12.960 Wordnikilla ja muilla verkkosanakirjoilla? 00:02:12.960 --> 00:02:17.690 Wordnikissa on noin kuusinkertainen määrä sanoja muihin verkkosanakirjoihin verrattuna. 00:02:17.690 --> 00:02:22.990 Tarjoamme niin paljon tietoa niin monista sanoista kuin vain voimme. 00:02:22.990 --> 00:02:26.250 Eli jos on perinteinen sanakirjamääritelmä, näytämme sen. 00:02:26.250 --> 00:02:29.260 Mutta jos meillä on vain kolme hyvää virkettä vaikkapa - 00:02:29.260 --> 00:02:32.840 Wall Street Journalista, tai Forbesista, tai Huffington Postista, näytämme ne ja - 00:02:32.840 --> 00:02:38.820 sanomme: "hei, oikeat toimittajat käyttävät tätä sanaa. Voit käyttää heidän virkkeitään mallina." 00:02:38.820 --> 00:02:40.880 Nyt kun vuodenvaihde alkaa lähestyä, - 00:02:40.880 --> 00:02:46.130 mitkä ovat vuoden 2010 tai 2011 kärjessä olevia sanoja? 00:02:46.130 --> 00:02:50.370 Se on mielenkiintoista, ihmiset haluavat aina vuoden kärjessä olevia sanoja, mutta - 00:02:50.370 --> 00:02:58.020 tavallisesti sanat ikään kuin itävät maan alla siementen lailla ja sitten ponnahtavat tietoisuuteen. 00:02:58.020 --> 00:03:02.800 Pari sanaa, joista olen ollut viime aikoina tosi kiinnostunut, ovat kaikki - 00:03:02.800 --> 00:03:08.340 teknologian negatiivisia seurauksia kuten "geoslavery". 00:03:08.340 --> 00:03:10.790 Ja mitä "geoslavery" tarkoittaa? 00:03:10.790 --> 00:03:17.770 No "geo-orjuus" on se ajatus, että kun on kaikkea GPS-toiminnallisuutta ja matkapuhelimenjäljitystä, - 00:03:17.770 --> 00:03:25.940 törkeät kumppanit ja puolisot voivat käyttää niitä kytätäkseen kumppaniaan. 00:03:25.940 --> 00:03:29.180 Ideana siis, että he yrittävät rajoittaa toisen käyttäytymistä. 00:03:29.180 --> 00:03:31.330 Mitä muuta on ponnahdellut esiin? 00:03:31.330 --> 00:03:39.160 Pidän tosi paljon sanasta "aftercrimes", joka syntyy "aftershocksin" analogiana. 00:03:39.160 --> 00:03:43.860 Eli se tarkoittaa pikkurikoksia, joita tapahtuu alueella, jolla on tapahtunut iso rikos. 00:03:43.860 --> 00:03:49.380 Mikä siis on Wordnikin päämääränä? Tuleeko siitä kaikkien suosikkisanakirja? 00:03:49.380 --> 00:03:52.800 Pyrimme kartoittamaan koko englannin kielen. 00:03:52.800 --> 00:03:55.280 Haluaisimme oikeastaan olla sanojen GPS, - 00:03:55.280 --> 00:03:58.700 ja näyttää mahdollisimman paljon tietoa mahdollisimman monista sanoista. 00:03:58.700 --> 00:04:02.360 Hyvä on, Erin McKean, Wordnikin perustaja ja toimitusjohtaja, leksikografi. 00:04:02.360 --> 00:04:04.470 Kiitoksia vierailusta ja hauskaa sanailua! 00:04:04.470 --> 00:04:06.090 Kiitos paljon. 00:04:06.090 --> 00:04:09.120 Minä olen Hari Sreenivasan, tämä on The Rundown. Pysykää kanavalla.