0:00:00.150,0:00:03.680 Tämä on The Rundown, minä olen Hari Sreenivasan, tänään puhutaan sanoista. 0:00:03.680,0:00:09.730 Seurassani on leksikografi Erin McKean, joka on Wordnik.comin perustaja ja toimitusjohtaja. 0:00:09.730,0:00:10.880 Kiitos kun liityit seuraamme. 0:00:10.880,0:00:12.530 Eipä kestä. Kiitoksia. 0:00:12.530,0:00:18.350 Google julkaisi vastikään websivuston tai ikään kuin tietokannan, yhdessä muutamien harvardilaisten kanssa, - 0:00:18.350,0:00:23.530 NGRAMin, jolla ihmiset voivat etsiä sanoja useista sadoista ja tuhansista - 0:00:23.530,0:00:28.420 kirjoista ja aikakausjulkaisuista ja niin edelleen, vuosikymmenien ajalta. 0:00:28.420,0:00:30.250 Mitä te teitte kun ensi kertaa kuulitte siitä? 0:00:30.250,0:00:36.030 Olimme hyvin innoissamme kun oivalsimme, että Google julkaisi NGRAM-datan hyvin avoimella lisenssillä, - 0:00:36.030,0:00:41.180 koska siitä seuraa, että monet ihmiset voivat ottaa datan ja tehdä siistejä asioita sillä. 0:00:41.180,0:00:44.950 Ja meillä Wordnikissä on juuri kyse sanojen hyödyntämisestä jännillä tavoilla. 0:00:44.950,0:00:50.320 Datan pohjalla on siis kutakuinkin 5 prosenttia Google-kirjojen kokonaismäärästä, - 0:00:50.320,0:00:53.870 mikä ei ole paljon, mutta sanoina se on paljon. 0:00:53.870,0:00:59.960 Mitä opimme englannin kielestä nyt kun meillä on pääsy sanojen esiintymistaajuuksiin ajan kuluessa? 0:00:59.960,0:01:07.810 Nyt NGRAMin taustalla olevaa tiedettä voidaan ajatella sellaisena kuin vaikkapa - 0:01:07.810,0:01:10.690 varhaiset antibiootit olivat. 0:01:10.690,0:01:16.170 Se ei ole kovin täsmällistä, joten on esimerkiksi vaikea erottaa sanaa "pretty", - 0:01:16.170,0:01:19.150 sen "hyvännäköistä" tarkoittavaa merkitystä - 0:01:19.150,0:01:23.670 siitä, kun sitä käytetään osana ilmaisua kuten, "That was a pretty neat thing." 0:01:23.670,0:01:29.230 Käytämmekö nykyisin enemmän uusia sanoja? Laajeneeko englannin kieli yhä nopeammin? 0:01:29.230,0:01:36.760 Tällä hetkellä pystymme mittaamaan sitä paremmin kuin koskaan aikaisemmin, joten esseessä jonka - 0:01:36.760,0:01:40.230 Googlen ja Harvardin tutkijat julkaisivat Science-lehdessä, kerrottiin - 0:01:40.230,0:01:45.120 kuinka he olivat havainnneet uusia sanoja ilmestyvän ajan myötä yhä enemmän. 0:01:45.120,0:01:49.890 Olin myös ilahtunut siitä, kun Googlen ja Harvardin tutkijat tukivat näkemystäni siitä, - 0:01:49.890,0:01:54.080 että he arvioivat että 52 prosenttia tarkastelluista sanoista - 0:01:54.080,0:01:56.750 ei löytynyt heidän käyttämistään sanakirjoista. 0:01:56.750,0:01:58.250 Kuinka se on ylipäänsä mahdollista? 0:01:58.250,0:02:02.970 No on paljon sellaisia sanoja, joita käytetään vain kerran, tilapäissanoja, - 0:02:02.970,0:02:06.740 että kun tehdään painettua sanakirjaa, niille ei vain yksinkertaisesti ole tilaa. 0:02:06.740,0:02:09.720 Ja entä jos joku ei ole käynyt Wordnikissa, mitä eroa on - 0:02:09.720,0:02:12.960 Wordnikilla ja muilla verkkosanakirjoilla? 0:02:12.960,0:02:17.690 Wordnikissa on noin kuusinkertainen määrä sanoja muihin verkkosanakirjoihin verrattuna. 0:02:17.690,0:02:22.990 Tarjoamme niin paljon tietoa niin monista sanoista kuin vain voimme. 0:02:22.990,0:02:26.250 Eli jos on perinteinen sanakirjamääritelmä, näytämme sen. 0:02:26.250,0:02:29.260 Mutta jos meillä on vain kolme hyvää virkettä vaikkapa - 0:02:29.260,0:02:32.840 Wall Street Journalista, tai Forbesista, tai Huffington Postista, näytämme ne ja - 0:02:32.840,0:02:38.820 sanomme: "hei, oikeat toimittajat käyttävät tätä sanaa. Voit käyttää heidän virkkeitään mallina." 0:02:38.820,0:02:40.880 Nyt kun vuodenvaihde alkaa lähestyä, - 0:02:40.880,0:02:46.130 mitkä ovat vuoden 2010 tai 2011 kärjessä olevia sanoja? 0:02:46.130,0:02:50.370 Se on mielenkiintoista, ihmiset haluavat aina vuoden kärjessä olevia sanoja, mutta - 0:02:50.370,0:02:58.020 tavallisesti sanat ikään kuin itävät maan alla siementen lailla ja sitten ponnahtavat tietoisuuteen. 0:02:58.020,0:03:02.800 Pari sanaa, joista olen ollut viime aikoina tosi kiinnostunut, ovat kaikki - 0:03:02.800,0:03:08.340 teknologian negatiivisia seurauksia kuten "geoslavery". 0:03:08.340,0:03:10.790 Ja mitä "geoslavery" tarkoittaa? 0:03:10.790,0:03:17.770 No "geo-orjuus" on se ajatus, että kun on kaikkea GPS-toiminnallisuutta ja matkapuhelimenjäljitystä, - 0:03:17.770,0:03:25.940 törkeät kumppanit ja puolisot voivat käyttää niitä kytätäkseen kumppaniaan. 0:03:25.940,0:03:29.180 Ideana siis, että he yrittävät rajoittaa toisen käyttäytymistä. 0:03:29.180,0:03:31.330 Mitä muuta on ponnahdellut esiin? 0:03:31.330,0:03:39.160 Pidän tosi paljon sanasta "aftercrimes", joka syntyy "aftershocksin" analogiana. 0:03:39.160,0:03:43.860 Eli se tarkoittaa pikkurikoksia, joita tapahtuu alueella, jolla on tapahtunut iso rikos. 0:03:43.860,0:03:49.380 Mikä siis on Wordnikin päämääränä? Tuleeko siitä kaikkien suosikkisanakirja? 0:03:49.380,0:03:52.800 Pyrimme kartoittamaan koko englannin kielen. 0:03:52.800,0:03:55.280 Haluaisimme oikeastaan olla sanojen GPS, - 0:03:55.280,0:03:58.700 ja näyttää mahdollisimman paljon tietoa mahdollisimman monista sanoista. 0:03:58.700,0:04:02.360 Hyvä on, Erin McKean, Wordnikin perustaja ja toimitusjohtaja, leksikografi. 0:04:02.360,0:04:04.470 Kiitoksia vierailusta ja hauskaa sanailua! 0:04:04.470,0:04:06.090 Kiitos paljon. 0:04:06.090,0:04:09.120 Minä olen Hari Sreenivasan, tämä on The Rundown. Pysykää kanavalla.