1 00:00:00,150 --> 00:00:03,680 Tämä on The Rundown, minä olen Hari Sreenivasan, tänään puhutaan sanoista. 2 00:00:03,680 --> 00:00:09,730 Seurassani on leksikografi Erin McKean, joka on Wordnik.comin perustaja ja toimitusjohtaja. 3 00:00:09,730 --> 00:00:10,880 Kiitos kun liityit seuraamme. 4 00:00:10,880 --> 00:00:12,530 Eipä kestä. Kiitoksia. 5 00:00:12,530 --> 00:00:18,350 Google julkaisi vastikään websivuston tai ikään kuin tietokannan, yhdessä muutamien harvardilaisten kanssa, - 6 00:00:18,350 --> 00:00:23,530 NGRAMin, jolla ihmiset voivat etsiä sanoja useista sadoista ja tuhansista - 7 00:00:23,530 --> 00:00:28,420 kirjoista ja aikakausjulkaisuista ja niin edelleen, vuosikymmenien ajalta. 8 00:00:28,420 --> 00:00:30,250 Mitä te teitte kun ensi kertaa kuulitte siitä? 9 00:00:30,250 --> 00:00:36,030 Olimme hyvin innoissamme kun oivalsimme, että Google julkaisi NGRAM-datan hyvin avoimella lisenssillä, - 10 00:00:36,030 --> 00:00:41,180 koska siitä seuraa, että monet ihmiset voivat ottaa datan ja tehdä siistejä asioita sillä. 11 00:00:41,180 --> 00:00:44,950 Ja meillä Wordnikissä on juuri kyse sanojen hyödyntämisestä jännillä tavoilla. 12 00:00:44,950 --> 00:00:50,320 Datan pohjalla on siis kutakuinkin 5 prosenttia Google-kirjojen kokonaismäärästä, - 13 00:00:50,320 --> 00:00:53,870 mikä ei ole paljon, mutta sanoina se on paljon. 14 00:00:53,870 --> 00:00:59,960 Mitä opimme englannin kielestä nyt kun meillä on pääsy sanojen esiintymistaajuuksiin ajan kuluessa? 15 00:00:59,960 --> 00:01:07,810 Nyt NGRAMin taustalla olevaa tiedettä voidaan ajatella sellaisena kuin vaikkapa - 16 00:01:07,810 --> 00:01:10,690 varhaiset antibiootit olivat. 17 00:01:10,690 --> 00:01:16,170 Se ei ole kovin täsmällistä, joten on esimerkiksi vaikea erottaa sanaa "pretty", - 18 00:01:16,170 --> 00:01:19,150 sen "hyvännäköistä" tarkoittavaa merkitystä - 19 00:01:19,150 --> 00:01:23,670 siitä, kun sitä käytetään osana ilmaisua kuten, "That was a pretty neat thing." 20 00:01:23,670 --> 00:01:29,230 Käytämmekö nykyisin enemmän uusia sanoja? Laajeneeko englannin kieli yhä nopeammin? 21 00:01:29,230 --> 00:01:36,760 Tällä hetkellä pystymme mittaamaan sitä paremmin kuin koskaan aikaisemmin, joten esseessä jonka - 22 00:01:36,760 --> 00:01:40,230 Googlen ja Harvardin tutkijat julkaisivat Science-lehdessä, kerrottiin - 23 00:01:40,230 --> 00:01:45,120 kuinka he olivat havainnneet uusia sanoja ilmestyvän ajan myötä yhä enemmän. 24 00:01:45,120 --> 00:01:49,890 Olin myös ilahtunut siitä, kun Googlen ja Harvardin tutkijat tukivat näkemystäni siitä, - 25 00:01:49,890 --> 00:01:54,080 että he arvioivat että 52 prosenttia tarkastelluista sanoista - 26 00:01:54,080 --> 00:01:56,750 ei löytynyt heidän käyttämistään sanakirjoista. 27 00:01:56,750 --> 00:01:58,250 Kuinka se on ylipäänsä mahdollista? 28 00:01:58,250 --> 00:02:02,970 No on paljon sellaisia sanoja, joita käytetään vain kerran, tilapäissanoja, - 29 00:02:02,970 --> 00:02:06,740 että kun tehdään painettua sanakirjaa, niille ei vain yksinkertaisesti ole tilaa. 30 00:02:06,740 --> 00:02:09,720 Ja entä jos joku ei ole käynyt Wordnikissa, mitä eroa on - 31 00:02:09,720 --> 00:02:12,960 Wordnikilla ja muilla verkkosanakirjoilla? 32 00:02:12,960 --> 00:02:17,690 Wordnikissa on noin kuusinkertainen määrä sanoja muihin verkkosanakirjoihin verrattuna. 33 00:02:17,690 --> 00:02:22,990 Tarjoamme niin paljon tietoa niin monista sanoista kuin vain voimme. 34 00:02:22,990 --> 00:02:26,250 Eli jos on perinteinen sanakirjamääritelmä, näytämme sen. 35 00:02:26,250 --> 00:02:29,260 Mutta jos meillä on vain kolme hyvää virkettä vaikkapa - 36 00:02:29,260 --> 00:02:32,840 Wall Street Journalista, tai Forbesista, tai Huffington Postista, näytämme ne ja - 37 00:02:32,840 --> 00:02:38,820 sanomme: "hei, oikeat toimittajat käyttävät tätä sanaa. Voit käyttää heidän virkkeitään mallina." 38 00:02:38,820 --> 00:02:40,880 Nyt kun vuodenvaihde alkaa lähestyä, - 39 00:02:40,880 --> 00:02:46,130 mitkä ovat vuoden 2010 tai 2011 kärjessä olevia sanoja? 40 00:02:46,130 --> 00:02:50,370 Se on mielenkiintoista, ihmiset haluavat aina vuoden kärjessä olevia sanoja, mutta - 41 00:02:50,370 --> 00:02:58,020 tavallisesti sanat ikään kuin itävät maan alla siementen lailla ja sitten ponnahtavat tietoisuuteen. 42 00:02:58,020 --> 00:03:02,800 Pari sanaa, joista olen ollut viime aikoina tosi kiinnostunut, ovat kaikki - 43 00:03:02,800 --> 00:03:08,340 teknologian negatiivisia seurauksia kuten "geoslavery". 44 00:03:08,340 --> 00:03:10,790 Ja mitä "geoslavery" tarkoittaa? 45 00:03:10,790 --> 00:03:17,770 No "geo-orjuus" on se ajatus, että kun on kaikkea GPS-toiminnallisuutta ja matkapuhelimenjäljitystä, - 46 00:03:17,770 --> 00:03:25,940 törkeät kumppanit ja puolisot voivat käyttää niitä kytätäkseen kumppaniaan. 47 00:03:25,940 --> 00:03:29,180 Ideana siis, että he yrittävät rajoittaa toisen käyttäytymistä. 48 00:03:29,180 --> 00:03:31,330 Mitä muuta on ponnahdellut esiin? 49 00:03:31,330 --> 00:03:39,160 Pidän tosi paljon sanasta "aftercrimes", joka syntyy "aftershocksin" analogiana. 50 00:03:39,160 --> 00:03:43,860 Eli se tarkoittaa pikkurikoksia, joita tapahtuu alueella, jolla on tapahtunut iso rikos. 51 00:03:43,860 --> 00:03:49,380 Mikä siis on Wordnikin päämääränä? Tuleeko siitä kaikkien suosikkisanakirja? 52 00:03:49,380 --> 00:03:52,800 Pyrimme kartoittamaan koko englannin kielen. 53 00:03:52,800 --> 00:03:55,280 Haluaisimme oikeastaan olla sanojen GPS, - 54 00:03:55,280 --> 00:03:58,700 ja näyttää mahdollisimman paljon tietoa mahdollisimman monista sanoista. 55 00:03:58,700 --> 00:04:02,360 Hyvä on, Erin McKean, Wordnikin perustaja ja toimitusjohtaja, leksikografi. 56 00:04:02,360 --> 00:04:04,470 Kiitoksia vierailusta ja hauskaa sanailua! 57 00:04:04,470 --> 00:04:06,090 Kiitos paljon. 58 00:04:06,090 --> 00:04:09,120 Minä olen Hari Sreenivasan, tämä on The Rundown. Pysykää kanavalla.