ngram viewer screenshot 79d5bb8ab1fb4527ab327e4415bcef31

Mitä tietää

  • Kirjoita Google-kirjojen Ngram Viewer -sovellukseen lause, valitse ajanjakso ja korpus, aseta sujuvuustaso ja napsauta Etsi monista kirjoista.
  • Voit zoomata dataa. Esimerkiksi, jos haluat etsiä verbimuotoa kala substantiivin kala sijasta, käytä tagia: search for vis_VERB.
  • Ngram Viewer näyttää kaavion, joka näyttää lauseen käytön ajan kuluessa. Useiden lauseiden kohdalla jokainen esitetään värikoodatulla viivalla.

Tässä artikkelissa kerrotaan, kuinka Ngram Viewer -työkalua käytetään Google-kirjojen tutkimukseen ja hakuun.

Kuinka Ngram-katseluohjelma toimii

Ngrammi, joka tunnetaan myös nimellä N-grammi, on löydettävä teksti- tai puhesisällön tilastollinen analyysi N (numero) jonkin tyyppisestä tekstistä. Hakukohde voi olla mikä tahansa, mukaan lukien foneemit, etuliitteet, lauseet ja kirjaimet. Vaikka Ngram on tuntematon tutkimusyhteisön ulkopuolella, sitä käytetään useilla aloilla, ja sillä on monia vaikutuksia kehittäjiin, jotka koodaavat tietokoneohjelmia, jotka ymmärtävät ja reagoivat luonnolliseen puhekieleen. Google Books Ngram Viewerin tapauksessa analysoitava teksti on peräisin valtavasta määrästä vapaasti jaettavia kirjoja, jotka Google skannasi täyttääkseen Google-kirjojen hakukoneensa. Google Books Ngram Viewerissa Google viittaa tekstiin, jota olet hakemassa, nimellä corpus. Ngram Viewer kerää kielen mukaan, vaikka voit analysoida britti- ja amerikkalaista englantia erikseen tai yhdistää ne yhteen.

  1. Käy Google-kirjojen Ngram Viewerissä osoitteessa books.google.com/ngrams.

  2. Kirjoita lause tai lauseet, joita haluat analysoida. Erottele jokainen lause pilkulla. Google ehdottaa «Albert Einstein, Sherlock Holmes, Frankenstein» päästäksesi alkuun. NGram Viewer -hauissa kohteet erottelevat isot ja pienet kirjaimet, toisin kuin Google-verkkohauissa.

  3. Valitse ajanjakso. Oletusarvo on 1800-2000.

  4. Valitse vartalo. Voit hakea vieraalla kielellä tai englanninkielisillä teksteillä, ja oletusvaihtoehtojen lisäksi saatat nähdä luettelon alaosassa merkintöjä, kuten «English (2009)» tai «American English (2009)». Nämä ovat vanhoja korpuja, joita Google on sittemmin päivittänyt, mutta sinulla voi olla syytä tehdä vertailuja vanhoihin tietojoukkoon. Useimmat käyttäjät voivat jättää ne huomioimatta ja keskittyä uusimpiin korpuihin.

  5. Aseta tasoitustaso. Tasoitus viittaa siihen, kuinka tasainen kaavio on lopussa. Tarkin näyttö näyttää tasoitustason 0, mutta asetusta voi olla vaikea lukea. Oletusarvo on 3. Useimmissa tapauksissa sinun ei tarvitse säätää tätä.

  6. Lehdistö Etsi monista kirjoista.

Googlen Ngram Viewerin avulla voit lähentää tietoja. Jos haluat etsiä verbiä kalastaa substantiivin sijasta kalastaa, voit tehdä tämän käyttämällä tunnisteita. Tässä tapauksessa etsit vis_VERB.

Google tarjoaa verkkosivustollaan täydellisen luettelon komennoista ja muusta edistyneestä dokumentaatiosta käytettäväksi Ngram Viewerin kanssa.

Mitä Ngram näyttää?

Google-kirjojen Ngram Viewer näyttää kaavion, joka näyttää tietyn lauseen käytön kirjoissa ajan myötä. Jos syötit useamman kuin yhden sanan tai lauseen, jokainen sana esitetään värikoodatulla viivalla, joka erottuu muista hakutermeistä. Tämä on samanlainen kuin Google Trends, vain haku kestää pidemmän ajanjakson.

tapaustutkimus

Harkitse etikkakakkujen tapaustutkimusta. Ne mainitaan Laura Ingalls Wilderin teoksessa Pieni talo preerialla sarja. Googlen verkkohaun tutkiminen saadaksesi lisätietoja etikkapiirakoista paljastaa, että niitä pidetään osana amerikkalaista etelän keittiötä ja että ne on todellakin valmistettu etikasta. He kuuntelevat aikoja, jolloin kaikilla ei ollut saatavilla tuoreita tuotteita ympäri vuoden, mutta onko tämä koko tarina? Hae Google Ngram Viewerista etikkakakku, ja löydät joitain merkintöjä piirakasta sekä 1800-luvun alussa että lopussa, monia merkintöjä 1940-luvulta ja yhä useammat merkinnät viime aikoina. Kuitenkin tasoitustasolla 3 näet tasangon merkintöjen päällä 1800-luvulla. Koska tuona aikana ei juurikaan julkaistu kirjoja ja koska tiedot on asetettu tasaiseksi, kuva vääristyy. Etikkapiirakka mainittiin luultavasti vain yhdessä kirjassa, ja sen keskiarvo laskettiin piikin välttämiseksi. Asettamalla tasoituksen arvoon 0, näet, että asia on juuri näin. Huippu keskittyy vuoteen 1869, ja toinen huippu on vuosina 1897 ja 1900. On epätodennäköistä, että kukaan ei puhunut etikkapiirakoista muuna aikana: Reseptejä oli luultavasti kaikkialla, mutta ihmiset eivät kirjoittaneet niistä kirjoihin, ja se on tärkeä asia. Ngram-hakujen rajoitus.

Por Markus