Kako uporabljati orodje Ngram Viewer v Google Knjigah

Kazalo:

Kako uporabljati orodje Ngram Viewer v Google Knjigah
Kako uporabljati orodje Ngram Viewer v Google Knjigah
Anonim

Kaj morate vedeti

  • V Google Books Ngram Viewer vnesite frazo, izberite datumsko obdobje in korpus, nastavite raven glajenja in kliknite Išči veliko knjig.
  • Lahko se poglobite v podatke. Če želite na primer poiskati glagolsko obliko ribe, namesto samostalnika riba uporabite oznako: poiščite fish_VERB.
  • Ngram Viewer prikaže graf, ki predstavlja uporabo fraze skozi čas. Za več fraz je vsaka predstavljena z barvno kodirano črto.

Ta članek pojasnjuje, kako uporabljati orodje Ngram Viewer v Google Knjigah za izvajanje raziskav in zmogljivih iskanj.

Image
Image

Kako deluje pregledovalnik Ngram

Ngram, imenovan tudi N-gram, je statistična analiza vsebine besedila ali govora za iskanje n (števila) neke vrste elementa v besedilu.

Iskalni element je lahko vse vrste stvari, vključno s fonemi, predponami, frazami in črkami. Čeprav je Ngram nejasen zunaj raziskovalne skupnosti, se uporablja na različnih področjih in ima veliko posledic za razvijalce, ki kodirajo računalniške programe, ki razumejo in se odzivajo na naravni govorjeni jezik.

V primeru Google Books Ngram Viewer besedilo, ki ga je treba analizirati, izvira iz ogromnega števila knjig v javni domeni, ki jih je Google skeniral, da bi zapolnil svoj iskalnik Google Books. Za Google Books Ngram Viewer se Google sklicuje na telo besedila, ki ga boste iskali, kot na korpus. Pregledovalnik Ngram združuje glede na jezik, čeprav lahko britansko in ameriško angleščino analizirate ločeno ali ju združite.

  1. Pojdite na Google Books Ngram Viewer na books.google.com/ngrams.
  2. Vnesite katero koli frazo ali fraze, ki jih želite analizirati. Vsako frazo ločite z vejico. Google za lažji začetek predlaga "Albert Einstein, Sherlock Holmes, Frankenstein".

    Pri iskanju NGram Viewer elementi razlikujejo med velikimi in malimi črkami, za razliko od Googlovih spletnih iskanj.

  3. Izberite časovno obdobje. Privzeto je 1800 do 2000.
  4. Izberite korpus. Iščete lahko besedila v tujih jezikih ali besedila v angleščini in poleg standardnih izbir boste na dnu seznama morda opazili vnose, kot sta »English (2009)« ali »American English (2009)«. To so starejši korpusi, ki jih je Google pozneje posodobil, vendar imate morda razlog za primerjavo s starimi nabori podatkov. Večina uporabnikov jih lahko prezre in se osredotoči na najnovejše korpuse.
  5. Nastavite raven glajenja. Glajenje se nanaša na to, kako gladek je graf na koncu. Najbolj natančna predstavitev odraža raven glajenja 0, vendar je to nastavitev morda težko brati. Privzeta vrednost je nastavljena na 3. V večini primerov vam je ni treba prilagajati.

  6. Pritisnite Išči veliko knjig.

Z Googlovim pregledovalnikom Ngram Viewer se lahko poglobite v podatke. Če želite iskati glagol riba namesto samostalnika riba, lahko to storite z uporabo oznak. V tem primeru bi iskali fish_VERB.

Google ponuja popoln seznam ukazov in druge napredne dokumentacije za uporabo z Ngram Viewer na svoji spletni strani.

Spodnja vrstica

Google Books Ngram Viewer prikaže graf, ki predstavlja uporabo določene fraze v knjigah skozi čas. Če ste vnesli več kot eno besedo ali besedno zvezo, je vsaka predstavljena z barvno kodirano črto v nasprotju z drugimi iskalnimi izrazi. To je podobno kot Google Trends, le da iskanje zajema daljše obdobje.

Študija primera

Razmislite o študiji primera pit s kisom. Omenjeni so v seriji Little House on the Prairie Laure Ingalls Wilder. Raziskovanje z Googlovim spletnim iskanjem, da bi izvedeli več o pitah s kisom, razkrije, da veljajo za del ameriške južne kuhinje in da so dejansko pripravljene s kisom. Poslušajo čase, ko niso imeli vsi dostopa do svežih proizvodov v vseh obdobjih leta, toda ali je to vsa zgodba?

Iščite pito s kisom v Google Ngram Viewerju in naleteli boste na nekaj omemb pite v zgodnjih in poznih 19. stoletjih, veliko omemb v štiridesetih letih 20. stoletja in vse večje število omemb v zadnjem času. Vendar pa s stopnjo glajenja 3 vidite plato nad omembami v 19. stoletju. Ker v tem času ni bilo izdanih veliko knjig in ker so podatki nastavljeni gladko, je slika popačena. Verjetno je le ena knjiga omenjala pito s kisom in bila je povprečna, da bi se izognili konici. Če glajenje nastavite na 0, lahko vidite, da je temu natanko tako. Konica se osredotoča na leto 1869, v letih 1897 in 1900 pa je še ena konica.

Malo verjetno je, da preostali čas nihče ni govoril o pitah s kisom: verjetno so recepti plavali vsepovsod, vendar ljudje o njih niso pisali v knjigah, in to je pomembna omejitev iskanja v Ngramu.

Priporočena: