Kako deluje Googlova funkcija brnenja za iskanje

Kazalo:

Kako deluje Googlova funkcija brnenja za iskanje
Kako deluje Googlova funkcija brnenja za iskanje
Anonim

Ključni izsledki

  • Google je lansiral novo orodje, ki uporabnikom omogoča iskanje pesmi z brenkanjem, petjem ali žvižganjem.
  • Novo orodje uporablja strojno učenje za ujemanje zabrenčane skladbe z bazo podatkov z več kot pol milijona pesmi, ki se nenehno posodablja.
  • Uporabniki Googla vprašajo, katera pesem se predvaja skoraj 100-krat vsak mesec.
Image
Image

Google je uvedel novo funkcijo, imenovano »Hum to Search«, da bi rešil frustrirajočo težavo: pesem se vam je vtisnila v glavo in ne morete ugotoviti, kako se imenuje.

Zamisel o brenčanju, da bi našli pesem, se zdi neverjetno preprosta, zakaj torej Google to funkcijo lansira šele leta 2020? No, izkazalo se je, da je prepoznavanje pesmi na ta način pravzaprav precej zapleteno, delno zato, ker se naše zabrevkane različice ponavadi precej razlikujejo od izvirne skladbe. Google v nedavni objavi na svojem blogu o umetni inteligenci pojasnjuje, kako je uporabil strojno učenje, da bi rešil to težavo in na koncu pomagal ljudem najti pesem z brenčanjem, žvižganjem ali petjem melodije, tudi če je njihova izvedba manj kot točna.

"Naš poudarek pri Hum to Search je pomoč ljudem pri prepoznavanju in iskanju glasbe, ki se jim je zataknila v glavi," je Googlov tiskovni predstavnik povedal Lifewire v e-poštnem sporočilu.

Samo začni brenčati

Uporabniki Googla sprašujejo, katera pesem se vsak mesec predvaja skoraj 100-milijonkrat, je Aparna Chennapragada, Googlova podpredsednica in generalna direktorica potrošniškega nakupovanja, povedala v videu, ki predstavlja več novih funkcij iskanja. Zdaj obstaja način, da to ugotovite.

Funkcija »Hum to Search« je vgrajena v Googlovo mobilno aplikacijo, pripomoček Google Search in Google Assistant. Če želite do nje dostopati prek aplikacije, tapnite ikono mikrofona in izgovorite "What's this song?" Deluje tudi izbira gumba »Išči skladbo«.

Za pravilno delovanje mora funkcija brneti vsaj 10-15 sekund. Uporabniki Androida lahko z brenkanjem najdejo pesmi v več kot 20 jezikih, medtem ko na iPhonih delujejo samo angleške pesmi. Orodje ne more vedno prepoznati pesmi takoj, ko pa jo, so rezultati precej dobri.

"Naši algoritmi prepoznajo več kot polovico skladb širokega nabora spremenljivk (ton, višina, glasnost itd.), seveda pa je natančnost odvisna od kakovosti brenčanja, vrste pesem in še več, «je v elektronskem sporočilu za Lifewire povedal tiskovni predstavnik Googla. "Ko pa je prepoznan, so približno štirje od petih odgovorov pravilni."

To pa ni prvič, da je brnečanje uporabljeno v aplikaciji za prepoznavanje glasbe. SoundHound ponuja podobno funkcijo, kot ugotavlja CNN Business, in je na voljo tudi za Android in iOS. Po besedah Googlovega tiskovnega predstavnika nova funkcija ne vzbuja nobenih pomislekov glede zasebnosti, niti ne "spremeni načina, kako Google obravnava interakcije, ki temeljijo na zvoku", so povedali Lifewire v e-pošti.

Strojno učenje

Kljub preprostosti koncepta je brenčanje melodije za iskanje studijskega posnetka tehnično precej težko. Za to obstaja več razlogov, pojasnjuje Christian Frank iz Google Research v objavi na spletnem dnevniku 12. novembra. Prvič, zapevkana različica pesmi se lahko močno razlikuje od dejanskega posnetka, zaradi česar je težko ujemati oba. Torej, medtem ko Shazam in množica drugih aplikacij že obstajajo za prepoznavanje pesmi, ki jo slišite v restavraciji ali na drugem javnem mestu, je lahko uporaba zabrneče melodije kot osnove za to iskanje težavnejša.

"Z besedilom, vokali v ozadju in inštrumenti je lahko zvok glasbenega ali studijskega posnetka precej drugačen od zabrenčane melodije," piše Frank."Po pomoti ali načrtu, ko nekdo zabrunda svojo interpretacijo pesmi, se lahko višina, tonaliteta, tempo ali ritem pogosto nekoliko ali celo znatno razlikujejo."

Image
Image

Ker so lahko zabrenčane različice pesmi tako drugačne od izvirnikov, Frank ugotavlja, da so mnoge pretekle metode zahtevale ujemanje brenčanja osebe z različico pesmi, ki ima samo melodijo, ali skladbo, ki vključuje brenčanje. Zaradi tega so primeri uporabe v resničnem svetu zahtevni, saj so zbirke podatkov s temi skladbami lahko omejene in jih je treba ročno posodobiti.

Google pojasnjuje, da za funkcijo Hum to Search uporablja modele strojnega učenja za pretvorbo zvoka v "zaporedje, ki temelji na številkah", ki predstavlja melodijo pesmi - to, kar piše, si lahko predstavljamo kot "prstni odtis".."

Bolj uporabniku prijazen

Uporaba strojnega učenja v Googlovi funkciji Hum to Search na koncu zelo olajša uporabo orodja v resničnem svetu. Ker Hum to Search ujema iskalčevo zabrundano melodijo z dejansko skladbo, lahko orodje deluje z novimi skladbami, ko so izdane, namesto baze podatkov, ki jo je treba nenehno posodabljati z zabrenčanimi različicami vsake skladbe. Poleg tega za njegovo uporabo ne potrebujete popolnega zvoka.

"Trenutni sistem dosega visoko stopnjo natančnosti v zbirki podatkov o pesmih, ki vsebuje več kot pol milijona pesmi, ki jih nenehno posodabljamo," je dejal Google v svoji objavi Hum to Search. "Ta zbirka pesmi ima še prostor za rast, da bo vključevala več od mnogih svetovnih melodij."

Priporočena: