Kako tekoče prepoznavanje glasu ostane hitro, natančno in zasebno

Kazalo:

Kako tekoče prepoznavanje glasu ostane hitro, natančno in zasebno
Kako tekoče prepoznavanje glasu ostane hitro, natančno in zasebno
Anonim

Ključni izsledki

  • Fluent je izjemno hiter mehanizem za prepoznavanje glasu, ki spoštuje zasebnost in ne potrebuje internetne povezave.
  • Mogoče ga je vgraditi v skoraj vsako napravo.
  • Deluje v katerem koli jeziku.
Image
Image

Fluent.ai je virtualni mehanizem za prepoznavanje glasu, ki vaših ukazov ne pošilja v internet, deluje skoraj v trenutku, lahko deluje v katerem koli jeziku in je tako majhen, da ga je mogoče vgraditi v celo poceni, nizko - napajalne naprave, kot je na primer ura za fitnes.

V nasprotju s Sirijem in Alexo je Fluent samostojen pomočnik, ki vas takoj razume in se od vas uči, tako da postaja boljši, čim bolj ga uporabljate. Nima globine običajnih virtualnih pomočnikov, vendar temu ni namenjeno. Namesto tega je hitrejši, natančnejši in bolj zaseben kot Apple, Amazon in Googlova prizadevanja.

»Govor v besedilo uporablja obdelavo naravnega jezika in nato izpelje namero,« je med intervjujem za Zoom povedal izvršni direktor Fluenta Probal Lala za Lifewire. "Potrebuje veliko podatkov in veliko procesorske moči. Fluent gre neposredno od govora k namenu, vzame vaš glas in ga pretvori neposredno v dejanje."

Spodnja vrstica

Fluent je programska oprema za glasovno upravljanje. Deluje tako, da prisluhne vašemu ukazu in odstrani vse besede, ki jih ne potrebuje, ter pusti le bistvene samostalnike in glagole. "Ugasni luči," postane samo ugasni in prižge. Bistveni elementi so odvzeti iz neurejenega človeškega stavka in spremenjeni v korake. To je skoraj tako kot programiranje računalnika, ki kompleksno idejo spremeni v najpreprostejši niz navodil.

Za kaj se lahko uporablja?

Fluent se lahko uporablja za karkoli. Ključno je, da je usposobljen za specifično situacijo. S pametno uro se lahko na primer uri v ukazih za fitnes ali za avtomatizacijo doma, ustvarjanje koledarja in časovnika itd. Omejitev podatkovne baze naredi vse bolj osredotočeno in hitro.

"Resnica je, da z nosljivimi napravami ne želite imeti pogovora," je rekla Lala, "želim, da se morda začne moja najljubša vadba, in to želim zelo hitro."

Bistvo je v hitrosti in natančnosti. Vklop in izklop luči traja nekaj milisekund, namesto da bi morali čakati, da Siri pošlje vaš glas v oblak, počakajte, da se obdela, nato pa čez nekaj sekund luči ugasnejo.

Ta ozka vadba tudi zmanjša velikost aplikacije. Lani je Google ponudil prenosljivo različico svojega pomočnika brez povezave. Imel je, pravi Lala, 85 megabajtov, deloval je samo v angleščini in trajalo je šest mesecev, da so ga usposobili.

"Imamo en model, ki deluje s 13.000 ukazi in deluje v 500 kilobajtih," je dejal.

Spodnja vrstica

Druga prednost mehanizma za prepoznavanje glasu brez povezave je zasebnost. Pri otroški pametni uri na primer "nočete, da gre otrokov glas v oblak," pravi Lala. Pravzaprav lahko Fluent deluje znotraj naprav, ki se nikoli ne povežejo z internetom. To ni dobro samo za zasebnost, ampak tudi za varnost. Mehanizem za prepoznavanje glasu brez povezave lahko uporabite v raziskovalnih laboratorijih, vojaških objektih in na drugih mestih, kjer so mobilni telefoni in kamere prepovedani.

Omejitve

Seveda ima ta model nekaj slabosti. Eno je, da ukazov ni mogoče dodati pozneje. Ko je začetno usposabljanje končano, je to to. Prav tako vaš pomočnik, ki temelji na Fluentu, ne more poiskati stvari v internetu za vas – športnih rezultatov, igralca, ki ga prepoznate v tem filmu, vendar ga preprosto ne morete postaviti, in tako naprej.

Image
Image

Namesto tega je sistem dovolj pameten, da prepozna, kdaj ne more pomagati, in bo zahtevo predal nečemu, kar lahko. Če uro vprašate za vremensko napoved, bo Fluent ugotovil, da je ne razume. "Potem bo poklicala storitev, ki je vnaprej programirana v uri, ne glede na to, ali je to Amazonova Alexa ali Google, in nato opravila klic v oblak," posredovala vaš neobdelani glasovni ukaz, da bi dobila odgovor.

Ta hibridni pristop ohranja hitrost lokalnega pomočnika brez povezave z močjo Alexa ali Google Assistant kot rezervno kopijo.

Ali lahko kupite katero koli napravo Fluent?

Ne še. Podjetje licencira svojo tehnologijo in izvaja usposabljanje za druga podjetja. Zahvaljujoč bolezni COVID sta bili dve večji predstavitvi prestavljeni na naslednje leto. Lahko pa pričakujete, da se bo pojavil v urah in drugih napravah za fitnes, zvočnikih, vozliščih za avtomatizacijo doma in tako naprej.

Super bi bilo, če bi bilo to vključeno tudi neposredno v pametne telefone, kot je iPhone, s čimer bi vsakodnevna opravila postala hitrejša, Siri pa bi uporabili samo, ko je to potrebno. To bi bila prava ubijalska aplikacija.

Posodobitev: 22. oktober, 10.12. Naredili spremembe, da se Fluent nanaša kot mehanizem za prepoznavanje glasu in ne kot glasovni pomočnik.

Priporočena: