Kaj je optično prepoznavanje znakov (OCR)?

Kazalo:

Kaj je optično prepoznavanje znakov (OCR)?
Kaj je optično prepoznavanje znakov (OCR)?
Anonim

Optično prepoznavanje znakov (OCR) se nanaša na programsko opremo, ki ustvari digitalno različico natisnjenega, tipkanega ali ročno napisanega dokumenta, ki ga lahko računalniki preberejo, ne da bi morali ročno tipkati ali vnašati besedilo. Optično prepoznavanje znakov se običajno uporablja pri optično prebranih dokumentih v formatu PDF, lahko pa ustvari tudi računalniško berljivo različico besedila znotraj slikovne datoteke.

Kaj je OCR

OCR, imenovan tudi prepoznavanje besedila, je programska tehnologija, ki pretvarja znake, kot so številke, črke in ločila (imenovane tudi glifi) iz tiskanih ali pisnih dokumentov v elektronsko obliko, ki jo računalniki in računalniki lažje prepoznajo in berejo druge programske opreme. Nekateri programi OCR to naredijo, ko je dokument optično prebran ali fotografiran z digitalnim fotoaparatom, drugi pa lahko ta postopek uporabijo za dokumente, ki so bili predhodno optično prebrani ali fotografirani brez OCR. OCR uporabnikom omogoča iskanje po dokumentih PDF, urejanje besedila in preoblikovanje dokumentov.

Image
Image
Skeniranje zgodovinskega časopisa s programsko opremo OCR.

Getty Images

Za kaj se uporablja OCR?

Za hitre, vsakodnevne potrebe skeniranja OCR morda ne bo velik zalogaj. Če opravite veliko optičnega branja, lahko z možnostjo iskanja po PDF-jih, da bi našli prav tistega, ki ga potrebujete, prihranite kar nekaj časa in postane funkcija OCR v vašem programu optičnega bralnika pomembnejša. Tukaj je nekaj drugih stvari, pri katerih OCR pomaga:

  • Samodejna obdelava podatkov in vnos podatkov (Primer: sistemi za sledenje kandidatom za delo za življenjepise).
  • Omogočanje iskanja skeniranih knjig.
  • Pretvorba ročno napisanih skenov v računalniško berljivo besedilo.
  • Izboljšati uporabnost dokumentov s programi za branje, ki pomagajo slabovidnim uporabnikom.
  • Ohranjanje zgodovinskih dokumentov in časopisov, obenem pa omogočanje iskanja po njih.
  • Izvleček podatkov in prenos v računovodske programe (Primer: potrdila in računi).
  • Indeksiranje dokumentov za uporabo v iskalnikih.
  • Prepoznavanje vozniških tablic s programsko opremo za hitrostno kamero in kamero za vožnjo pri rdeči luči.
  • Sintetizatorji govora za ljudi, ki ne morejo govoriti – teoretični fizik Stephen Hawking je morda najbolj znan uporabnik programa za sintetizatorje govora.

Spodnja vrstica

Zakaj ne bi preprosto posneli slike, kajne? Ker ne bi mogli ničesar urejati ali iskati po besedilu, ker bi bila le slika. S skeniranjem dokumenta in zagonom programske opreme OCR lahko to datoteko spremenite v nekaj, kar lahko urejate in lahko iščete.

Zgodovina OCR

Medtem ko najzgodnejša uporaba prepoznavanja besedila sega v leto 1914, sta se razširjen razvoj in uporaba tehnologij, povezanih z OCR, resno začela v petdesetih letih 20. stoletja, zlasti z ustvarjanjem zelo poenostavljenih pisav, ki jih je bilo lažje pretvoriti v digitalno- berljivo besedilo. Prvo od teh poenostavljenih pisav je ustvaril David Shepard in je splošno znana kot OCR-7B. OCR-7B se še danes uporablja v finančni industriji za standardno pisavo, ki se uporablja na kreditnih in debetnih karticah. V šestdesetih letih prejšnjega stoletja so poštne storitve v več državah začele uporabljati tehnologijo OCR za močno pospešitev razvrščanja pošte, vključno z Združenimi državami Amerike, Veliko Britanijo, Kanado in Nemčijo. OCR je še vedno osnovna tehnologija, ki se uporablja za razvrščanje pošte za poštne storitve po vsem svetu. Leta 2000 je bilo ključno znanje o omejitvah in zmožnostih tehnologije OCR uporabljeno za razvoj programov CAPTCHA, ki se uporabljajo za zaustavitev botov in pošiljateljev neželene pošte.

V desetletjih je OCR postal natančnejši in bolj izpopolnjen zaradi napredka na povezanih tehnoloških področjih, kot so umetna inteligenca, strojno učenje in računalniški vid. Danes programska oprema OCR uporablja prepoznavanje vzorcev, zaznavanje funkcij in rudarjenje besedila za preoblikovanje dokumentov hitreje in natančneje kot kadar koli prej.

FAQ

    Kako skeniram dokumente s telefonom ali tablico?

    V sistemu iOS odprite aplikacijo Notes in ustvarite nov zapisek. Odprite kamero in tapnite Skeniraj dokumente. V sistemu Android odprite Google Drive in izberite Plus (+), nato tapnite Scan, da skenirate dokument s telefonom.

    Kako uporabljam OCR v programu Adobe Acrobat?

    Odprite datoteko PDF, ki vsebuje skenirano sliko, nato izberite Orodja > Edit PDF. Acrobat bo samodejno uporabil OCR, da boste lahko urejali besedilo. Samo izberite, kje želite urediti, in začnite tipkati.

    Kakšna je razlika med OCR in OMR?

    Optično prepoznavanje oznak (OMR) je programska oprema, ki zazna oznake na papirju, običajno na mehurčkih. OMR se uporablja za obdelavo rezultatov izpitov, anket, vprašalnikov in celo volitev. Za razliko od OCR, OMR ne more dešifrirati oznak na strani, ampak le preveri, ali so oznake tam.

Priporočena: