Ang OCR ay ang pagkilala sa optikal na character o kilala rin sa Espanya bilang pagkilala sa optikal na character. Ang OCR ay isang software na nagbibigay-daan sa pagkilala ng teksto, gumagawa ng isang imahe nito upang ibahin ito sa isang sunud-sunod na mga character, at pagkatapos ay i-save ang mga ito sa isang naibigay na format na maaaring magamit sa mga programa sa pag-edit ng teksto. Sa madaling salita, salamat sa bagong teknolohiyang ito, ang anumang uri ng teksto o dokumento, kabilang ang mga PDF file, mga na-scan na papel o kahit mga imaheng kinuha mula sa mga digital camera, ay maaaring i-convert sa data upang magkaroon ng posibilidad na mai -edit.
Gumagana ang software na ito sa sumusunod na paraan, pinag-aaralan muna nito ang bawat bahagi ng imahe ng dokumento na pinag-uusapan; ipamahagi ang pahina sa mga piraso tulad ng mga talahanayan, imahe, bloke ng teksto bukod sa iba pa; pagkatapos ang mga linya ay ipinamamahagi sa mga salita upang maging mga character sa paglaon; at dahil naipahiwatig na ang mga character, ginagawa ng software ang paghahambing sa isang pangkat ng mga imahe ng pattern. Nagsusulong ito ayon sa serye ng mga pagpapalagay tungkol sa kung ano ang bawat tauhan; Batay sa mga pagpapalagay na ito, pinag-aaralan niya ang iba't ibang mga pagkakaiba-iba ng mga linya ng pagsira sa mga salita at salita sa mga character. At pagkatapos ng isang malaking bilang ng pagtatasa at pagproseso ng mga pagpapalagay, na sa wakas ay ipinakita ng programa ang teksto na kinilala at nabago na may isang bagong format.
Dapat pansinin na ngayon mayroong maraming mga programa na inaalok ng computer market batay sa OCR tulad ng OmniPage, Abbyy Fine Reader o READiris. YY na may kakayahan, hindi lamang pag-aralan at kilalanin ang isang teksto tulad nito, ngunit kinikilala din ang format at istilo, ngunit may ilang mga limitasyon, kaya't hinihiling na ang teksto, pagkatapos na masuri, ay mai-edit upang gawin ang mga pagsasaayos na kailangan