Ocr nedir?

OCR İngilizce açılımı "optical character recognition" olan optik karakter tanıma isimli sistemlere deniliyor. Yapılan iş kağıt üzerindeki yazının tanınması ve düzenlebilir makine yazısı haline dönüştürülmesidir.

Örnek vermek gerekirse bir kitap sayfasını tarayıcı ile taradıktan sonra bir OCR yazılımı ile bunu word dökümanı olarak kaydetmek bir OCR prosedürüdür.

Optik Karakter Tanıma veya OCR, taranmış kağıt evrakları, pdf dosyaları veya dijital bir kamerayla çekilen resimler gibi değişik belge türlerini düzenlenebilir ve aranabilir verilere dönüştürmenize olanak sağlayan bir teknolojidir.

Farz edin ki elinizde kağıt bir evrakınız var - örneğin bir dergi makalesi, broşür veya iş ortağınızın size elektronik postayla yolladığı PDF formatında bir sözleşme. Elbette bu bilgileri, mesela, microsoft Word’de düzenlemek için bir tarayıcı yeterli olmayacaktır.  Bir tarayıcının tüm yapabileceği şey, belgenin resmini oluşturmaktır, ki bu raster görüntüsü olarak bilinen siyah beyaz veya renkli noktalar topluluğundan başka bir şey değildir. Taranmış belgelerden, kamera resimlerinden veya sadece resim içeren PDF dosyalarından verileri çıkartmak ve başka bir amaç için düzenlemek amacıyla resimlerdeki harfleri seçip ayıracak, onlardan kelimeleri ve kelimelerden de cümleleri oluşturup bu sayede orijinal belgenin içeriğine erişmenize ve düzenlemenize olanak tanıyacak bir OCR yazılımına ihtiyacınız vardır.

OCR ne amaçla kullanılır?

OCR işlemi; kitaplarda, dokümanlarda ve belgelerdeki yazıları değiştirme, bir kısmını silme, biçimlendirme, alıntı yapma, web sayfalarında yayınlama gibi tüm ihtiyaçlarınızda kullanılabilir.

Yorumlar

Bu sayfa ait yorum bulunamadı. İlk yorum yapan siz olun.

Yorum ekle

Vazgeç