Tanım OCR

OCR, Optik Karakter Tanıma olarak çevrilebilecek bir İngilizce ifadesi olan Optik Karakter Tanıma'nın kısaltmasıdır. Bu kavram, bilgisayar bilimlerinde bir metnin tarayıcıdan sayısallaştırılmasına izin veren bir prosedürün isimlendirilmesi için kullanılmaktadır.

OCR olayı çok özeldir, çünkü bilgisayara çoğu insan için temel olan bir beceri kazandırır: okuma. Bizim durumumuzda genellikle çok genç yaşlardan itibaren yapmayı öğrenmemize rağmen, bu nedenle, anlaşılması zor bir hatla yüzleşmek zorunda kalsak bile, bu yüzden büyük bir beceri kazanıyoruz.

Teknolojinin ilerlemesine rağmen, OCR hala birkaç sorunla karşı karşıya. Örneğin elle yazılmış bir metni tanımak için dijital bir sistem elde etmek oldukça zordur. İşlem genellikle çeşitli metin birimlerini bölümlere ayırmak için güçlüklerle karşılaşır. Aynı şey kelimeler birbirine çok yakın göründüğünde de olur.

Diğer OCR hataları, kelimelerle arka plan arasında yeterli kontrast bulunmadığında ortaya çıkabilir. Siyah harflerle yazılmış bir metnin gri bir kağıda basıldığını varsayalım: OCR işleminin harfleri ve kelimeleri ayırt edememesi muhtemeldir.

Unutmayalım ki, görünüşte sokaklarda yürürken olduğu kadar basit bir eylem, engelleri önlemek ve bütünlüğümüzü korumak için bir dizi tamamlayıcı eylem gerektiriyorsa, basılı bir metnin okunması, eşzamanlı olarak yapılan keşif görevlerinin bir sonucudur. neredeyse bilinçsizce dışarı çıkar, ama bizi işe alırlar.

Bir metinle karşılaştığımızda, kendi OCR sistemimiz başlığı aramak, tanımak, paragrafları, noktalama işaretlerini, kelimeler ve kısaltmalar arasındaki boşlukları, diğer unsurların yanı sıra kaynakları anlamak için sorumludur. çok süslü veya düzensiz olup, mürekkep lekesi veya eksik bir kağıt parçası gibi herhangi bir aşınmaya maruz kalan bölgelerde bilgileri tamamlamak için.

Tavsiye