reconocimiento óptico de caracteres óptico de caracteres (OCR ) es un proceso en el que el texto impreso o escrito a mano se lee y se convierte en una forma reconocida por una computadora mecánica o electrónicamente . El proceso sofisticado considera que las formas de las letras y los compara con una biblioteca de formas similares . Cuando se produce una coincidencia , un personaje que representa el patrón se muestra en la pantalla, o se introduce en un fichero automatizado . OCR permite que un documento que va a escanear y leído por un ordenador , la creación de un archivo que puede ser editado o actuar en consecuencia de otras maneras.
OCR Software
Las aplicaciones informáticas se utiliza para la aplicación moderna de OCR. El software ha avanzado desde sus primeros días , en el que los programas tenían que ser calibrado para cada fuente única se esperaba a reconocer . Está disponible en forma independiente como un programa creado específicamente para la tarea , y como un componente en software de escaneo . La llegada de Internet y la computación en nube se ha llevado al desarrollo de programas de OCR basado en la Web , lo que elimina la necesidad de instalaciones de escritorio o servidor individuales.
El reconocimiento de procesos
OCR funciones del software mediante el reconocimiento por primera vez la distinción entre las áreas claras y oscuras de la imagen escaneada. Como se descubre una distinción de luz-oscuridad , el software busca patrones reconocibles , tales como líneas verticales y horizontales , así como las curvas conectadas o parcial . Si se puede reconocer un patrón como una letra u otro carácter , que busca en su base de datos para el carácter correspondiente en conjunto el lenguaje del ordenador. A continuación, pasa a este personaje en el documento o la pantalla se está reuniendo . Si el software es capaz de reconocer a un personaje , puede hacer su mejor respuesta o sustituir un carácter alternativo con el fin de mantener el proceso en marcha.
Posibles problemas con OCR Software
< p > Dado que el software de OCR se basa en el reconocimiento de patrones , cualquier artefacto en la página que podría potencialmente afectar a este proceso es una fuente de problemas . OCR funciona mejor cuando hay una distinción clara entre los personajes y el fondo del documento , a ser posible negro en blanco. Los fondos de color u ocupado que hacen los patrones menos distintivas pueden causar problemas. Manchas , arrugas y otros daños al documento pueden dar como resultado el reconocimiento de caracteres correctos también.