En 2019, KBC Bank Bulgaria se enfrentó a un reto importante: digitalizar muchos documentos personales que se conservaban en papel. Era un proceso que requería mucho tiempo y mano de obra. El banco recurrió a DSS para que le ayudara a desarrollar una solución de recorte y OCR de tarjetas de identificación capaz de procesar estos documentos de forma rápida y precisa.
La solución se diseñó para aceptar la entrada de un archivo con tres objetos: el anverso y el reverso del documento de identidad y el texto con la firma. A continuación, procesaba el archivo de entrada, encontraba los tres objetos, los recortaba y los guardaba en tres archivos separados, y realizaba un OCR completo de las imágenes con un documento de identidad para extraer los datos personales de los documentos. La solución también podía evaluar la calidad de la imagen en términos de contraste y legibilidad y verificar la validez de los datos de salida.
DSS proporcionó la solución ID Card Cropping & OCR como una biblioteca escrita en Java utilizando la biblioteca digital C++, OpenCV y las bibliotecas Tesseract. La solución se diseñó para funcionar en modo offline (por lotes) o en tiempo real. Además, los agentes de atención al cliente pueden cargar y procesar fácilmente documentos específicos escaneados por los clientes.
El procesamiento electrónico del documento abarcaba los formatos rasterizados gráficos más utilizados, incluidos JPEG/JFIF, TIFF, GIF, BMP, PNG y PDF. Se consideraron aptas para el procesamiento todas las variaciones de colores, resoluciones y calidad. La solución era capaz de reconocer y procesar/analizar diversos tipos de documentos personales, incluidas las tarjetas de identificación búlgaras y europeas (anverso y reverso) y los pasaportes internacionales.
La solución proporcionaba varias operaciones funcionales de procesamiento electrónico, incluida la tecnología OCR para leer tarjetas de identificación/pasaportes escaneados, comprobar la validez de los documentos (fecha de caducidad) y comprobar si había cambios o inexactitudes. La solución también era capaz de identificar el tipo de documento, extraer todos los datos necesarios para su posterior procesamiento y realizar símbolos especializados legibles por máquina dentro del documento (si estaban disponibles).
Además, la solución podía reconocer el tipo de documento proporcionado como una entrada de imagen rasterizada y devolver el tipo de documento como respuesta. También era capaz de reconocer el anverso y el reverso de los documentos de identidad dentro de la entrada de imagen proporcionada y producir imágenes recortadas (una o dos) de los documentos procesados, junto con la información respectiva que indicaba el anverso/reverso.
La solución implementada también incluía una solución de aprendizaje automático que se entrenaba para mejorar la precisión del OCR mediante la detección y corrección de errores. Este algoritmo se diseñó para aprender de los datos que procesaba, lo que le permitía mejorar su precisión con el tiempo.
Por último, la solución reconocía la calidad de la imagen en varias categorías y proporcionaba una puntuación sobre la posibilidad de realizar el OCR (de 0 a 100). La arquitectura de la solución se diseñó para ser escalable y permitir una disponibilidad 24x7x365 con un tiempo de actividad del 99,7 %. El rendimiento medio diseñado era de un mínimo de 10 operaciones por segundo, con un rendimiento máximo de un mínimo de 20 operaciones por segundo.
En general, la solución de recorte y OCR de tarjetas de identificación desarrollada por DSS proporcionó con éxito a KBC Bank Bulgaria una forma fiable, precisa y eficiente de digitalizar documentos personales, lo que supuso un ahorro de horas de trabajo manual.
