През 2019 г. KBC Банк България се изправя пред сериозно предизвикателство: дигитализацията на лични документи, съхранявани на хартия - процес, отнемащ много време и сериозно количество работна ръка. Банката се обръща към DSS за помощ при разработването на решение за изрязване на лични карти и OCR (оптично разпознаване на символи), способно да обработва тези документи бързо и точно.
Решението е проектирано така, че да приема файл с три обекта в него - предна и задна част на лична карта и текст с подпис. Входящото изображение се обработва като автоматично се откриват тези три обекта, изрязат се и се запазват в три отделни файла. Провежда се оптично разпознаване на символи (OCR) и се извличат личните данни от документите. Решението може също така да оценява качеството на изображенията по отношение на контраста и четливостта и да проверява данните за достоверност.
DSS предоставя решението за изрязване и обработка на лични карти и OCR като библиотека, написана на Java, използвайки C++, OpenCV и Tesseract. Решението е проектирано да работи в офлайн (партиден) режим или в реално време. Допълнително към това служителите, обслужващи клиенти, могат лесно да качват и обработват конкретни сканирани от клиента документи.
Електронната обработка на документа обхваща най-често използваните графични растерни формати като JPEG/JFIF, TIFF, GIF, BMP, PNG и PDF. Всички варианти на цветове, резолюции и качество са приложими за обработка. Решението е в състояние да разпознава и анализира различни видове лични документи, включително стандартни български и европейски лични карти (лицева и задна страна) и международни пътнически паспорти.
Решението осигурява няколко функционални операции за електронна обработка, включително OCR технология за “четене” от сканирани лични карти или паспорти, проверка на валидността на документа (срок на валидност) и проверка за промени или неточности. Решението може също да идентифицира вида на документа, да извлича всички необходими данни за по-нататъшна обработка и да разпознава специализирани символи в документа (ако има такива).
Освен това решението разпознава типа документ, предоставен като входен файл. Механизмът идентифицира предната и задната страна на личните карти и създава изрязано изображение (едно или две) на обработените документи, заедно със съответната информация, указваща предната или задната страна.
Внедреното решение включва и технология за машинно обучение (ML), която е тренирана да подобрява точността на OCR-а чрез откриване и коригиране на грешки. Този алгоритъм е проектиран да се учи от данните, които обработва, което му позволява да подобрява точността си с течение на времето.
Решението разпознава и качеството на изображението в няколко категории и дава оценка за възможността за извършване на OCR (от 0 до 100). Архитектурата на решението е проектирана така, че да бъде скалирана и да позволява наличност от 24x7x365 с 99,7% време за работа. Предвидената средна производителност е минимум 10 операции в секунда, а максималната производителност е минимум 20 операции в секунда.
В заключение, разработеното от DSS решение за изрязване и обработка на лични карти и OCR успешно предостави на KBC Банк България надежден, точен и ефективен начин за дигитализиране на лични документи, спестявайки часове ръчен труд.