99% 정확도를 달성하는 자동화된 문자 판독

탁월한 판독 능력으로 머신 혜택 누리다

OCR(Optical Character Recognition) 및 OCV(Optical Character Verification) 기술을 이용하는 소매상 및 제조업체와 제약, 식품 및 음료 산업의 머신들은 재고 및 폐기물을 줄이고 생산성을 향상시키기 위해 원자재 수급에서 제품 선적에 이르는 공급망 전체를 실시간으로 모니터하고 있다.

예를 들면 전세계의 문서 취급 및 고부가가치 제조업체들은 시운전 및 선적 비용을 절감하면서도 생산량은 증대시키기 위해 자동화된 OCR/OCV 리더기를 사용하고 있다. 제약업계 또한 정부 규제를 준수할 수 있는 기술을 사용하면서도 OCR/OCV 시스템의 노동력 절감 및 처리량의 장점을 적극 활용하고 있다. 살모넬라균 및 건강을 위협할 수 있는 수많은 상황에 대처하기 위해 식품가공업계 또한 신속하게 제약업계를 뒤따르며, 오염된 식품으로부터 공중보건 위험을 최소화하고, 유닛-레벨 제품의 이력추적을 요구하고 있는 정부 규제에 대응하고 있다. 하지만 여느 기술과 마찬가지로 결과는 툴에 달려있다.

글꼴 관리가 가능한 OCR 및 OCV 툴인 OCRMax는 복잡한 이미지의 판독률, 속도, 사용 편의성 등에서 업계 기록을 수립했다. OCRMax를 이용해 업계 표준 레벨인 93~95%에서 99%이상까지 전반적인 판독률을 향상시킬 수 있다.

변화하는 제조 요건에 부합
OCRMax는 In-Sight 비전 시스템뿐만 아니라 VisionPro 비전 소프트웨어와 함께 동작하는 독창적인 툴이다. 코그넥스는 OCRMax를 설계한 다음, 다양한 산업용 애플리케이션에서 수만의 이미지를 테스트했다. 이 툴은 OCR 및 OCV 애플리케이션의 가장 까다로운 조건 하에서도 탁월한 판독률을 달성하며, 고객들이 해당 시스템의 속도 및 판독률 혹은 이 둘의 적정한 조합을 최적화할 수 있는 유연성을 제공한다. 코그넥스 개발자들은 하이-레벨 GUI(Graphic User Interface)의 프로그래밍을 간단하게 처리하는 것은 물론 OCR/OCV를 효과적으로 수행할 수 있도록 하기 위해 상당한 시간과 노력을 투자했으며, 전반적인 판독률을 향상시키기 위해 더 많은 사용자 설정기능을 추가했다. 이러한 유연성과 기능성, 단순성의 조합은 OCRMax에서만 가능하다.

마켓에 공급되고 있는 대부분의 OCR/OCV 툴은 무균 환경 하에서 선명한 화이트 배경에 인쇄된 블랙 OCR A 및 B 글꼴 판독에 있어서는 93% 혹은 그 이상의 판독률을 달성한다. 그러나 이러한 이상적인 조건은 대부분의 산업에서는 존재하지 않는다.

모든 생산 및 패키징 전반에 걸쳐 표준화된 솔루션을 요구하고 있는 정부 규제로 인해 OCR/OCV 애플리케이션에서 상당한 경험을 갖추고 있는 제약업계와 달리 대부분의 고객들은 표준화된 글꼴이나 소프트웨어, 하드웨어를 사용하고 있지 않다. 분류 및 추적 애플리케이션의 수가 증가함에 따라 코그넥스 엔지니어는 기존 OCR/OCV 툴을 다음과 같은 기능을 갖추도록 재설계할 필요가 있다고 판단했다.

• 어떠한 인쇄 글꼴이라도 관리 및 판독.
• 활자 및 배경 간의 명도가 낮은 경우에도 텍스트 판독.
• 폭 및 높이가 심하게 변형된 경우에도 텍스트 판독.
• 글자가 손상, 편향, 왜곡된 경우에도 텍스트 판독.
• 글자 O와 숫자 0처럼 비슷한 형태를 구분.

다른 OCR/OCV 툴에 비해 탁월한 성능을 갖춘 OCRMax는 여러 요소들에 기반하고 있는데, 가장 주목할 점은 이미지 사전 처리 및 분할, 분류, 이중-검증 프로세스, 필딩(Fielding), 그리고 글꼴 관리 기능의 뛰어난 접근방식이다. 이러한 기능을 모두 함께 조합하면, 밀리 초 단위의 고속 문자 판독 및 99.9%의 판독률, 혹은 이 가운데 어떠한 수준으로도 OCR/OCV를 최적화할 수 있다.

분할 : 99.9% 정확도 달성하는 첫 번째 단계
빌딩이 견고한 토대를 필요로 하는 것처럼, OCRMax의 향상된 성능은 사용이 간편한 프로그래밍 인터페이스와 함께 제공되는 강력한 이미지 프로세싱 알고리즘의 세밀한 조정에 기반하고 있다.

분할 프로세스는 먼저 각 라인을 쪼갠 다음에 각각의 문자 영역을 설정하고 자동으로 이를 분할한다. 그런 다음 각 문자에 대한 특정 구역을 얻기 위해 분할 파라미터를 조정한다. 각 문자는 다시 더 작은 조각으로 쪼개지고, Segmenter는 OCRMax 툴로 정의한 글꼴로 스큐 및 최소/최대 높이, 최소/최대 폭, 최소 화면비, 각도/스큐, 문자간 갭, 그리고 다른 특성들에 기반해 각 글자를 찾는다. 마지막으로 문자는 인식이 가능하도록 트레이닝 된다.

또한 판독률을 향상시키기 위해 OCRMax Segmentation 툴은 노이즈 필터와 획폭 필터, 조명 조건의 변화 보상, 자동 문자 스케일링을 제공한다.

빠르고 간단하며 유연한 글꼴 관리
OCRMax는 사용자가 모든 문자열을 한번에 트레이닝 할 수 있도록 한다. 또한 개별 문자를 제거하거나 트레이닝할 수 있으며, 동일한 문자를 여러 예제로 트레이닝하거나 해당 애플리케이션으로 트레이닝 된 폰트를 저장하거나 로딩할 수 있다.

필딩 : 최종 확인
필딩은 부가적인 프로그래밍 단계로, 특정 문자열을 검증하기 위해 OCV 툴처럼 OCRMax를 동작할 수 있도록 하거나 혼동을 줄이기 위해 문자열에 대한 추가 정보를 갖춘 OCRMax를 제공한다. 예를 들어, 특정 문자열은 문자나 숫자만으로 구성될 수 있거나, 특정 문자열 내의 왼쪽에서 5번째 문자 박스가 항상 문자나 숫자가 될 수 있다. 만약 OCRMax가 문자열을 판독하면, 확정 임계값 설정은 문자가 글자 B인지 숫자 8인지 다소 의혹이 남게 된다. 필딩 룰은 적정한 문자 값을 결정하는 또 다른 방법을 OCRMax에 제공하기 위해 사용자에 의해 프로그램 된다.

OCRMax에 있는 필딩 기능은 임의 문자기호를 만들 수 있고, 정의된 가변 길이의 문자열(예를 들어, 이러한 일련번호는 3개에서 5개의 문자 내에서 구성)뿐만 아니라 고정된 길이의 문자열로 동작한다.

수많은 OCR/OCV 툴이 필딩 기능을 갖추고 있지만, OCRMax는 고정 및 가변 길이의 문자 세트에서 모두 문자열을 필딩할 수 있는 유일한 툴이다. 예를 들어, 가변 길이의 문자열은 이 안에 내장된 연도정보를 가질 수 있지만, 위치는 제품 및 로트 번호에 따라 달라진다. 필딩 툴을 이용해 OCRMax는 문자열을 판독한 다음, 전체 길이와는 상관없이 해당 문자열 안의 예상 연도 코드를 찾는다. 만약 연도가 위치해 있지 않다면, OCRMax는 고객이 사전 설정한 필딩 룰에 따라 문자열을 ‘실패’로 처리하게 된다.

월간 FA저널 다른기사 보기