AI OCR 기술은 인쇄 품질, 폰트 전환 범위, 배경 질감, 언어, 손글씨체 등 고려해야 하는 개발 변수가 매우 많다. 특히 정확하고 빠르게 데이터를 처리하는 것은 정교한 알고리즘과 방대한 훈련 데이터 없이는 개발이 불가능 하다. 게다가 한국어는 영문보다 복잡하기 때문에 글로벌 OCR 솔루션의 한국어 처리 정확도는 영문 대비 평균 10% 낮아진다. 결국 한국어 데이터를 활용하기 위해서는 한국어에 특화된 AI OCR이 필요하다는 의미이다.
비큐AI는 기존에 세계 최고 수준의 해외 A사 OCR솔루션을 사용해 왔으나 5일 자체 기술 개발을 통해 확보된 AI OCR 솔루션 ‘Be Reader’로 전면 교체한다고 발표했다.
비큐AI 관계자는 “내부 성능 검증 결과, 기존에 사용 중이던 해외 A사 OCR보다 ‘Be Reader’의 인식률이 대폭 향상되었고, 이는 전체적인 데이터 정확성과 처리 속도 역시 향상되었다.”고 설명했다. 비큐AI는 앞으로 전개할 다양한 AI 사업에 ‘Be Reader’를 자사 제품과 서비스에 적극 적용할 예정이다.
비큐AI 관계자는 “’Be Reader’는 기존 외산 제품이 가지는 리스크 요인을 줄이고자 오픈소스를 기반으로 자체적으로 데이터 학습과 정확도 향상을 위한 기술 개발 노력 끝에 성능을 크게 향상시킨 것”이라면서, “다른 OCR 제품들과 비교하면 A1 대형 사이즈의 이미지에 대한 학습과 고도화를 통해 단으로 구분된 이미지 내 텍스트 순서를 정확하게 구분하고 인식하는 기능이 월등하여 비교 제품군의 평균 91.6% 수준의 인식률이 ‘Be Reader’의 경우 최대 96.7% 수준으로 내부 평가에서 확인했다”고 전했다.
또한, “’Be Reader’를 통해 국내외 논문, 잡지, 학술지 등 다양한 종류의 자료에서 고객인 원하는 형태의 데이터로 제공함에 있어 고객에게 최적의 서비스를 제공할 수 있다”면서 “‘Be Reader’를 통해 AI 데이터 확보 과정에서 소요되는 고객의 시간과 비용이 크게 절감되어 당사 AI 사업의 경쟁력이 한층 더 강화될 것”이라고 전했다.
글로벌에픽 증권팀 박진현 기자 epic@globalepic.co.kr