The Similar Character Classification in the Mixed Document

혼용문서에서의 유사문자 분류

  • 문경애 (한국과학기술연구원 시스템공학연구소) ;
  • 지수영 (한국과학기술연구원 시스템공학연구소) ;
  • 오원근 (한국과학기술연구원 시스템공학연구소)
  • Published : 1993.10.08

Abstract

본 논문에서는 혼용문서에서 문자들의 유사성으로 인해 발생하는 오인식문자를 줄이기위해 대분류 단계에서 유사문자군을 찾고 이들 사이의 유사도를 계산, 분류하는 유사문자분류 방법을 제안하였다. 이 방법은 유사문자군내의 각 문자마다 그 문자만이 갖는 고유한 요인과 그 문자를 제외한 나머지 문자일 가능성이 있는 요인을 찾아 입력문자와 비교하여 유사도가 가장 큰 문자를 인식문자로 선택하는 알고리즘이다. 또한, 인식 후 오인식된 문자들에 대해 특징사전의 갱신을 통하여 인식률을 향상시켰다.

Keywords