Design and Construction of a Large-set Off-line Handwritten Hangul Character Image Database KU-1

대용량 오프라인 한글 글씨 영상 데이터베이스 KU-1의 설계 및 구축

  • Kim, Dae-In (Dept. of Computer Science and Engineering, Korea University) ;
  • Kim, Sang-Yup (Dept. of Visual Information Processing, Korea University) ;
  • Lee, Seong-Whan (Dept. of Computer Science and Engineering, Korea University)
  • 김대인 (고려대학교 대학원 컴퓨터학과) ;
  • 김상엽 (고려대학교 대학원 영상정보처리학과) ;
  • 이성환 (고려대학교 대학원 컴퓨터학과)
  • Published : 1997.10.10

Abstract

최근 들어 인쇄체 문자 인식 기술의 발전에 힘입어 필기체 한글 인식에 관한 연구가 활발히 진행되고 있다. 인쇄체 문자와는 달리 자연스럽게 필기된 한글 글씨는 동일한 문자라 하더라도 같은 모양을 가지고 있다고 단정하는 것이 불가능할 정도로 필기자의 필기 유형에 따른 다양한 변형을 내포하고 있다. 따라서 효과적인 한글 글씨 인식기를 개발하기 위해서는 다양한 변형을 포함하는 대용량의 한글 글씨 영상 데이터베이스가 필수적이다. 본 논문에서는 시스템공학연구소 주관 국어 정보 베이스 개발 사업의 일환으로 고려대학교에서 구축 중인 오프라인 한글 글씨 영상 데이터베이스, KU-1에 대해 간략히 소개하고자 한다. 본 데이터베이스는 KS C 완성형 한글 사용 빈도순 상위 1,500자에 대하여 다양한 계층, 직업, 연령, 지역 분포를 고려한 1,000명 이상의 필기자가 정서체와 본인의 평소 자유 필체로 필기한 1,000벌의 명도 한글 글씨 영상으로 구성되어 있다.

Keywords