Word Segmentation for Korean with Syllable-Level Combinatory Categorial Grammar

음절단위 결합범주문법을 이용한 한국어 문장의 자동 띄어쓰기

  • 이호준 (한국과학기술원 전산학 및 첨단정보기술 연구센터) ;
  • 박종철 (한국과학기술원 전산학 및 첨단정보기술 연구센터)
  • Published : 2002.10.11

Abstract

한국어의 띄어쓰기 현상은 단어별로 정형화된 띄어쓰기를 하는 영어나 띄어쓰기가 발달하지 않은 중국어, 일본어와는 다르게 독특한 형태로 발전되어 왔다. 기존에는 부분적인 띄어쓰기 오류를 바로잡아주는 형태의 연구가 많이 진행되었지만 이제는 문자인식이나 음성인식 등의 연구와 결합하여 띄어쓰기가 완전히 무시된 문장의 띄어쓰기를 자동으로 처리하는 방법에 대한 연구가 활발히 진행 중이다. 본 논문에서는 한국어의 띄어쓰기 현상과 띄어쓰기 복원 방법에 대한 기존의 연구에 대해서 살펴보고 기존의 방법으로는 저리하기 힘들었던 형태를 음절단위 결합범주문법으로 설명한다.

Keywords