연어 정보를 이용한 한국어 철자 검사기의 기능 개선

Improvement of a Korean Speller with Collocation of Parts of Speech

  • 심철민 (부산대학교 전자계산학과) ;
  • 김현진 (부산대학교 전자계산학과) ;
  • 김영진 (부산대학교 전자계산학과) ;
  • 권혁철 (부산대학교 전자계산학과)
  • Sim, Chul-Min (Department of Computer Science, Pusan National University) ;
  • Kim, Hyun-Jin (Department of Computer Science, Pusan National University) ;
  • Kim, Young-Jin (Department of Computer Science, Pusan National University) ;
  • Kwon, Hyuk-Chul (Department of Computer Science, Pusan National University)
  • 발행 : 1995.10.07

초록

본 논문에서는 한 어절 단위에서 다수 어절 단위로 그 고려 영역을 확장한 개선된 철자 검사기를 제시한다. 개선된 철자 검사기는 1) 한 어절 철자 검사 교정부, 2) 언어 규칙 처리부, 3) 문장 부호 규칙 처리부로 구성된다. 한 어절 철자 검사 교정부는 기존의 철자 검사기와 같은 기능을 수행한다. 연어 규칙처리부는 형태소간의 연어 관계를 이용하여 7가지로 유형 분류된 어절 간 오류를 처리한다. 문장 부호 처리부는 문장 부호 자체의 오류와 문장 부호를 참조하여 좌우 어절들의 오류를 검사한다. 현재 256가지의 연이 규칙과 51가지의 문장 부호 규칙이 구축되어 있다. 본 논문에서 제시한 개선된 철자 검사기는 한국어 문체 검사기(Korean Style Checker) 로서 의의를 가지며, 형태소의 연어 정보는 향후 파싱 등의 문장 분석이나 의미 분석에 중요한 자료로 이용될 수 있을 것으로 기대된다.

키워드