학습가능한 영어단어의 한글조사 생성방법

A Trainable Hangul Josa (particle) Generation Method for English Words

  • 이재성 (한국과학기술원 전산학과/인공지능연구센터) ;
  • 이운재 (한국과학기술원 전산학과/인공지능연구센터) ;
  • 최기선 (한국과학기술원 전산학과/인공지능연구센터)
  • Lee, Jae-Sung (Dept. of Computer Science/Centre of Artificial Intelligence Research, Korea Advanced Institute of Science and Technology) ;
  • Lee, Woon-Jae (Dept. of Computer Science/Centre of Artificial Intelligence Research, Korea Advanced Institute of Science and Technology) ;
  • Choi, Key-Sun (Dept. of Computer Science/Centre of Artificial Intelligence Research, Korea Advanced Institute of Science and Technology)
  • 발행 : 1998.10.09

초록

한국어에서 많이 사용되는 조사는 앞 명사의 종성에 따라 그 형태가 다르게 표기된다. 그런데 앞의 단어가 한글이 아닌 영어나 특수기호 등일 경우, 그 단어의 종성을 알아내는 일은 단순하지 않다. 본 논문에서는 영어가 명사로 쓰였을 경우, 그 단어 종성의 종류를 파악하여 적합한 형태의 조사를 자동으로 붙이는 방법을 제안하고, 실험한다. 제안된 방법은 기본적으로 결정트리(decision tree)와 같은 방법으로 영어 단어의 뒷글자부터 차례로 결정의 단서로 사용하였고, 분야에 맞도록 학습가능하다. 1,500단어로 학습한 후, 미학습 데이터에 대해 실험한 결과, 약 96%의 정확도를 보였고, 학습 데이터가 많아지면 정확도가 더 증가할 것으로 보인다.

키워드