Post-Processing of Voice Recognition Using Phonologic Rules and Morphologic analysis

음절 복원 규칙과 형태소 분석을 이용한 음성인식 후처리

  • Seo, Sang-Hyun (Department of Computer Engineering, Kyungpook National University) ;
  • Kim, Jae-Hong (Department of Computer Engineering, Kyungpook National University) ;
  • Kim, Hae-Jin (Department of Korean Language and Literature, Kyungpook National University) ;
  • Kim, Mi-Jin (Department of Computer Engineering, Kyungpook National University) ;
  • Lee, Sang-Jo (Department of Computer Engineering, Kyungpook National University)
  • 서상현 (경북대학교 컴퓨터공학과) ;
  • 김재홍 (경북대학교 컴퓨터공학과) ;
  • 김해진 (경북대학교 국어국문학과) ;
  • 김미진 (경북대학교 컴퓨터공학과) ;
  • 이상조 (경북대학교 컴퓨터공학과)
  • Published : 1997.10.10

Abstract

컴퓨터의 사용이 보편화됨에 따라 컴퓨터와 사용자 사이의 쉽고 자연스러운 의사 소통을 위한 자연어 인터페이스에 대한 연구가 활발히 진행되고 있다. 이 중에서 특히, 음성인식 분야는 음성명령, 받아쓰기 시스템 등 일반적인 컴퓨터 사용자의 요구를 충족시켜 줄 수 있는 분야로 주목을 받고 있다. 그러나 음성인식은 인식 자체만으로는 인식률에 한계가 있으며, 인식 결과를 향상시키기 위해서는 후처리 단계가 필요하다. 본 논문에서는 음성 인식의 성능을 향상시키기 위해 음성 인식의 결과로 들어온 연속된 한국어 음성을 올바른 음절로 복원시켜 주는 시스템을 구현하였다. 이 시스템에서는 어절단위의 연속된 한국어 음성을 입력으로 받아 한국어 발음 규칙을 역으로 적용하여 원래의 음절로 복원시키고, 형태소 분석기를 이용하여 복원된 음절이 올바른지를 확인하고 수정한다. 초등학교 교과서에 나오는 문장을 대상으로 본 시스템의 성능을 실험한 결과, 90.42%의 복원율을 나타내었다. 현재 정확하게 복원이 되지 않는 것 중에는 동음이의어가 차지하는 비중이 크며, 이 문제는 구문분석이나 의미분석을 이용하여 어느 정도 개선할 수 있을 것으로 보인다.

Keywords