English-to-Korean Transliteration using Multiple Unbounded Overlapping Phonemes

복수 음운 정보를 이용한 영.한 음차 표기

  • Kang, In-Ho (Dept. of Computer Science, Korea Advanced Institute of Science and Technology) ;
  • Kim, Gil-Chang (Dept. of Computer Science, Korea Advanced Institute of Science and Technology)
  • 강인호 (한국과학기술원 전산학과) ;
  • 김길창 (한국과학기술원 전산학과)
  • Published : 1999.10.08

Abstract

본 연구에서는 기존의 한정된 길이의 영어 또는 한글의 발음 단위를 이용하던 자동 음차 표기 방식과 달리, 학습 데이터에서 추출한 임의 길이의 음운 패턴을 사용하는 방법을 제안한다. 통계적 정보에 기반하여 추출한 음차 표기 패턴과 외래어 표기 규칙에 기반하여 기술한 음차 표기 패턴을 위치와 길이에 관계없이 사용하여 주어진 영어 단어의 한글 음차 표기를 얻어낸다. 제안하는 방법은 먼저 주어진 영어 단어의 가능한 모든 발음 단위를 기준으로 한글 표기 네트워크를 만든 후, 학습 데이터에서 추출한 음운 패턴을 교차 적용시켜 네트워크 각 노드의 가중치를 결정한다. 가중치가 결정된 네트워크에서 가중치의 합이 가장 좋은 경로를 찾아냄으로 해서 음차 표기를 수행한다. 본 연구에서 제안하는 방법으로 실험을 한 결과 자소 단위 86.5%, 단어 단위 55.3%의 정확률을 얻을 수 있었다.

Keywords