FromTo/KE: A Korean-English Machine Translation

에서로/KE:한영 기계 번역 시스템

  • Yuh, Sang-Hwa (Machine Translation Lab., Dept. of Natural Language Information Processing, SERI) ;
  • Kim, Young-Kil (Machine Translation Lab., Dept. of Natural Language Information Processing, SERI) ;
  • Choi, Sung-Kwon (Machine Translation Lab., Dept. of Natural Language Information Processing, SERI) ;
  • Kim, Tae-Wan (Machine Translation Lab., Dept. of Natural Language Information Processing, SERI) ;
  • Park, Dong-In (Machine Translation Lab., Dept. of Natural Language Information Processing, SERI) ;
  • Seo, Jung-Yun (Dept. of Computer Science, Sogang University)
  • 여상화 (기계번역연구실/자연어정보처리연구부/시스템공학 연구소) ;
  • 김영길 (기계번역연구실/자연어정보처리연구부/시스템공학 연구소) ;
  • 최승권 (기계번역연구실/자연어정보처리연구부/시스템공학 연구소) ;
  • 김태완 (기계번역연구실/자연어정보처리연구부/시스템공학 연구소) ;
  • 박동인 (기계번역연구실/자연어정보처리연구부/시스템공학 연구소) ;
  • 서정연 (서강대학교 전자계산학과)
  • Published : 1997.10.10

Abstract

본 논문에서는 당 연구소 주관으로 연구개발정보센터(KORDIC), 서울대와 공동으로 개발중인 한영 기계번역 시스템, '에서로/KE'의 prototype system을 설명한다. 에서로/KE는 KORDIC에서 한국어 형태소 분석기와 Tagger를 개발하고, 서울대에서 한국어 구문해석기와 한영 변환기를 개발하고, SERI에서 영어 구문 생성기와 영어 형태소 생성기를 개발한다. 한국어 Tagger는 HMM에 기반하여 제작되었으며 sample 200문장에 대해 98.9%의 정확률을 보인다. 한국어 구문 해석기는 의존 문법에 기반하여 CYK 알고리즘을 사용하여 제작되었으며 중의성 해결을 위해 29개의 최적 parse 선택 규칙이 구현되어 있다. 한영 변환기는 collocation과 idiom에 기반하여 한영 변환을 수행한다. 영어 구문 생성기는 Tree 변환 언어인 GWL(Grammar Writing Language)를 사용하여 작성되었으며, 영어 형태소 생성기는 최종적으로 자연스러운 영어 표층문을 생성한다. 에서로/KE는 현재 1차년도 Prototype system이 Unix 환경에서 구현되어 있으며, 현재 각 모듈별 성능 개선과 대량 사전 구축을 통해 상용화될 예정이다.

Keywords