A Preprocessor for Practical English-to-Korean Machine Translation

실용적인 영한 기계번역을 위한 전처리기의 설계 및 구현

  • Yuh, Sang-Hwa (Machine Translation Lab., Dept. of Natural Language Information Processing, SERI) ;
  • Jung, Han-Min (Machine Translation Lab., Dept. of Natural Language Information Processing, SERI) ;
  • Chae, Young-Soog (Machine Translation Lab., Dept. of Natural Language Information Processing, SERI) ;
  • Kim, Tae-Wan (Machine Translation Lab., Dept. of Natural Language Information Processing, SERI) ;
  • Park, Dong-In (Machine Translation Lab., Dept. of Natural Language Information Processing, SERI)
  • 여상화 (기계번역 연구실/자연어정보처리연구부/시스템공학연구소) ;
  • 정한민 (기계번역 연구실/자연어정보처리연구부/시스템공학연구소) ;
  • 채영숙 (기계번역 연구실/자연어정보처리연구부/시스템공학연구소) ;
  • 김태완 (기계번역 연구실/자연어정보처리연구부/시스템공학연구소) ;
  • 박동인 (기계번역 연구실/자연어정보처리연구부/시스템공학연구소)
  • Published : 1996.10.11

Abstract

본 논문에서는 실용적인 기계번역 시스템을 위하여 다양한 입력 형태에서 나타나는 여러 현상을 전처리하는 기법을 설명한다. 전처리기는 문장 분리, Title 및 나열문 인식, HTML Tag의 처리, 하이픈처리, 숫자 표현 처리, 대소문자의 정규화, 고유명사 인식, 복합단위 인식 등을 수행하여 형태소 분석기의 처리 부담을 줄인다.

Keywords