Query Context Information-Based Translation Models for Korean-Japanese Cross-Language Informal ion Retrieval

한-일 교차언어검색에서의 질의 문맥 정보를 이용한 대역어 변환 확률 모델

  • 이규찬 (포항공과대학교 지식 및 언어공학연구실) ;
  • 강인수 (포항공과대학교 지식 및 언어공학연구실) ;
  • 나승훈 (포항공과대학교 지식 및 언어공학연구실) ;
  • 이종혁 (포항공과대학교 지식 및 언어공학연구실)
  • Published : 2005.10.21

Abstract

교차언어 검색 과정에서는 질의나 문서의 언어를 일치시키기 위한 변환 과정이 필수적이며, 이런 변환 과정에서 어휘의 중의성으로 인해 하나의 어휘에 대응하는 다수의 대역어가 생성됨으로써 사용자의 정보 욕구를 왜곡시켜 검색의 성능을 저하시킬 수 있다. 본 논문에서는 어휘 중의성 문제를 해결하기 위해서 질의의 문맥 정보를 이용하여 변환 질의의 확률을 구함으로써 중의성을 해소하는 방식을 제시하고, 질의의 길이, 중의도, 중의성을 가진 어휘의 비율 등에 따라서 성능이 어떻게 변하는지 비교함으로써 이 방법의 장점과 단점을 분석한다. 또한 현재의 단점을 보완하기 위한 차후 연구 방향을 제시한다.

Keywords