A Predictive Answer Indexing Method Using Local and Global Information

지역, 전역 정보를 이용한 정답 후보 색인 방법

  • Kim, Hark-Soo (Natural Language Processing Lab., Dept. of Computer Science, Sogang University) ;
  • Kim, Kyung-Sun (Natural Language Processing Lab., Dept. of Computer Science, Sogang University) ;
  • Seo, Jung-Yun (Natural Language Processing Lab., Dept. of Computer Science, Sogang University)
  • 김학수 (서강대학교 컴퓨터학과 자연어처리연구실) ;
  • 김경선 (서강대학교 컴퓨터학과 자연어처리연구실) ;
  • 서정연 (서강대학교 컴퓨터학과 자연어처리연구실)
  • Published : 2002.10.11

Abstract

본 논문은 2-패스에 걸쳐 지역, 전역 정보를 추출하고 이 정보들을 이용하여 효과적으로 정답 후보들을 색인하는 방법을 제안한다. 제안한 정답 후보 색인 방법은 다음과 같다. 먼저, 대상 문서에 포함된 모든 정답 후보들을 추출한다. 그리고, 지역 정보(한 문서 내에서 정답 후보와 주변 내용어 사이의 관계)를 이용하여 각 내용어에 점수를 부여한다. 다음으로 전역 정보(모든 문서를 대상으로 하여 정답 후보와 공기 (co-occurrence)하는 내용어 사이의 관계)를 이용하여 각 내용어에 이미 할당되어 있는 점수를 변경한다. 마지막으로 데이터베이스에 각 정답 후보와 점수가 부여된 내용어들을 역파일 형태로 저장한다. 이러한 색인 방법은 빠른 응답 시간과 비교적 높은 정확률을 필요로 하는 실용적 질의 응답 시스템에 적합하다.

Keywords