Answer Extraction based on Named Entity in Korean Question Answering System

한국어 질의응답시스템에서 개체인식에 기반한 대답 추출

  • 이경순 (전문용어언어공학연구센터, 첨단정보기술연구센터, 한국과학기술원) ;
  • 김재호 (전문용어언어공학연구센터, 첨단정보기술연구센터, 한국과학기술원) ;
  • 최기선 (전문용어언어공학연구센터, 첨단정보기술연구센터, 한국과학기술원)
  • Published : 2000.10.13

Abstract

본 논문에서는 한국어 질의응답시스템에서 개체인식에 기반하여 대답을 추출하는 방법을 제안한다. 질의에 대해 문서검색을 통해 검색된 상위 문서를 대상으로 하여 대답이 들어 있을 가능성이 높은 단락을 추출한다. 질의 유형 분석을 통해 대답 유형을 파악한다 단락에 나타나는 어휘들에 대해서 대답유형에 속하는지에 대한 개체인식을 통해서 대답을 추출한다. 질의응답 시스템의 평가를 위한 테스트컬렉션을 이용한 성능평가에서는 순위5까지의 대답추출에서 역순위 평균값이 개체추출에 대해서는 0.322, 50바이트 대답추출에서는 0.449, 250바이트 대답추출에서는 0.559이다. 상위 5이내에 정답을 포함할 비율은 개체추출에서는48.90%, 50바이트 대답추출에서는 62.20%, 250바이트 대답추출에서는 68.90%을 성능을 보였다.

Keywords