Term Weighting Method for Natural Language Query Sentence

자연언어 질의 문장의 용어 가중치 부여 기법

  • 강승식 (국민대학교 컴퓨터학부, 첨단정보기술연구센터) ;
  • 이하규 (성공회대학교 컴퓨터정보공학부) ;
  • 손소현 (한국전자통신연구원 지식정보센터) ;
  • 문병주 (한국전자통신연구원 지식정보센터) ;
  • 홍기채 (한국전자통신연구원 지식정보센터)
  • Published : 2002.10.11

Abstract

자연언어 질의 문장으로부터 검색어로 사용될 질의어의 추출 및 질의어 가중치를 계산하기 위하여 질의 문장들의 유형을 분석하였으며, 질의어 구문의 특성에 따라 용어들의 가중치를 계산하는 방법을 제안하였다. 용어의 가중치를 부여할 때 띄어쓴 복합명사와 접속 관계 등에 의해 연결된 명사구는 질의어 가중치를 동등하게 적용할 필요가 있다. 질의 문장에서 가중치가 동등하게 적용되는 명사구를 인식하기 위한 목적으로 구현된 명사구 chunking을 수행한 후에 각 용어들에 대한 질의어 가중치를 계산한다. 질의어 가중치를 계산하기 위하여 용어의 유형, 질의 구문의 특성, 문서 유형을 지칭하는 용어, 조사 유형, 용어의 길이 등에 따라 가중치를 조절하는 방법을 사용한다. 용어유형에 의한 가중치 계산은 추출된 용어의 품사 정보와 전문 용어 사전, 부사성 명사 사전을 이용하였다.

Keywords