베이지안 추론망 기반 색인어의 심층 분석 방법

Deep Analysis on Index Terms Using Baysian Inference Network

  • 송사광 (한국과학기술정보연구원, SW연구실) ;
  • 이승우 (한국과학기술정보연구원, SW연구실) ;
  • 정한민 (한국과학기술정보연구원, SW연구실)
  • Song, Sa-Kwang (Korea Institute of Science and Technology Information, Dept. of SW Research) ;
  • Lee, Seungwoo (Korea Institute of Science and Technology Information, Dept. of SW Research) ;
  • Jung, Hanmin (Korea Institute of Science and Technology Information, Dept. of SW Research)
  • 발행 : 2012.10.06

초록

대분분의 검색 엔진에서 색인어의 추출 및 가중치의 부여방법은 매우 중요한 연구주제로, 검색 엔진의 성능에 큰 영항을 미친다. 일반적으로, 불용어 리스트를 통해 성능에 긍정적인 영향을 미치지 않는 색인어를 제거하거나, 핵심어 또는 전문용어 등 상대적으로 중요한 색인어를 강조하는 방식을 사용하여 검색엔진의 성능을 향상시킨다. 하지만, 어절 분리, 형태소 분석, 불용어 처리 등 검색엔진의 단계열 처리 과정에서, 개별적인 색인어가 검색엔진에 미치는 영향을 분석하고 이를 반영한 검색 엔진 성능 향상 기법은 제시되지 않고 있다. 따라서 본 연구에서는 각 단계별 처리 과정에서 생성된 색인어가 미치는 영항을 계랑화하여 긍정적/부정적 색인어를 분류하는 방법론을 소개하고, 이를 기반으로 색인어 가중치를 조절함으로써 검색 엔진의 성능 또한 향상 가능한 방법을 소개한다.

키워드