정보 추출을 위한 이벤트 문장 추출

Event Sentence Extraction for Information Extraction

  • 김태현 (지식처리연구팀, 휴먼정보처리연구부, 한국전자통신연구원) ;
  • 임수종 (지식처리연구팀, 휴먼정보처리연구부, 한국전자통신연구원) ;
  • 윤보현 (지식처리연구팀, 휴먼정보처리연구부, 한국전자통신연구원) ;
  • 박상규 (지식처리연구팀, 휴먼정보처리연구부, 한국전자통신연구원)
  • Kim, Tae-Hyun (Knowledge Processing Research Team Human Information Processing Dept. Electronics and Telecommunications Research Institute) ;
  • Lim, Soo-Jong (Knowledge Processing Research Team Human Information Processing Dept. Electronics and Telecommunications Research Institute) ;
  • Yun, Bo-Hyun (Knowledge Processing Research Team Human Information Processing Dept. Electronics and Telecommunications Research Institute) ;
  • Park, Sang-Gyu (Knowledge Processing Research Team Human Information Processing Dept. Electronics and Telecommunications Research Institute)
  • 발행 : 2002.10.11

초록

정보추출 시스템의 목적은 관심의 대상이 되는 특정 정보를 선택적으로 찾아내 제시하는데 있다. 따라서 도메인 정보에 의존적인 방법으로 정보추출이 이루어질 수밖에 없고, 이에 따른 도메인 정보 구축의 부담이 컸다. 이러한 부담을 줄이기 위해 본 연구에서는 특정 주제영역과 관련한 문서로부터 자동으로 이벤트 문장을 추출하는 시스템을 제안한다. 이벤트 문장이란, 특정도메인에서 다루어지는 이벤트의 구체적인 내용을 포함하고 있는 문장이다. 이러한 문장을 추출함으로써 기본적인 수준의 정보추출 요구를 만족시킬 수 있을 뿐만 아니라, 주출된 이벤트 문장을 도메인 정보 구축에 활용할 수 있을 것이다. 본 연구에서는 동사, 명사, 명사구, 및 3W 자질을 이용하여 문장추출의 성능을 최대화하기 위한 방안을 제안하고, 세 개의 평가 도메인을 대상으로 실험을 수행하였다. 실험 결과, when 및 where 자질과 동사, 명사. 명사구의 가중치를 이용하여 문장 가중치를 계산함으로써 최적의 이벤트 문장추출 성능을 얻을 수 있음을 알 수 있었다.

키워드