뉴스 기사의 문장 요약

Sentence Summarization of News Articles

  • 최동현 (한국과학기술원 전산학과 시멘틱웹첨단연구센터) ;
  • 신지애 (한국과학기술원 전산학과 시멘틱웹첨단연구센터) ;
  • 최기선 (한국과학기술원 전산학과 시멘틱웹첨단연구센터)
  • Choi, DongHyun (Computer Science Division SWRC, Korea Advanced Institute of Science and Technology) ;
  • Shin, Ji-Ae (Computer Science Division SWRC, Korea Advanced Institute of Science and Technology) ;
  • Choi, Key-Sun (Computer Science Division SWRC, Korea Advanced Institute of Science and Technology)
  • 발행 : 2007.10.12

초록

텔레비전 뉴스에서 부제목을 만들거나, 문장을 PDA나 휴대폰과 같은 작은 화면에 출력하고 싶은 경우, 가능한 방법은 두 가지가 있다. 첫번째는 사람에 의해 직접 만드는 방식이다. 두번째는 자동화된 문장 요약 시스템을 사용하는 방법이다. 따라서 문장 요약 알고리즘은 그 중요성이 계속해서 커지고 있다. 본 논문에서는 구문 트리의 서브 트리가 변화할 수 있는 규칙을 제시하는 방법에 (1)공기 정보와 (2) 문법적으로 올바른 구조를 유지하기 위해 핵심적인 부분(주요 문법 구조) 및 같이 요약되어야 할 절을 표시하는 휴리스틱, (3)주어진 문장이 포함된 글의 제목 정보를 추가로 사용하여 문장 요약을 실행하였다. 본 시스템의 결과와 기존의 요약 방식을 비교하는 실험을 분야 전공자들에 의한 주관적 평가로 수행한 결과, 본 시스템의 알고리즘이 기존에 사용되던 구문서브트리 변환 방법보다 중요한 부분 및 문법적으로 올바른 부분을 많이 유지하는 요약임을 확인하였다.

키워드