A Stochastic Text Structuring using Simulated Annealing

자연스러운 텍스트 생성을 위한 추계적 텍스트 구조화

  • Roh, Ji-Eun (Dep. Of Computer Science and Engineering, Div. of Electrical and Computer Engineering Pohang University of Science and Technology and Advanced Information Technology Research Center (AITrc)) ;
  • Lee, Jong-Hyeok (Dep. Of Computer Science and Engineering, Div. of Electrical and Computer Engineering Pohang University of Science and Technology and Advanced Information Technology Research Center (AITrc))
  • 노지은 (포항공과대학교 전자컴퓨터공학부 컴퓨터공학과, 첨단정보기술 연구센터) ;
  • 이종혁 (포항공과대학교 전자컴퓨터공학부 컴퓨터공학과, 첨단정보기술 연구센터)
  • Published : 2002.10.11

Abstract

언어가 아닌 다양한 지식원으로부터 그것을 설명하는 텍스트를 생성하는 텍스트 생성 (text generation)은 여러 가지 복합적이고 단계적인 과정을 거쳐 이루어진다. 자연스러운 텍스트를 생성하기 위한 여러 단계 중, 지식원으로부터 텍스트에 포함되기 위해 뽑힌 정보들간의 순서를 적절히 결정하는 과정을 텍스트 구조화(text structuring)라고 한다. 텍스트 구조화는 생성될 텍스트의 결속성(coherence)을 크게 좌우하므로, 양질의 텍스트를 생성하기 위해서는 텍스트 구조화를 다루기 위한 정교한 방법론이 요구된다. 본 논문에서는 SA(simulated annealing) 알고리즘을 이용해 추계적 텍스트 구조화 방안을 제안하며 특히, SA의 평가 함수(evaluation function)로서, 총 4가지의 방법론-중심화 이론(centering theory)을 이용한 센터 전이 유형의 선호도, 추론 비용에 근거한 전이 유형간의 선호도, 서두 문장을 결정하기 위한 가중치 할당에 따른 선호도, 인접한 문장간의 유사도에 따른 선호도-을 제안하고 실험을 통해, 그 효용성을 보였다.

Keywords