Learning Contextual Meaning Representations of Named Entities for Correcting Factual Inconsistent Summary

개체명 문맥의미표현 학습을 통한 기계 요약의 사실 불일치 교정

  • Park, Junmo (Kyungpook National University, School of Computer Science and Engineering) ;
  • Noh, Yunseok (Kyungpook National University, School of Computer Science and Engineering) ;
  • Park, Seyoung (Kyungpook National University, School of Computer Science and Engineering)
  • 박준모 (경북대학교 컴퓨터학부) ;
  • 노윤석 (경북대학교 컴퓨터학부) ;
  • 박세영 (경북대학교 컴퓨터학부)
  • Published : 2020.10.14

Abstract

사실 불일치 교정은 기계 요약 시스템이 요약한 결과를 실제 사실과 일치하도록 만드는 작업이다. 실제 요약 생성연구에서 가장 공통적인 문제점은 요약을 생성할 때 잘못된 사실을 생성하는 것이다. 이는 요약 모델이 실제 서비스로 상용화 하는데 큰 걸림돌이 되는 부분 중 하나이다. 본 논문에서는 원문으로부터 개체명을 가져와 사실과 일치하는 문장으로 고치는 방법을 제안한다. 이를 위해서 언어 모델이 개체명에 대한 문맥적 표현을 잘 생성할 수 있도록 학습시킨다. 그리고 학습된 모델을 이용하여 원문과 요약문에 등장한 개체명들의 문맥적 표현 비교를 통해 적절한 단어로 교체함으로써 요약문의 사실 불일치를 해소한다. 제안 모델을 평가하기 위해 추상 요약 데이터를 이용해 학습데이터를 만들어 학습하고, 실제 시나리오에서 적용가능성을 검증하기 위해 모델이 요약한 요약문을 이용해 실험을 수행했다. 실험 결과, 자동 평가와 사람 평가에서 제안 모델이 비교 모델보다 높은 성능을 보여주었다.

Keywords

Acknowledgement

이 논문은 2020년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행된 연구임(No.2016-0-00145, 어떤 주제에 대한 빅데이터를 스마트 보고서로 요약하는 기술 개발)